Spark计算求助:1,000 W客档数据,两两匹配,将一定程度上相同的客档合并为一个文件,如何计算?Spark计算求助:1,000 W客档数据,两两匹配,将一定程度上相同的客档合并为一个文件,如何计算?介绍:Spark计算求助:1000W客文件数据,两两匹配,将相同的客文件合并为一个文件。比如经过逻辑判断,数据A和数据C应该是一个人,所以合并成一个数据。也就是说,1000W数据中有同一个人。
转载请注明原文地址:https://juke.outofmemory.cn/read/1888639.html