分区 , 每个分区中的相同 键 key 对应的 值 value 被组成一个列表 ;
然后 , 对于 每个 键 key 对应的 值 value 列表 , 使用 reduceByKey 方法提供的 函数参数...func 进行 reduce 操作 , 将列表中的元素减少为一个 ;
最后 , 将减少后的 键值对 存储在新的 RDD 对象中 ;
3、RDD#reduceByKey 函数语法
RDD#reduceByKey...键 Key 下的多个 Value 值 进行相加操作 ,
# 应用 reduceByKey 操作,将同一个 Key 下的 Value 相加
rdd2 = rdd.reduceByKey(lambda a..."Tom", 18), ("Tom", 3), ("Jerry", 12), ("Jerry", 21)])
# 应用 reduceByKey 操作,将同一个 Key 下的 Value 相加
rdd2..., 应用 reduceByKey 操作 , 对相同 键 Key 对应的 值 Value 进行聚合操作 , 将同一个 Key 下的 Value 相加, 也就是统计 键 Key 的个数 ;
# 应用 reduceByKey