,
根据上述单词列表 , 生成一个 二元元组 列表 , 列表中每个元素的 键 Key 为单词 , 值 Value 为 数字 1 ,
对上述 二元元组 列表 进行 聚合操作 , 相同的 键 Key 对应的...']
然后 , 通过 flatMap 展平文件, 先按照 空格 切割每行数据为 字符串 列表 , 然后展平数据解除嵌套 ;
# 通过 flatMap 展平文件, 先按照 空格 切割每行数据为 字符串 列表..., 'Jerry', 'Tom', 'Jack', 'Jerry']
再后 , 将 rdd 数据 的 列表中的元素 转为二元元组 , 第一个元素设置为 单词 字符串 , 第二个元素设置为 1
# 将 rdd..., 先按照 空格 切割每行数据为 字符串 列表
# 然后展平数据解除嵌套
rdd2 = rdd.flatMap(lambda element: element.split(" "))
print("...查看文件内容展平效果 : ", rdd2.collect())
# 将 rdd 数据 的 列表中的元素 转为二元元组, 第二个元素设置为 1
rdd3 = rdd2.map(lambda element