: 大数据处理过程中使用的计算方法 , 也都定义在了 RDD 对象中 ;
计算结果 : 使用 RDD 中的计算方法对 RDD 中的数据进行计算处理 , 获得的结果数据也是封装在 RDD 对象中的 ;
PySpark...可重复 , 有序元素 , 可读不可写 , 不可更改 ;
集合 set : 不可重复 , 无序元素 ;
字典 dict : 键值对集合 , 键 Key 不可重复 ;
字符串 str : 字符串 ;
2、...容器转 RDD 对象 ( 列表 / 元组 / 集合 / 字典 / 字符串 )
除了 列表 list 之外 , 还可以将其他容器数据类型 转换为 RDD 对象 , 如 : 元组 / 集合 / 字典 /...分区数量和元素: 12 , [1, 2, 3, 4, 5]
rdd3 分区数量和元素: 12 , [1, 2, 3, 4, 5]
字典 转换后的 RDD 数据打印出来只有 键 Key ,...没有值 ;
data4 = {"Tom": 18, "Jerry": 12}
# 输出结果
rdd4 分区数量和元素: 12 , ['Tom', 'Jerry']
字符串 转换后的 RDD 数据打印出来