3)对父RDD的依赖列表,依赖还具体分为宽依赖和窄依赖,但并不是所有的RDD都有依赖。...RDD中每个元素, 将返回值构成新的RDD rdd.map(x=>x+1) {2,3,4,5}
flatMap() 将函数应用于RDD中的每个元素, 将返回的迭代器的所有内容构成新的RDD, 常用来切分单词..., 0.5) 非确定的
表2: 对数据分别为{1,2,3}和{2,3,4}RDD进行针对2个RDD的转化操作
函数名 目的 示例 结果
redcue() 并行整合RDD中的所有元素 rdd.reduce...((x, y) => x+y) 9
collect() 返回RDD中的所有元素 rdd.collect() {1,2,3,4}
count() 求RDD中的元素个数 rdd.count() 4
countByValue...() 返回RDD中的所有元素 rdd.collect() {1,2,3,4}
count() 求RDD中的元素个数 rdd.count() 4
countByValue() 各元素在RDD中出现的次数