(Seq("a1" -> 1, "b1" -> 3, "c1" -> 2), 3) r1.zip(r2).foreach(println)
输出如下: ((a,1),(a1,1)) ((b,2),(b1,3...++(y) }) .foreach(println)
输出如下,这里的操作是将两个 RDD 进行了聚合并且有排序,并且可以看到,他们的分区数都是3:
(a,1) (b,2) (a1,1...r1 = sc.parallelize(Seq("a" -> 1, "b" -> 3, "c" -> 4, "a" -> 5, "b" ->6), 3) r1.subtractByKey(r2).foreach...(println)
输出如下:
(c,4)
subtract
将左边的 RDD 减去 右边的 RDD
val r2 = sc.parallelize(Seq("a" -> 1, "b" -...(r2).foreach(println)
输出如下:
(c,4) (b,6) (a,5)