创建一个1-10数组的RDD,将所有元素2形成新的RDD
(1)创建
scala> var source = sc.parallelize(1 to 10)
source: org.apache.spark.rdd.RDD..., 2, 3, 4, 5, 6, 7, 8, 9, 10)
(3)将所有元素2
scala> val mapadd = source.map(_ * 2)
mapadd: org.apache.spark.rdd.RDD...2.mapPartition():每次处理一个分区的数据,这个分区的数据处理完后,原RDD中分区的数据才能 释放,可能导致OOM。...(1)创建
scala> val rdd = sc.parallelize(1 to 4)
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD...2.需求:创建一个RDD,对每个元素进行打印
(1)创建一个RDD
scala> var rdd = sc.makeRDD(1 to 5,2)
rdd: org.apache.spark.rdd.RDD