键值对概述
“键值对”是一种比较常见的RDD元素类型,分组和聚合操作中经常会用到。
Spark操作中经常会用到“键值对RDD”(Pair RDD),用于完成聚合计算。...普通RDD里面存储的数据类型是Int、String等,而“键值对RDD”里面存储的数据类型是“键值对”。...] = List(Hadoop, Spark, Hive, Scala)
scala> val rdd = sc.parallelize(list)
rdd: org.apache.spark.rdd.RDD...,从执行结果反馈信息,可以看出,rdd类型是RDD[(String, Int)]。...scala> val rdd = sc.parallelize(Array(("spark",2),("hadoop",5),("spark",4),("hadoop",7)))
rdd: org.apache.spark.rdd.RDD