,取出的是一个个的List(如ListList("a b c", "a b b")和List("e f g", "a f g")等),所以操作的是RDD中的List,第二个flatMap取出的是scala...所以第一个flatMap会将任务分发到集群中不同的机器执行,而第二个flatMap会在集群中的某一台机器对某一个List进行计算。...如果不指定分区数量,则根据集群中的总核数(实际上是集群中的总线程数)生成相等数量的结果文件。
一般来说 有多少个输入切片,就会产生多少个分区。...)(math.max(_, _), _ + _)
maxSum: Int = 13
总共有两个分区:分区0为1,2,3,4 分区1为5,6,7,8,9 第一个分区最大值为4,第二个分区最大值为9,...Int = 19
总共有两个分区:分区0为1,2,3,4 分区1为5,6,7,8,9 第一个分区最大值为5(初始值),第二个分区最大值为9,全局聚合后的结果还需与初始值相加,结果为14+5=19