比如下面的代码中,将intRDD中的每个元素加1之后返回,并转换为python数组输出:
print (intRDD.map(lambda x:x+1).collect())
结果为:
[4, 2, 3...,我们筛选键值小于5的数据:
print (kvRDD1.filter(lambda x:x[0] < 5).collect())
输出为:
[(3, 4), (3, 6), (1, 2)]
同样,将x...[0]替换为x[1]就是按照值进行筛选,我们筛选值小于5的数据:
print (kvRDD1.filter(lambda x:x[1] < 5).collect())
输出为:
[(3, 4), (1,...= StorageLevel(False, True, False, False)
StorageLevel.MEMORY_ONLY_2 = StorageLevel(False, True, False..._2 = StorageLevel(True, True, False, False, 2)
StorageLevel.OFF_HEAP = StorageLevel(True, True, True,