公众号后台回复关键词:pyspark,获取本项目github地址。
为强化SparkSQL编程基本功,现提供一些小练习题。
读者可以使用SparkSQL编程完成这些小练习题,并输出结果。...这些练习题基本可以在15行代码以内完成,如果遇到困难,建议回看上一节SparkSQL的介绍。
完成这些练习题后,可以查看本节后面的参考答案,和自己的实现方案进行对比。...from pyspark.sql import SparkSession
#SparkSQL的许多功能封装在SparkSession的方法接口中
spark = SparkSession.builder...",16,77),("DaChui",16,66),("Jim",18,77),("RuHua",18,50)]
n = 3
4,排序并返回序号
#任务:排序并返回序号, 大小相同的序号可以不同
data...#任务:按从小到大排序并返回序号, 大小相同的序号可以不同
data = [1,7,8,5,3,18,34,9,0,12,8]
from copy import deepcopy
from pyspark.sql