一、安装 PySpark
1、使用 pip 安装 PySpark
执行 Windows + R , 运行 cmd 命令行提示符 ,
在命令行提示符终端中 , 执行
pip install pyspark...PySpark
也可以参考 【Python】pyecharts 模块 ② ( 命令行安装 pyecharts 模块 | PyCharm 安装 pyecharts 模块 ) 博客 , 在 PyCharm...中 , 安装 PySpark ;
尝试导入 pyspack 模块中的类 , 如果报错 , 使用报错修复选项 , PyCharm 会自动安装 PySpark ;
二、PySpark 数据处理步骤
PySpark...执行环境入口对象
如果想要使用 PySpark 进行数据处理 , 必须构建一个 PySpark 执行环境入口对象 ;
PySpark 执行环境 入口对象 是 SparkContext 类实例对象 ;...Spark 任务 , 各种配置可以在链式调用中设置 ;
调用 SparkConf#setMaster 函数 , 可以设置运行模式 , 单机模式 / 集群模式 ;
调用 SparkConf#setAppName