前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >基于Docker搭建大数据集群(四)Spark部署

基于Docker搭建大数据集群(四)Spark部署

作者头像
程序员朱永胜
发布2023-08-17 15:44:25
发布2023-08-17 15:44:25
5101
举报
文章被收录于专栏:朱永胜的私房菜
主要内容

  • spark部署
前提
  • zookeeper正常使用
  • JAVA_HOME环境变量
  • HADOOP_HOME环境变量
安装包

微云下载 | tar包目录下

  • Spark2.4.4

一、环境准备

上传到docker镜像

docker cp spark-2.4.4-bin-hadoop2.7.tar.gz cluster-master:/root/tar

解压

tar xivf spark-2.4.4-bin-hadoop2.7.tar.gz -C /opt/hadoop

二、配置文件

spark-env.sh

代码语言:javascript
复制
SPARK_LOCAL_DIRS=/opt/spark/spark-2.4.4-bin-hadoop2.7
HADOOP_CONF_DIR=/opt/hadoop/hadoop-2.7.7/etc/hadoop
YARN_CONF_DIR=/opt/hadoop/hadoop-2.7.7/etc/hadoop
JAVA_HOME=/opt/jdk/jdk1.8.0_221
export SPARK_MASTER_IP=cluster-master
export SPARK_DAEMON_JAVA_OPTS="
-Dspark.deploy.recoveryMode=ZOOKEEPER
-Dspark.deploy.zookeeper.url=172.15.0.2:2181
-Dspark.deploy.zookeeper.dir=/sparkmaster"

slaves

代码语言:javascript
复制
cluster-slave1
cluster-slave2
cluster-slave3

spark-default.conf

代码语言:javascript
复制
spark.eventLog.enabled          true
spark.eventLog.dir              hdfs://jinbill/spark/eventLog
spark.history.fs.logDirectory   hdfs://jinbill/spark/eventLog
spark.eventLog.compress         true

三、启动

start-all.sh

四、UI界面

因为网段不同,所以得加路由才能访问

  1. 打开cmd,需要管理员权限
  2. route add 172.15.0.0 mask 255.255.0.0 192.168.11.38 -p

Spark Master 访问地址Spark Slave1 访问地址Spark Slave2 访问地址Spark Slave3 访问地址Spark 历史任务 访问地址

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-09-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 主要内容
  • 前提
  • 安装包
  • 一、环境准备
    • 上传到docker镜像
      • 解压
      • 二、配置文件
        • spark-env.sh
          • slaves
            • spark-default.conf
            • 三、启动
            • 四、UI界面
              • 因为网段不同,所以得加路由才能访问
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档