前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Debian下安装配置 Hadoop 3.1.3 集群

Debian下安装配置 Hadoop 3.1.3 集群

作者头像
Debian中国
发布于 2020-01-21 09:09:24
发布于 2020-01-21 09:09:24
1.6K00
代码可运行
举报
文章被收录于专栏:Debian中国Debian中国
运行总次数:0
代码可运行

在这篇文章里,我将在 VMWare 里面虚拟四台 Debian 虚拟机,一个做master,三个slave。这四台主机的 hostname 分别是 master、slave1、slave2、slave3。下面的 JDK 和 Hadoop 安装配置操作都是使用普通用户 hadoop 来执行,并非 root。

集群环境准备

1. 静态网络的配置

编辑/etc/network/interfaces文件,注释自动获取IP,并添加下面内容

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# static IP address
auto ens33
iface ens33 inet static
address 192.168.20.101
netmask 255.255.255.0
gateway 192.168.20.2
dns-nameservers 192.168.20.2
dns-nameservers 114.114.114.114
2. 修改/etc/hosts文件,添加如下内容
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# Hadoop
192.168.20.101  master
192.168.20.102  slave1
192.168.20.103  slave2
192.168.20.104  slave3
3. openssh-server安装和vim的安装
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt-get install openssh-server vim
4. 生成ssh密钥
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 分别在不同的主机上执行`ssh-keygen`命令

# master
ssh-keygen -t rsa -C "master"

# slave1
ssh-keygen -t rsa -C "slave1"

# slave2
ssh-keygen -t rsa -C "slave2"

# slave3
ssh-keygen -t rsa -C "slave3"
5. 免密码登录

在每台主机上执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ssh-copy-id -i ~/.ssh/id_rsa.pub master
ssh-copy-id -i ~/.ssh/id_rsa.pub slave1
ssh-copy-id -i ~/.ssh/id_rsa.pub slave2
ssh-copy-id -i ~/.ssh/id_rsa.pub slave3
6. 创建用户和用户组

在每台主机上执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
useradd -m -s /bin/bash hadoop 

JDK 安装与配置

1. 手动安装JDK

解压jdk安装包到/usr/lib/jvm/。如果/usr/lib下没有jvm文件夹,则先创建jvm,执行sudo mkdir /usr/lib/jvm。然后创建jdk软链接:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo ln -sf /usr/lib/jvm/jdk1.8.0_202 /usr/lib/jvm/jdk
2. JDK环境变量的配置
  • 新建/etc/profile.d/jdk.sh文件,并添加以下内容,
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# JDK environment settings
export JAVA_HOME=/usr/lib/jvm/jdk
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATh=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
  • JAVA环境的验证
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ java -version
java version "1.8.0_202"
Java(TM) SE Runtime Environment (build 1.8.0_202-b08)
Java HotSpot(TM) 64-Bit Server VM (build 25.202-b08, mixed mode)

把 jdk 安装包和 jdk.sh 分别拷贝到集群中的每台主机上。

Hadoop 安装与配置

Hadoop 安装

1. 解压hadoop安装包到/opt,修改 hadoop-3.1.3 的拥有者:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo chown -R hadoop:hadoop /opt/hadoop-3.1.3

2. 创建hadoop软链接

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo ln -sf /opt/hadoop-3.1.3 /opt/hadoop

3. 在hadoop下创建logshdfs/name、hdfs/data 文件夹

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mkdir /opt/hadoop/logs
mkdir -p /opt/hadoop/hdfs/name
mkdir -p /opt/hadoop/hdfs/data

4. hadoop环境变量的配置

新建文件/etc/profile.d/hadoop.sh ,并添加以下内容:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# Hadoop environment settings
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

刷新profile变量

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 使profile生效
source /etc/profile 
Hadoop文件配置

配置文件都在etc/hadoop/文件夹下

1. hadoop-env.sh

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# jdk环境变量 (因为要远程调用 ${java_home}找不到变量)
export JAVA_HOME=/usr/lib/jvm/jdk

2. workers

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 添加所有slave机器的hostname
slave1
slave2
slave3

3. core-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>

  <!-- hdfs的位置 -->
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://master:9000</value>
  </property>

  <!-- hadoop运行时产生的缓冲文件存储位置 -->
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/hadoop/tmp</value>
  </property>

</configuration>

4. hdfs-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>

  <!-- hdfs 数据备份数量 -->
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>

  <!-- hdfs namenode上存储hdfs名字空间元数据 -->
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/hadoop/hdfs/name</value>
  </property>

  <!-- hdfs datanode上数据块的物理存储位置 -->
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/opt/hadoop/hdfs/data</value>
  </property>

</configuration>

5. mapred-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>

  <!--  mapreduce运行的平台 默认local本地模式 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

  <!--  mapreduce web UI address -->
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
  </property>

</configuration>

6. yarn-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>
  <!-- Site specific YARN configuration properties -->

  <!--  yarn 的 hostname -->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
  </property>

  <!--  yarn Web UI address -->
  <property>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>${yarn.resourcemanager.hostname}:8088</value>
  </property>

  <!--  reducer 获取数据的方式 -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>

</configuration>

/opt/hadoop-3.1.3hadoop.sh打包scp到每台电脑上,然后重复Hadoop安装步骤

Hadoop 的验证

  • 首先格式化 hdfs
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
hdfs namenode -format
  • 启动与关闭 jobhistoryserver
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mr-jobhistory-daemon.sh start historyserver
mr-jobhistory-daemon.sh stop historyserver
  • 启动与关闭 yarn
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
start-yarn.sh
stop-yarn.sh
  • 启动与关闭 hdfs
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
start-dfs.sh
stop-dfs.sh
  • 一键启动与关闭
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
start-all.sh
stop-all.sh
  • 验证
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ jps
13074 SecondaryNameNode
14485 Jps
10441 JobHistoryServer
12876 NameNode
13341 ResourceManager

访问Web UI

Daemon

Web Interface

Notes

NameNode

http://192.168.20.101:9870

Default HTTP port is 9870.

Resourcemanager

http://192.168.20.101:8088

Default HTTP port is 8088.

MapReduce JobHistory Server

http://192.168.20.101:19888

Default HTTP port is 19888.

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-11-27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
【微信投诉答疑】我的微信帐号被封了,咋办?
近期有不少用户在公众号询问微信投诉的相关事宜,本期,小助手为大伙儿讲解几个常见的疑惑。腾讯举报中心也欢迎广大用户在公众号留言,小助手会根据留言情况,在下期进行详细解答。
腾讯举报中心
2020/02/25
2.6K1
QQ举报第三季度打击公示
腾讯举报中心作为QQ举报的官方受理渠道,致力于与用户共同打造一个健康、绿色的网络环境,日常除了提供QQ、微信和腾讯社交平台上各类违法违规行为的举报入口和举报受理外,还成立一系列违法犯罪举报专项,协助警方完成案件侦破和落地打击。
腾讯举报中心
2020/02/25
1K0
【QQ举报答疑第二期】进阶吧,举报!
自从小助手推出举报答疑以来,粉丝们十分热情,各类问题纷涌而来。本期,小助手选取了部分用户的问题进行答疑,希望大家对在举报的道路上继续进阶!共同守护好网络世界的晴朗天空。
腾讯举报中心
2020/02/25
8190
了解血腥暴恐有害信息
1、传播煽动宗教极端思想、主张以暴力手段危害他人生命和公私财产安全、破坏法律实施等内容的音视频。
腾讯举报中心
2020/02/25
2K0
朝阳群众,你关注的问题,答案都在这里!
近期,后台很多粉丝留言想要咨询举报相关的问题,为此小助手特意整理了一份官方版举报攻略,希望大家大伙儿和小助手共同携手打造一个干净的网络世界。
腾讯举报中心
2020/02/25
1.1K0
了解色情低俗有害信息
2、发送以色情为目的的情色文字、情色视频、情色图片、情色漫画等内容,但不限于上述形式;
腾讯举报中心
2020/02/25
2.4K0
他一开口,我就嗅出了骗子的味道!
事情的经过是这样的:暑假到了,王女士鼓励孩子响应学校号召,通过参加暑期社会实践理解父母工作的艰辛。考虑到不想让孩子做太辛苦的体力活,她便鼓励孩子在网络上找找轻松的兼职,结果孩子上周不幸被骗了298元。
腾讯举报中心
2020/02/25
1.2K0
了解违法暴力有害信息
老何不小心把刚从银行取的10000元钱弄丢了,担心妻子责骂,他就想通过网络买一些假币蒙混过关。老何在网络上看到一则宣传,便加了对方的QQ,老何表示了自己的担忧,但对方却发来各类图片和视频证据,从肉眼来看几乎可以以假乱真。老何动心了,付款1000元,约定好发货。左等右等,最后等来一堆白纸,最终老何选择了报警,老何也认识到自己的错误。
腾讯举报中心
2020/02/25
6250
了解政治敏感有害信息
若在QQ上发现政治敏感有害信息,请在客户端直接进行举报。一经发现,腾讯将根据情节进行删除违规信息、警告、限制或禁止使用部分或全部功能直至永久封号的处罚,并有权公告处理结果。
腾讯举报中心
2020/02/25
4.8K1
了解贩卖野生物及制品有害信息
1、禁止非法猎捕、杀害国家重点保护的珍贵、濒危野生动物的,或者非法收购、运输、出售国家重点保护的珍贵、濒危野生动物及其制品。
腾讯举报中心
2020/02/25
4060
听说你的微信被恶意举报了?
一哥在前面也说过了,每一次投诉都会经过系统和人工的严格审核。而在系统和人工的审核标准中都没有“举报次数”这样的评判依据。因此不用担心被人恶意举报的问题。
腾讯举报中心
2020/02/25
9.9K1
QQ冒充好友的都是什么鬼?
仿冒好友:指犯罪分子通过仿冒好友QQ信息,设置骗局,以诈骗为目的,对受害人实施远程、非接触式诈骗,诱使受害人给犯罪分子打款或转账的犯罪行为。
腾讯举报中心
2020/02/25
1.4K0
如何防止网络诈骗
网络诈骗是指犯罪分子通过编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人给犯罪分子打款或转账的犯罪行为。
腾讯举报中心
2020/02/25
1.4K0
了解自杀自残有害信息
自杀自残举报标签是指不法分子利用QQ平台,传播消极的思想内容,教唆他人自杀、自残的言行。对于情绪的消沉、悲观厌世、有自杀企图的部分抑郁症患者,有的甚至延展到线下实施,严重危害到他人的生命安全。
腾讯举报中心
2020/02/25
8660
了解侵犯公民个人信息
侵犯公民个人信息是指以窃取或者其他方法非法获取国家机关或者金融、电信、交通、教育、医疗等单位在履行职责或者提供服务过程中获得的公民个人信息,出售或者非法提供给他人,情节严重的行为。根据刑法规定,犯本罪的,处三年以下有期徒刑或者拘役,并处或者单处罚金。
腾讯举报中心
2020/02/25
6660
教你识别金融红包类欺诈
金融欺诈:是指骗子通过虚假办理信贷类金融产品或以高额回报理财产品为诱饵,骗取用户钱财的欺诈行为。
腾讯举报中心
2020/02/25
8570
关于打击QQ平台野生动物交易行为的公告
1月26日,中国疾控中心在武汉华南海鲜市场检测出大量新型冠状病毒,检测报告显示该病毒来源于市场所销售的野生动物。此前,钟南山院士公开指出:新型冠状病毒较大可能是通过野生动物传到人的。李克强总理在部署疫情防控工作时,也曾强调要“把好野生动物管控关口,坚决遏制疫情蔓延。”
腾讯举报中心
2020/02/25
6590
想在绝地求生优雅吃鸡?先问问骗子同不同意...
要说时下最火爆的竞技游戏,一定非“绝地求生”莫属了。借着“游戏直播”的春风,全国“吃鸡”游戏风靡,玩家们不是在“吃鸡”,就是在“吃鸡”的路上。
腾讯举报中心
2020/02/25
9780
听说你的QQ被“恶意举报”了?
有网友通过公众号发来求助,说自己遇到了奇葩事,有陌生人加他好友,还威胁他不给钱就举报!然而,再深的套路也逃不过小助手的火眼金睛,经鉴定,这位网友,你是被坏人“恶意举报”了。
腾讯举报中心
2020/02/25
6K2
腾讯举报零容忍丨“侵犯未成年人权益”专属标签上线!
近日,全国“扫黄打非”办公室公布多起涉儿童色情信息典型案件,这些案件,无不牵动着社会大众的神经。网络黑产人员将侵犯未成年人的照片、视频上传网络甚至是进行贩卖。这不仅给未成年人身心健康带来极大创伤,更不利于网络环境的健康发展。
腾讯举报中心
2020/02/25
1.2K0
相关推荐
【微信投诉答疑】我的微信帐号被封了,咋办?
更多 >
LV.0
这个人很懒,什么都没有留下~
目录
  • 集群环境准备
    • 1. 静态网络的配置
    • 2. 修改/etc/hosts文件,添加如下内容
    • 3. openssh-server安装和vim的安装
    • 4. 生成ssh密钥
    • 5. 免密码登录
    • 6. 创建用户和用户组
  • JDK 安装与配置
    • 1. 手动安装JDK
    • 2. JDK环境变量的配置
  • Hadoop 安装与配置
    • Hadoop 安装
    • Hadoop文件配置
  • Hadoop 的验证
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档