Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【Hadoop 分布式部署 十 一: NameNode HA 自动故障转移】

【Hadoop 分布式部署 十 一: NameNode HA 自动故障转移】

作者头像
梅花
发布于 2020-09-28 02:22:14
发布于 2020-09-28 02:22:14
92100
代码可运行
举报
运行总次数:0
代码可运行

问题描述: 上一篇就是NameNode 的HA 部署完成,但是存在问题,问题是如果 主NameNode的节点宕机了,还是需要人工去使用命令来切换NameNode的Acitve 这样很不方便,所以

这篇学习笔记就是记录如何解决 故障转移的

   启动以后每个都是Standby,选举一个为Active

   监控 每个NameNode 都应该监控 (ZKFC Failover Controller 失败故障转移控制器)

开始进行配置

      在hdfs-site.xml 文件中配置 :

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
         <property>
	   <name>dfs.ha.automatic-failover.enabled</name>
	   <value>true</value>
	 </property>

      在core-site.xml 文件中配置 :

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<!--配置zookeeper 集群 -->
	 <property>
	   <name>ha.zookeeper.quorum</name>
	   <value>hadoop-senior.zuoyan.com:2181,hadoop-senior02.zuoyan.com:2181,hadoop-senior03.zuoyan.com:2181</value>
	 </property>

 启动:

    首先关闭所有HDFS服务: sbin/stop-dfs.sh (可以看到服务关闭的顺序 )

     然后将节点一(hadoop-senior.zuoyan.com )上 刚配置好的两个配置文件(core-site.xml 和 hdfs-site.xm ) 同步到其余两台机器上去

      使用命令:scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml hadoop-senior02.zuoyan.com:/opt/app/hadoop-2.5.0/etc/hadoop/

      使用命令:scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml hadoop-senior03.zuoyan.com:/opt/app/hadoop-2.5.0/etc/hadoop/

    接下来就是启动zookeeper ,进入到zookeeper的安装目录中,执行命令 bin/zkServer.sh start

    启动完成后要进行的操作:初始化HA在zookeeper 中 ( 第一个节点 ) 状态  bin/hdfs zkfc -formatZk

      首先在第二个节点的终端下链接上zookeeper的客户端

      然后在第一个节点上进行初始化

        然后在hadoop-senior02.zuoyan.com 主机上的zookeeper 的客户端进行查看 ls /

            ( 就会发现多了一个节点 )

          在查看hadoop-ha 这个就是 初始化时创建的那个文件目录

     启动HDFS :

          命令:sbin/start-dfs.sh

         查看启动的服务

        现在主节点 NameNode 和 Standby 的分布情况

         现在要结束掉Active的节点,检查他是否会自己进行故障转移

            jps 查看一下任务运行的 id号 然后使用命令 kill -9 9991

            然后去查看Hadoop-senior.zuoyan.com 是否成为了Active

 注意:zookeeper 挂了 不会对集群造成影响,就是不能进行故障自动转移,

 还有就是zookeeper 需要服务器的时间同步

这种HA的结构 是QJM

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-09-30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【Hadoop 分布式部署 十:配置HDFS 的HA、启动HA中的各个守护进程】
官方参考 配置 地址 :http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html
梅花
2020/09/28
1.2K0
【一】、搭建Hadoop环境----本地、伪分布式
    1.搭建Hadoop环境需要Java的开发环境,所以需要先在LInux上安装java
梅花
2020/09/28
6970
【一】、搭建Hadoop环境----本地、伪分布式
Hadoop HA及Failover搭建
在Hadoop1.X版本中使用单个NameNode来管理所有的DataNode的元数据,一旦NameNode节点发生故障将导致整个集群不可用,而且必须手动恢复NameNode节点才能够正常提供服务。基于以上致命的缺点,Hadoop2.X提出了HA(High Available)来改进单点故障;另外,通过使用Zookeeper的分布式通知协调功能实现HA的Failover(故障自动转移),而无需人工介入。下面开始介绍HA和Failover的安装配置。
z小赵
2018/09/05
7530
干碎大数据之亲传Hadoop-HA完全分布式平台搭建㊙
掌握了Hadoop完全分布式平台搭建后,就可以搭建一个高可用(HA)的Hadoop集群了。
阿年、嗯啊
2021/10/26
4090
Hadoop-HA高可用搭建
2、hosts文件要配置好,三台都可以相互通过主机名ping通,三台虚拟机都要配置!如下:
可爱见见
2019/09/09
4690
Hadoop-HA高可用搭建
【Hadoop 分布式部署 五:分布式部署之分发、基本测试及监控】
    到 /opt/app/hadoop-2.5.0 目录下  执行命令: bin/hdfs namenode -format
梅花
2020/09/28
3940
hadoop搭建完全分布式集群
后面的启动步骤可以用一步来代替,进入hadoop安装目录的sbin目录,执行:start-dfs.sh 。但建议还是按部就班来执行,比较可靠。
许喜朝
2020/10/27
5260
带你快速搭建Hadoop的HA集群!
相信在看了上一篇博客《带你快速认识NamenodeHA和Yarn HA,为搭建HadoopHA集群打下基础!》后,大家一定对于如何搭建HA集群非常期待٩(๑❛ᴗ❛๑)۶不要慌,本篇博客即将为大家带来搭建HA集群的详细教程!
大数据梦想家
2021/01/27
9300
带你快速搭建Hadoop的HA集群!
一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)
本文介绍了大数据技术生态从Hadoop到Spark的演进,重点介绍了Hadoop、Spark、Hive、HBase、Kafka等大数据组件的架构原理、应用场景、最佳实践,以及基于云原生技术的大数据解决方案。
别先生
2018/01/02
2K0
一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)
Hadoop集群配置
hadoop集群配置 1.多台机器ssh免密配置 修改用户名 # 1.更改hostname hostnamectl --static set-hostname <主机名> scp传输文件 scp <文件路径> <目标账号@地址>: 目标路径 scp /etc/hosts root@hadoop2: /etc/ ssh免密登录 # 配置公钥 ssh-keygen # 配置免密登录 ssh-copy-id <目标ip> 2. 多台主机时间核对 所有机器安装ntp yum -y
俺也想起舞
2019/07/24
1.5K0
大数据技术之_07_Hadoop学习_HDFS_HA(高可用)_HA概述+HDFS-HA工作机制+HDFS-HA集群配置+YARN-HA配置+HDFS Federation(联邦) 架构设计
1、修改ip 2、修改主机名及主机名和ip地址的映射 3、关闭防火墙 4、ssh免密登录 5、安装JDK,配置环境变量等
黑泽君
2019/02/25
2K0
Hadoop完全分布式搭建
一、介绍 Hadoop2.0中,2个NameNode的数据其实是实时共享的。新HDFS采用了一种共享机制,Quorum Journal Node(JournalNode)集群或者Nnetwor
用户1263954
2018/06/22
1.4K0
Apache Hadoop-2.x集群部署(持续更新完善)
摘 要 本文将介绍基于Hadoop2.x版本利用zookeeper搭建高可用集群环境。 前言 1.在hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步active namenode的状态,以便能够在它失败时快速进行切换。 hadoop2.0官方提供了两种HDFS HA的解决方案,一种是NFS,另一种是QJM。这里我们使用简单的QJM。在该方案中,主
天策
2018/06/22
7160
快速学习-HDFS HA高可用
1)所谓HA(High Available),即高可用(7*24小时不中断服务)。 2)实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制:HDFS的HA和YARN的HA。 3)Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)。 4)NameNode主要在以下两个方面影响HDFS集群 NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启 NameNode机器需要升级,包括软件、硬件升级,此时集群也将无法使用 HDFS HA功能通过配置Active/Standby两个NameNodes实现在集群中对NameNode的热备来解决上述问题。如果出现故障,如机器崩溃或机器需要升级维护,这时可通过此种方式将NameNode很快的切换到另外一台机器。
cwl_java
2020/02/21
8310
快速学习-HDFS HA高可用
【首页推荐】详解 Hadoop HA 完全分布式部署配置及运行调试
本期主要介绍 Hadoop HA 完全分布式模式的部署。HA 完全分布式模式(Highly Available Fully-Distributed Mode)是生产环境上最常见的 Hadoop 安装部署方式。HA 即高可用,是指当当前工作中的机器宕机后,会自动处理这个异常,并将工作无缝地转移到集群中的其他备用机器上去,以保证服务的高可用性。
数人之道
2022/01/07
3.1K1
【首页推荐】详解 Hadoop HA 完全分布式部署配置及运行调试
快速带你搭建Hadoop的HA集群!(确定不来看看吗?)
相信大家在看了前面一篇《Hadoop High Availability (高可用)详细讲解》之后,大家一定在想怎么搭建Hadoop HA的集群呢? 不要着急 ,小生接下来就带大家快速搭建一下(#.#)。
刘浩的BigDataPath
2021/04/13
5320
快速带你搭建Hadoop的HA集群!(确定不来看看吗?)
【九】Hadoop3.3.4HA高可用配置
在 Hadoop 生态系统中,NameNode 是文件系统的中心管理器,负责管理 HDFS 的元数据。为了避免单点故障(Single Point of Failure,SPOF),Hadoop 引入了 NameNode 的高可用性架构。主要组件包括:
火之高兴
2024/08/04
3820
Hadoop框架:HDFS高可用环境配置
在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题,如果单个节点出现故障,可通过该方式将NameNode快速切换到另外一个节点上。
知了一笑
2020/11/02
4950
Hadoop框架:HDFS高可用环境配置
Hadoop HDFS-高可用集群部署
前面介绍高可用集群部署的几个组件,本小节就以常见的3节点来搭建一个高可用的HDFS集群。基于下面的规划来实现(实际为了简单,这里的ZooKeeper使用的单节点)。由于进程比较多,所以我这里给了每台机器8G内存,实际4G应该也可以。
运维小路
2025/07/17
1520
Hadoop HDFS-高可用集群部署
Hadoop高可用(HA)集群搭建
HA:High Available,高可用 在Hadoop 2.0之前,在HDFS集群中NameNode存在单点故障 (SPOF:A Single Point of Failure) 对于只有一个NameNode的集群,如果NameNode机器出现故障(比如宕机或是软件、硬件升级),那么整个集群将无法使用,直到NameNode重新启动
CoderJed
2018/09/13
4.5K0
Hadoop高可用(HA)集群搭建
推荐阅读
相关推荐
【Hadoop 分布式部署 十:配置HDFS 的HA、启动HA中的各个守护进程】
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档