Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >hadoop-3.2.0------>入门十 完全分布式环境搭建

hadoop-3.2.0------>入门十 完全分布式环境搭建

作者头像
用户5899361
发布于 2020-12-07 07:28:31
发布于 2020-12-07 07:28:31
6663
举报
文章被收录于专栏:学习java的小白学习java的小白

一、将虚拟机全部设置为静态ip

详情查看:https://my.oschina.net/u/3535099/blog/3125614

二、将主机的host文件中添加所有子节点

命令:vi /etc/hosts

三、编写集群分发脚本scp

1、scp 安全拷贝

scp定义:scp可以实现服务器之间的的数据拷贝

语法:scp -r pdir/fname user@hadoophost:pdir/fname

scp:命令

-r:递归

pdir/fname:要拷贝的文件夹路径/名称

user@hadoophost:pdir/fname:目的用户@主机/目的文件夹路径/名称

例子:将hadoop上的java文件夹拷入hadoop01(相当于hadoop主动将文件推送到hadoop01上)

获取hadoop上的java文件夹并拷入hadoop02(相当于hadoop02从hadoop中拉取这个文件)

注意:hadoop的主机名称及ip需要在hadoop02的/etc/hosts文件中进行配置(如第二步配置)

图中的./代表拉取到当前目录中

四、编写集群分发脚本rsync

1、rsync远程同步工具

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号连接的优点。

2、rsync和scp的区别:用rsync做文件的复制要比scp速度快,rsync只做差异文件更新,scp是将所有文件复制过去

3、语法:rsync -rvl pdir/fname user@hadoophost:pdir/fname

rsync :命令

-rvl:选项参数

pdir/fname:要拷贝的文件夹路径/名称

user@hadoophost:pdir/fname:目的用户@主机/目的文件夹路径/名称

4、选项参数说明:

-r:递归

-v:显示复制过程

-l:拷贝符号连接

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
3 条评论
热度
最新
没用弄明白“四、编写集群分发脚本rsync”这一步有什么作用啊,看了后面第11章节,这步很重要,但是不知道怎么搞datanode和namenode同步啊,能给细说一下吗,谢谢。
没用弄明白“四、编写集群分发脚本rsync”这一步有什么作用啊,看了后面第11章节,这步很重要,但是不知道怎么搞datanode和namenode同步啊,能给细说一下吗,谢谢。
22点赞举报
就是同步里面的数据以及子节点。防止单应用挂掉后数据丢失
就是同步里面的数据以及子节点。防止单应用挂掉后数据丢失
回复回复点赞举报
第三步中同步了JAVA文件中的内容,第四步是否为同步hadoop文件中的内容?在后面的第11章之前我先将hadoop文件内容同步到datanode节点?麻烦兄弟给解答一下,谢谢!
第三步中同步了JAVA文件中的内容,第四步是否为同步hadoop文件中的内容?在后面的第11章之前我先将hadoop文件内容同步到datanode节点?麻烦兄弟给解答一下,谢谢!
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
hadoop完全分布式之rsync
rsync主要用于备份和镜像,具有速度快、避免复制相同内容和支持符号链接的优点。也就是说它只对差异文件进行更新,而scp是将整个文件都复制。
西西嘛呦
2020/08/26
4170
hadoop-3.2.0------>入门十一 完全分布式配置
由于ResourceManager和NameNode还有SecondaryNameNode比较消耗资源,顾三个配置分别配置到不同的主机上
用户5899361
2020/12/07
1.1K0
hadoop-3.2.0------>入门十一 完全分布式配置
通过思维导图,让女朋友搭建一个hadoop完全分布式
女朋友:你上次教我搭建伪分布式,我已经会搭建啦。只用了一台机器就搞定了呀,想学完全分布式的搭建。
用户7656790
2020/08/13
6500
通过思维导图,让女朋友搭建一个hadoop完全分布式
Hadoop完全分布式安装
完全分布式安装部署,其实步骤上来说与伪分布式没有太大的区别,主要增加2台虚拟机部署称为一个3台的集群
我脱下短袖
2019/12/21
5070
简单教你写xsync和xcall的脚本
xsync配置 xsync脚本基于rsync工具,rsync 远程同步工具,主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点,它只是拷贝文件不同的部分,因而减少了网络负担。
全栈程序员站长
2022/09/02
4810
hadoop-3.2.0------>入门十三 完全分布式群起集群
注意:3.0之后的版本是修改 workers,2.0的版本是修改salves
用户5899361
2020/12/07
6100
hadoop-3.2.0------>入门十三 完全分布式群起集群
hadoop完全分布式之集群分发脚本
首先在centos01中的xiximayou用户下的/home目录下新建一个bin文件夹,在bin文件夹中新建xsync.sh文件,在里面输入:
西西嘛呦
2020/08/26
4750
hadoop完全分布式之集群分发脚本
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
1)Hadoop 官方网站:http://hadoop.apache.org/ 2)Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 ➢ 本地模式:单机运行,只是用来演示一下官方案例。==生产环境不用。 == ➢ 伪分布式模式:也是单机运行,但是具备Hadoop集群的所有功能,一台服务器模 拟一个分布式的环境。==个别缺钱的公司用来测试,生产环境不用。 == ➢ 完全分布式模式:多台服务器组成分布式环境。==生产环境使用。 ==
老虎也淘气
2024/01/30
2980
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
Hadoop 中xsync集群分发脚本
rsync主要用于备份和镜像,具有速度快、避免复制相同内容和支持符号链接的优点,rsync只对差异文件做更新。但是scp是将所有内容都发送过去。
全栈程序员站长
2022/09/01
6310
做一个实用的集群文件分发脚本 xsync
在学大数据的时候,会自己搭建一个小型集群做测试使用,经常会在某台机器上配置好,然后依次分发到其他机器上。
kk大数据
2020/03/06
2K0
xsync 集群同步脚本「建议收藏」
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/137335.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/05
4380
xsync 集群同步脚本「建议收藏」
shell脚本——xsync
xsync脚本基于rsync工具,rsync 远程同步工具,主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点,它只是拷贝文件不同的部分,因而减少了网络负担。 rsync -rvl pdir/fname user@hadoophost:
全栈程序员站长
2022/09/02
3310
Hadoop完全分布式搭建
一、介绍 Hadoop2.0中,2个NameNode的数据其实是实时共享的。新HDFS采用了一种共享机制,Quorum Journal Node(JournalNode)集群或者Nnetwor
用户1263954
2018/06/22
1.4K0
Hadoop 入门教程(超详细)[通俗易懂]
在 Hadoop 1.x 时代,Hadoop 中的 MapReduce 同时处理业务逻辑运算和资源调度,耦合性较大。 在 Hadoop 2.x 时代,增加了 Yarn。Yarn 只负责资源的调度,MapReduce 只负责运算。
全栈程序员站长
2022/08/12
13K0
Hadoop 入门教程(超详细)[通俗易懂]
大数据实训之集群规划
vi /etc/sysconfig/network-scripts/ifcfg-ens33
张哥编程
2024/12/07
1570
大数据实训之集群规划
Hadoop入门(八)——本地运行模式+完全分布模式案例详解,实现WordCount和集群分发脚本xsync快速配置环境变量 (图文详解步骤2021)[通俗易懂]
这个系列文章传送门: Hadoop入门(一)——CentOS7下载+VM上安装(手动分区)图文步骤详解(2021) Hadoop入门(二)——VMware虚拟网络设置+Windows10的IP地址配置+CentOS静态IP设置(图文详解步骤2021) Hadoop入门(三)——XSHELL7远程访问工具+XFTP7文件传输(图文步骤详解2021) Hadoop入门(四)——模板虚拟机环境准备(图文步骤详解2021) Hadoop入门(五)——Hadoop集群搭建-克隆三台虚拟机(图文步骤详解2021) Hadoop入门(六)——JDK安装(图文步骤详解2021) Hadoop入门(七)——Hadoop安装(图文详解步骤2021) Hadoop入门(八)——本地运行模式+完全分布模式案例详解,实现WordCount和集群分发脚本xsync快速配置环境变量 (图文详解步骤2021) Hadoop入门(九)——SSH免密登录 配置 Hadoop入门(十)——集群配置(图文详解步骤2021) Hadoop入门(十一)——集群崩溃的处理方法(图文详解步骤2021) Hadoop入门(十二)——配置历史服务器及日志的聚集(图文详解步骤2021) Hadoop入门(十三)——集群常用知识(面试题)与技巧总结 Hadoop入门(十四)——集群时间同步(图文详解步骤2021) Hadoop入门(十五)——集群常见错误及解决方案
全栈程序员站长
2022/09/05
7120
Hadoop入门(八)——本地运行模式+完全分布模式案例详解,实现WordCount和集群分发脚本xsync快速配置环境变量 (图文详解步骤2021)[通俗易懂]
hadoop2.5.0完全分布式环境搭建(亲测有效)
      说在前头的一些东西,关于Linux本身环境本身的一些处理见如下链接,主要是讲Hadoop环境的前期准备:http://www.jianshu.com/p/d8720d0828dd
z小赵
2018/09/05
4950
大数据篇---hadoop学习一、搭建hadoop环境(centos7)二、hadoop知识点
大咖揭秘Java人都栽在了哪?点击免费领取《大厂面试清单》,攻克面试难关~>>>
用户2337871
2020/11/13
5390
大数据篇---hadoop学习一、搭建hadoop环境(centos7)二、hadoop知识点
Hadoop分布式部署
对于Hadoop Master(ResourceManager/NameNode)节点硬件配置要高一些
用户5252199
2022/04/18
5270
Hadoop分布式部署
进击消息中间件系列(二):Kafka 单机与集群部署实践
因为Kafka的运行依赖于 Zookeeper,因此,还需要下并安装Zookeeper,当然Kafka也内置了Zookeeper服务,因此,也可以不额外安装Zookeep,直接使用内置的Zookeeper服务。
民工哥
2023/08/22
6820
进击消息中间件系列(二):Kafka 单机与集群部署实践
推荐阅读
相关推荐
hadoop完全分布式之rsync
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档