前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Ambari EDP 大数据集群部署手册

Ambari EDP 大数据集群部署手册

原创
作者头像
create17
发布于 2025-03-23 08:18:01
发布于 2025-03-23 08:18:01
12100
代码可运行
举报
运行总次数:0
代码可运行

版本说明: Ambari:3.0.0 EDP:3.3.0 虚拟机版本:CentOS-8.5.2111-x86_64-dvd1.iso

更新日志列表:

日期

更新章节

更新日志

2025.01.05

新增第六章节

新增第六章节,修改CentOS 8 yum源,新增阿里云yum源。方便一些包能正常被yum安装

2025.01.03

11.2

补充使用ssh私钥来注册主机的步骤

2024.12.16

所有

编写EDP部署文档初稿

安装包下载地址:

链接:https://pan.baidu.com/s/1M5SAVrL1DIy-dprE0g4OGA?pwd=b8hu

提取码:b8hu

目录介绍:

  • 在 httpd 服务安装好后,将 edp 和 ambari 目录,直接放到 /var/www/html 目录下即可。
  • 三个jdk文件,每个节点都需要拷贝并解压。
  • mysql-connector-java-8.0.23.jar:mysql jdbc jar包。
一、配置说明
1. 硬件环境

节点类型

操作系统

ip 地址

主机名

说明

主节点

centos 8

192.168.159.130

node1.ambari.com

内存:8G+

从节点

centos 8

192.168.159.131

node2.ambari.com

内存:8G+

2. 软件环境

软件名称

版本号

JDK

jdk1.8.0_151 && jdk17.0.12

MySQL

8.0

Ambari

3.0

EDP

3.3.0

二、修改主机名和hosts文件(各节点都需要执行)
1. 修改主机名(各节点分别修改主机名)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 使用hostnamectl命令修改主机名,执行该命令后立即生效,只不过需要重启Xshell连接
# 以其中一台为例,代码如下
hostnamectl set-hostname node1.ambari.com
# 其余的机器也使用hostnamectl命令修改主机名
...()
2. 修改hosts文件(各节点的hosts文件均修改为下图所示)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 添加机器ip与主机名映射
vim /etc/hosts
192.168.159.130 node1.ambari.com
192.168.159.131 node2.ambari.com
三、关闭防火墙和selinux(各节点都需要执行)
1. 防火墙设置
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 查看防火墙状态
systemctl status firewalld
# 查看开机是否启动防火墙服务
systemctl is-enabled firewalld
# 关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
# 再次查看防火墙状态和开机防火墙是否启动
systemctl status firewalld
systemctl is-enabled firewalld
2. 禁用selinux
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 永久性关闭selinux(重启服务器生效)
sed -i 's/SELINUX=enforcing/SELINUX =disabled/' /etc/selinux/config
# 临时关闭selinux(立即生效,重启服务器失效)
setenforce 0
# 查看selinux状态
getenforce
# disabled为永久关闭,permissive为临时关闭,enforcing为开启
四、免密登陆

各个主机均执行以下操作

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## 生成密钥对
ssh-keygen -t rsa   ## 一路回车即可
## 进入.ssh目录,如果目录不存在则创建
cd ~/.ssh
## 将公钥导入至authorized_keys
cat id_rsa.pub >> authorized_keys
## 修改文件权限
chmod 700 ~/.ssh
chmod 600 authorized_keys
# 首次ssh时,设置不提示是否保存秘钥
ssh-keyscan ${替换为当前主机名} >> ~/.ssh/known_hosts

在节点 node1.ambari.com (在要安装 ambari-server 的节点)上执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## 配置主从互相免密登陆
[root@node1 ~]# cat ~/.ssh/id_rsa.pub | ssh root@node2.ambari.com 'cat - >> ~/.ssh/authorized_keys'
[root@node1 ~]# cat ~/.ssh/id_rsa.pub | ssh root@node3.ambari.com 'cat - >> ~/.ssh/authorized_keys'
[root@node1 ~]# ssh node2.ambari.com # 验证主机点是否可以免密登陆从节点,执行exit命令退出即可。
[root@node1 ~]# ssh node3.ambari.com # 验证主机点是否可以免密登陆从节点,执行exit命令退出即可。

备注:要想实现多主机互相免密,可参考文章:Linux多台主机互相免密

五、安装JDK(各节点都需要执行)
1. 安装jdk1.8
1.1. 方式一:使用yum 安装
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y java-1.8.0-openjdk-devel

安装后的jdk的位置在 /usr/lib/jvm/java-1.8.0-openjdk。

1.2. 方式二:离线安装,适合内网没有yum源的情况
  • 拷贝文件
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 创建目录
mkdir /usr/java
# 将从网盘里下载jdk-8u151-linux-x64.tar.gz拷贝到/usr/java目录下,然后解压文件
tar zxvf jdk-8u151-linux-x64.tar.gz
  • 配置jdk环境变量:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 编辑/etc/profile,文末插入以下内容:
# set java
export JAVA_HOME=/usr/java/jdk1.8.0_151
export PATH=$JAVA_HOME/bin:$PATH
  • 使环境变量生效:source /etc/profile
  • 安装验证:java -version
2. 安装jdk17
2.1. 方式一:yum 在线安装
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y java-17-openjdk-devel
2.2. 方式二:使用安装包离线安装

把 OpenJDK17U-jdk_x64_linux_hotspot_17.0.12_7.tar.gz 复制到/usr/java 目录下后解压即可,不需要配置环境变量。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /usr/java
# 解压
tar zxvf OpenJDK17U-jdk_x64_linux_hotspot_17.0.12_7.tar.gz
3. 安装jdk22(选做,给trino使用)

把 OpenJDK22U-jdk_x64_linux_hotspot_22.0.2_9.tar.gz 复制到/usr/java 目录下后解压即可,不需要配置环境变量。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /usr/java
# 解压
tar zxvf OpenJDK22U-jdk_x64_linux_hotspot_22.0.2_9.tar.gz
六、修改CentOS 8 yum源
1. 修改 CentOS 8 yum 源

由于 CentOS Linux 8 已停止更新和维护,所以在使用 yum 源时会链接报错,解决办法如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /etc/yum.repos.d/
sed -i 's/mirrorlist/#mirrorlist/g' /etc/yum.repos.d/CentOS-*
sed -i 's|#baseurl=http://mirror.centos.org|baseurl=http://vault.centos.org|g' /etc/yum.repos.d/CentOS-*
# 清空原有缓存,并重新生成
yum clean all && yum makecache

成功解决。

2. 添加阿里云yum源

EDP 安装服务时,有时会通过 yum 安装依赖包,比如 snappy-devel,默认 CentOS 8 是没有这个包的,可以添加阿里云 yum 源来安装此依赖。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /etc/yum.repos.d/
vim aliyun-CentOS-BaseOS.repo

在 添加以下内容:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[aliyun-baseos]
name=CentOS Linux $releasever - BaseOS - mirrors.aliyun.com
baseurl=https://mirrors.aliyun.com/centos/$releasever/BaseOS/$basearch/os/
gpgcheck=1
enabled=1
countme=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-centosofficial

[aliyun-powertools]
name=CentOS Linux $releasever - PowerTools - mirrors.aliyun.com
baseurl=https://mirrors.aliyun.com/centos/$releasever/PowerTools/$basearch/os/
gpgcheck=1
enabled=1
countme=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-centosofficial

清空yum原有缓存,并重新生成。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum clean all && yum makecache

阿里云yum源地址可参考:https://mirrors.aliyun.com/centos/8.5.2111/

七、安装mysql(任意一个节点)

mysql版本为8.0,本次部署在node1.ambari.com节点:

1. 检查本地资源库中是否有mysql的rpm包
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rpm -qa | grep mysql
# 删除相关rpm包
rpm -ev <rpm包名> --nodeps
2. 搭建mysql8.0的yum源
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 下载mysql8.0的rpm包,安装成功后/etc/yum.repos.d/目录下会增加两个文件
yum -y install https://dev.mysql.com/get/mysql80-community-release-el8-1.noarch.rpm
# 查看mysql8的安装源是否可用,如不可用请自行修改配置文件(/etc/yum.repos.d/mysql-community.repo)使mysql80下面的enable=1
# 若有mysql其它版本的安装源可用,也请自行修改配置文件使其enable=0
yum repolist enabled | grep mysql
3. 安装mysql 8.0
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum -y install mysql-server
# 启动mysql
systemctl start mysqld.service 
# 查看mysql状态
systemctl status mysqld.service
# 设置mysql开机自启动
systemctl enable mysqld.service
4. 设置mysql用户root密码

使用root用户登录,第一次登录不用输入密码,直接回车即可,如下图所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mysql -uroot -p

修改 root 密码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ALTER USER 'root'@'localhost' IDENTIFIED BY 'root123';
八、设置时钟同步(各节点都需要执行)

请参考我写的另一篇文章:《Linux NTP时钟同步

如有别的方法也可以,保证各节点时钟同步即可。

九、搭建yum本地源

(任意一个节点,本篇文章放在了第一个节点上了,也就是ambari-server节点:node1.ambari.com)

1. 安装httpd和wget服务
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装httpd
yum -y install httpd.x86_64
systemctl enable httpd.service
systemctl start httpd.service
# 安装wget
yum -y install wget

httpd 服务安装后,默认会启动80端口,且会创建 /var/www/html 目录。我们就可以通过 http 链接的方式访问某些安装包,前提是将安装包放在 /var/www/html 目录下。

2. 下载ambari和edp部署包

ambari 和 edp 的部署包在文章开头分享的百度网盘地址里。

将 ambari 和 edp 目录拷贝到 /var/www/html 目录下即可。然后浏览器访问以下地址可看到 ambari 和 edp 的相关rpm包(备注:ip地址为 httpd 服务部署的节点):

  • http://192.168.159.130/ambari/
  • http://192.168.159.130/edp/
3. 制作yum本地源
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装createrepo工具
yum -y install createrepo

1)ambari

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 将上面网盘的包拷贝到/var/www/html目录下
# 然后执行下述操作
cd /var/www/html
cd ambari/centos8/x86_64/3.0.0
createrepo .
# 执行createrepo .命令可在当前目录下生成repodata目录,该文件是yum仓库必须要有的文件,有了该文件,在任何目录下,yum install 包名 即可,也可以自动处理包之间的依赖关系。

2)edp

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 将上面网盘的包拷贝到/var/www/html目录下
# 然后执行下述操作
cd /var/www/html
cd edp/centos8/x86_64/3.3.0
createrepo .
# 执行createrepo .命令可在当前目录下生成repodata目录,该文件是yum仓库必须要有的文件,有了该文件,在任何目录下,yum install 包名 即可,也可以自动处理包之间的依赖关系。
4. 新建 ambari.repo文件(各节点都需要执行)
  • 在ambari-server节点,新建 ambari.repo(名称必须为ambari.repo,否则注册主机时会找不到ambari.repo文件而失败)文件,将文件放入/etc/yum.repos.d/目录下。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[ambari]
name=ambari
baseurl=http://node1.ambari.com/ambari/centos8/x86_64/3.0.0/
enabled=1
gpgcheck=0

备注:baseurl 地址的目录截止到 repodata 目录的上级即可。

在之后部署 hadoop 集群的时候,我们会在 ambari 界面上设置大数据集群的 yum 离线安装源,ambari 会在各 ambari-agent 节点上自动生成 ambari-bigtop-1.repo 文件。所以我们不需要额外配置 hadoop 安装包的 repo 文件,只需在 Ambari 页面注册 hadoop 集群时,填好 hadoop(bigtop) 的 base url(示例:http://node1.ambari.com/bigtop) 即可。

九、安装相关依赖(每个节点都需要安装)

ambari-agent 和 ambari-server 都依赖 distro 这个 python 类库。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y python3-distro

Ambari Metrics Monitor 服务需要依赖 python3-devel

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y python3-devel
十、在主节点安装ambari-server
1. 安装相关依赖

ambari-server 安装需要依赖以下资源,执行下述命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y python3-psycopg2
2. 拷贝 mysql jdbc jar 包
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 创建目录
mkdir /usr/share/java
# 将 mysql-connector-java-8.0.23.jar 拷贝到 /usr/share/java 目录下
# 改名
mv mysql-connector-java-8.0.23.jar mysql-connector-java.jar
3. 安装 ambari-server
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y ambari-server
4. 新增ambari用户并增加权限

在本次安装教程中,我们选择用 mysql 来存储 ambari 的元数据信息。

我们为 ambari 服务新增自己的用户,用户名就叫 ambari 吧,以下是新增 mysql 用户的操作。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mysql -uroot -proot123
# 这个用户,可以在mysql所在节点用ambari用户访问mysql
CREATE USER 'ambari'@'localhost' IDENTIFIED BY 'ambari';
GRANT ALL PRIVILEGES ON *.* TO 'ambari'@'localhost';
# 这个用户,在后续安装ambari的时候会用到。ambari-server通过ambari用户来访问mysql
CREATE USER 'ambari'@'%' IDENTIFIED BY 'ambari';
GRANT ALL PRIVILEGES ON *.* TO 'ambari'@'%';
# 刷新权限
FLUSH PRIVILEGES;  

MySQL 中的用户是 用户名 和 host 共同标识。所以在上面命令里,我们算是创建了两个用户,分别是 ambari@localhost、ambari@% 。

用户中的 host 的不同,代表受众群体也不同。比如 localhost 表示只能是本机访问;% 表示所有的 ip 都可以访问 mysql 。

扩展命令:删除用户命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Delete FROM user Where User='your_user' and Host='your_host';
FLUSH PRIVILEGES;
5. 使用ambari用户登陆并创建数据库
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mysql -uambari -pambari
# 创建ambari数据库
CREATE DATABASE ambari character set utf8 collate utf8_general_ci;
# 初始化表结构
use ambari;
source /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql
exit;
6. 配置ambari-server
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 设置ambari jdbc
ambari-server setup --jdbc-db=mysql --jdbc-driver=/usr/share/java/mysql-connector-java.jar

# # 设置ambari的java环境与数据库信息
# 以下两种方式,呼应上面安装jdk的两种方式
# 方式一:jdk是yum安装的方式
ambari-server setup -s \
-j /usr/lib/jvm/java-1.8.0-openjdk \
--ambari-java-home /usr/lib/jvm/java-17-openjdk \
--database mysql \
--databasehost node1.ambari.com \
--databaseport 3306 \
--databasename ambari \
--databaseusername ambari \
--databasepassword ambari

# 方式二:安装包离线安装
ambari-server setup -s \
-j /usr/java/jdk1.8.0_151 \
--ambari-java-home /usr/java/jdk-17.0.12+7 \
--database mysql \
--databasehost node1.ambari.com \
--databaseport 3306 \
--databasename ambari \
--databaseusername ambari \
--databasepassword ambari

命令参数解释:

  • --jdbc-db:指定数据库类型(例如 mysql)。
  • --jdbc-driver:指定数据库 JDBC 驱动的路径。
  • -s:跳过交互式提示,实现全自动安装。
  • -j:指定其他组件的默认 JAVA_HOME(JDK 8)。
  • --ambari-java-home:指定 Ambari Server 的专用 Java Home(JDK 17)。
  • --database:指定数据库类型。
  • --databasehost:数据库服务所在机器的hostname或者ip。
  • --databaseport:数据库服务端口号
  • --databasename:数据库名称
  • --databaseusername:数据库访问用户
  • --databasepassword:数据库访问密码
7. 启动ambari-server
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ambari-server start

登陆浏览器访问: http://192.168.159.130:8080,通过 Ambari 界面部署大数据集群。

默认登陆账号/密码为:admin/admin。

十一、通过 ambari 部署 EDP 集群

主要说一下关键步骤。

1、Select Version

由于之前我们搭建了本地yum源(已将edp的rpm包下载到了本地),所以要选择 “Use Local Repository” 。最后选择主机系统,配置大数据组件相关的 yum 本地源地址。

示例地址:http://node1.ambari.com/edp/centos8/x86_64/3.3.0

注意:Base URL 里面的地址是主机名ip地址都可以但也请注意,如果要填写 IP ,一定要是内网 IP 。

2、Install Options

在目标主机里面,填写规划的大数据集群主机列表,填写主机名即可。

注册主机,有两种方式,任选其一即可。

方式一:使用ssh私钥来注册主机

在下面的输入框内,填写 ambari-server 所在主机 root 用户的 ssh 私钥,就是 ~/.ssh/id_rsa 文件的内容,粘贴到下面的输入框内。

方式二:手动注册主机

选择不使用SSH私钥,手动注册主机,如下图所示:

在点击“登记确认”按钮之前,需要在您要注册的所有节点上安装ambari-agent,并修改配置。

具体操作如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
yum install -y ambari-agent
# 修改ambari-agent配置
vim /etc/ambari-agent/conf/ambari-agent.ini

将 server.hostname 由 localhost 改为 ambari-server 所在节点,如下图所示:

所有节点安装ambari-agent并修改了ambari-agent配置后,重启ambari-agent

在 Ambari 页面上点击“确定”即可,如下图所示:

3、Choose Services

在这一步,就可以选择 hadoop 相关的一些服务了。

4、Assign Masters

分配 master,就是将你所选服务的 master 角色组件,选择安装在哪台机器上。可以根据cpu、内存、磁盘等指标考虑。

5、Assign Slaves and Clients

在这一步中,可能很多刚入门的朋友还不清楚如何选择。其实和分配 master 的思路一样,就是将哪些组件安装在哪些主机上,这个就看个人规划了。比如:在 worker 节点上安装 datanode、nodeManager、RegionServer 等角色。

6、后续步骤

接下来的步骤,就比较简单了,我在这里也就不多赘述了。

7、安装完成

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CentOS7下利用Ambari搭建HDP大数据平台
Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应、管理和监控的开源工具, Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。提供Web UI进行可视化的集群管理,简化了大数据平台的安装、使用难度。
yuanfan2012
2020/09/01
3.2K0
Ambari+HDP 部署Hadoop 集群
1. 服务器准备     1 主机名         1.1 修改hostname            
Freedom123
2024/03/29
2520
使用Ambari搭建HDP集群完全参考手册
使用 ambari 来搭建 hdp 集群,前前后后搭了不下10遍,之前一直没有完整的总结整个过程,最近有空正好记录一下。
Lu说
2022/06/07
3.8K0
使用Ambari搭建HDP集群完全参考手册
Ambari2.7.1安装
注:主机名修改后需要重启机器才可彻底生效。如果用户不想重启,可使用命令 hostnamectlset-hostname node1.ambari.com来修改主机名,可使用命令 hostname来检验主机名是否修改成功。这种修改方式只是暂时的,待机器重启后就恢复原样 localhost了。
create17
2018/12/12
1.8K0
Ambari2.7.1安装
集群搭建篇(ambari+HDP)—— 全网最详细的,没有之一
1、服务器环境1.1 修改主机名称1.2 修改ip地址1.3 linux修改hosts并添加集群主机1.4 windows修改hosts文件并添加集群主机2、免密配置2.1 切换root用户2.2 生成公钥与私钥对2.3 将公钥复制到目标机器,并测试免密登录是否成功2.4 集群其他主机免密配置2.5 异常演示3、关闭防火墙3.1 防火墙设置3.2 设置之后3.3 设置之前4、禁用selinux4.1 selinux介绍4.2 设置selinux5、安装JDK5.1 上传jdk5.2 配置Java环境变量5.3 检查Java环境是否生效6、安装mysql6.1 mysql安装6.2 mysql设置6.3 修改密码6.4 上传驱动7、安装httpd服务7.1 httpd介绍7.1 安装httpd服务7.2 查看httpd服务7.3 tips:网页访问本地文件内容8、安装ntp服务8.1 ntp介绍8.2 安装8.3 修改ntp.conf配置8.4 时钟同步8.5 检查时钟同步效果9、搭建yum环境和创建ambari本地源9.1 安装yum工具9.2 安装9.3 创建repo文件9.4 分发repo文件9.4 生成本地yum源10、安装ambari10.1 在mysql中创建ambari用户和授权10.2 安装ambari10.2 初始化配置10.3 初始化ambari数据库10.4 启动ambari10.5 报错及解决10.6 ambari页面配置步骤10.6.1 第1步 启动安装10.6.2 第2步 输出集群名称10.6.3 第3步 选择版本、选择本地仓库及路径10.6.4 第4步 输入集群节点名称、私钥10.6.5 节点认证10.6.6 选择服务10.6.7 分配主节点10.6.8 分配从节点和客户端10.6.9 自定义服务10.6.10 确认配置10.6.11 安装部署11、启动服务11.1 java权限问题11.2 hive元数据初始化
大数据最后一公里
2021/08/05
2.5K0
集群搭建篇(ambari+HDP)—— 全网最详细的,没有之一
Ambari2.7安装配置
下载链接: https://pan.baidu.com/s/1rlqZejpZZqio9RPzgnGOEg 提取码: j47n ;内有jdk-8u151-linux-x64.tar.gz和mysql-connector-java.jar文件。
create17
2019/03/12
1.3K0
007.基于CentOS7.8安装Ambari2.7+HDP3.1大数据平台
我这里创建了一个普通用户名为admin,并且具有sudo权限,4个节点都需要有这个用户。
CoderJed
2020/10/30
2.3K1
007.基于CentOS7.8安装Ambari2.7+HDP3.1大数据平台
EDP 发布新组件时,如何进行增量安装?
最近 EDP 新增了 kudu 组件,对于已经部署了 EDP 的同学们,如何使用 EDP 安装 kudu 组件,本文做一个说明。后续 EDP 会继续集成新的组件,大家可以参考此文档使用 EDP 继续安装新组件。
create17
2025/03/17
420
EDP 发布新组件时,如何进行增量安装?
Ambari安装与集群配置
参考网址: http://www.ibm.com/developerworks/cn/opensource/os-cn-bigdata-ambari/index.html http://docs.hortonworks.com/HDPDocuments/Ambari-2.4.2.0/bk_ambari-installation/content/index.html
程裕强
2022/05/06
4440
安装Ambari和HDP
最新的CDH已经没有了社区版,也就是说以后使用新版本的Cloudera Manager和CDH都是要收费的,这对于很多小公司来说,可能无法承受。转向Ambari是他们的一个可选项。Ambari是Apache的一个顶级开源项目,开源是其最大的优势,开源也意味着Ambari可以灵活地进行扩展,集成更多的数据组件,对于需要定制化和二次开发的企业来说,Ambari也极具吸引力。
soundhearer
2020/10/15
3.2K0
安装Ambari和HDP
ambari安装
执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
Dlimeng
2023/06/29
4080
ambari安装
大数据平台HDP搭建
在ambari的setup中我们可以选择使用默认的postgresql,也可以自定义使用其他数据库,此处选用mariadb,便于后期管理维护
KaliArch
2018/05/29
2.5K3
大数据平台HDP搭建
安装 Ambari 2.6.0 + HDP 2.6.3 搭建Hadoop集群(CentOS7)简明版
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
Yunjie Ge
2022/04/24
9950
【大数据搭建HDP3.x】Ambari2.7.4+HDP3.1.4离线搭建教程(上)
上篇分享HDP3.1.4对照2.6.x的新特性,本篇文字整体分享下HDP3.1.4+Ambari2.7.4集群部署。各位看官走着~
知否大数据
2022/06/17
2.5K0
Ambari在离线环境中安装Hadoop集群 顶
如果手工安装Hadoop集群,在管理和后继部署中,越来越多的问题不断出现,主要如下:
白石
2019/08/23
1.5K0
Ambari安装指南 顶
Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目.目前最新的发布版本是 2.1.2. 就 Ambari 的作用来说,就是创建,管理,监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop. 用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具. 说到这里,大家就应该明白什么人最需要 Ambari 了.那些苦苦花费好几天去安装,调试 Hadoop 的初学者是最能体会到 Ambari 的方便之处的. 而且,Ambari 现在所支持的平台组件也越来越多,例如流行的 Spark,Storm 等计算框架,以及资源调度平台 YARN 等,我们都能轻松地通过 Ambari 来进行部署. Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server 和 Ambari Agent.简单来说,用户通过 Ambari Server 通知 Ambari Agent 安装对应的软件; Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护.
白石
2019/08/23
1.5K0
用户画像大数据环境搭建——从零开始搭建实时用户画像(四)
本章我们开始正式搭建大数据环境,目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境,使用原生的方式搭建Flink,Druid,Superset等实时计算环境。使用大数据构建工具与原生安装相结合的方式,共同完成大数据环境的安装。
大数据流动
2020/06/02
3.1K0
用户画像大数据环境搭建——从零开始搭建实时用户画像(四)
OushuDB入门(一)——安装篇
OushuDB是由Apache HAWQ创始团队基于HAWQ打造的新一代数据仓库(New Data Warehouse)。该产品采用了存储与计算分离技术架构,具有MPP的所有优点,还具有弹性,支持混合工作负载和高扩展性等优点。作为HAWQ的增强版,OushuDB遵循ANSI-SQL标准,兼容Oracle、Greenplum Database和PostgreSQL,提供PB级数据交互式查询能力,提供对主要BI工具的描述性分析和AI支持。
用户1148526
2019/05/25
1.5K0
ambari安装指南
(一)准备工作 1、准备几台机器 10.1.51.100 ambariserver 本地mirrorserver及ambari server都在这一台机器 10.1.51.10 master 10.1.51.11 slave1 10.1.51.12 slave2 2、都创建管理用户hadoop 3、做ssh免密码登录(ambariserver到其他机器的,hadoop用户) ssh-keygen cd .ssh cat id_rsa.pub >> authorized_keys chmod 700 ~/.ssh chmod 600 ~/.ssh/authorized_keys 注意,免密码一定要互相登陆一次,让他记住密码 4、设置sudo免密码(hadoop用户)---后续所有操作都在hadoop用户下去做 在各节点上进入root: visudo 加入如下内容: hadoop ALL=(ALL) NOPASSWD: ALL 5、Maximum Open File Descriptors(10000) 检查语句 ulimit -Sn ulimit -Hn sudo vi /etc/security/limits.conf @hadoop soft nproc 262144 @hadoop hard nproc 262144 @hadoop soft nofile 262144 @hadoop hard nofile 262144 sudo vi /etc/security/limits.d/90-nproc.conf @hadoop soft nproc 262144 以上改动重启才能生效,最好同时执行ulimit -u 10240 命令,是其立即生效。(ulimit 命令很多啊) 6、Check Existing Package Versions 7、Set up Service User Accounts(设置服务用户账户) http://docs.hortonworks.com/HDPDocuments/Ambari-2.0.0.0/Ambari_Doc_Suite/ADS_v200.html#ref-70627b43-7d78-4cbb-8df8-e3f43cbd8422 hdp的各个服务运行在不同的linux账户下,如果你创建了这些账户,ambari就会直接用,否则他会自动创建,但是自动创建的用户不知道密码是什么,但是还是可以 sudo su hdfs进入到这些用户下,不过这样就不方便了。 比较好的办法是自己创建的账户,使用ambari安装组件时选择自定义账户即可(UID >= 1000)。 8、Enable NTP on the Cluster and on the Browser Host 集群各节点,包括安装ambari webui的机器都得开启ntp服务已同步时间,如果有条件,局域网应该有ntp服务器 To check that the NTP service is on, run the following command on each host:chkconfig --list ntpd To set the NTP service to start on reboot, run the following command on each host:chkconfig ntpd on To turn on the NTP service, run the following command on each host:service ntpd start 9、Check DNS(可以选择10) 集群所有机器必须配置正向和反向DNS,如果条件不允许,就设置/etc/hosts文件,每个节点都得改 10、/etc/hosts 1.2.3.4 <fully.qualified.domain.name> //一行一个 注意:这两行千万不要删除 127.0.0.1 localhost.localdomain localhost ::1 localhost6.localdomain6 localhost6 vi /etc/sysconfig/network NETWORKING=yesNETWORKING_IPV6=yes HOSTNAME=<fully.qualified.domain.name> 11、关闭防火墙 12、Disable SELinux and PackageKit and check the umask Value set SELINUX=disabled in /etc/selinux/config sudo vi /etc/yum/pluginconf.d/refresh-packagekit.conf 设置:enabled=0 Ambari supports a umask value
挖掘大数据
2018/01/16
1.6K0
大数据环境搭建-Ambari图形化环境配置工具
https://www.psvmc.cn/article/2022-03-31-bigdata-environment.html
码客说
2022/04/27
8490
推荐阅读
相关推荐
CentOS7下利用Ambari搭建HDP大数据平台
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文