首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 ...

Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 ...

原创
作者头像
yuanzhengme
发布2025-08-20 21:43:49
发布2025-08-20 21:43:49
980
举报
文章被收录于专栏:Linux相关Linux相关

@TOC

Ganglia是一款为HPC(高性能计算) 集群设计的可扩展性的分布式监控系统,它可以监视和显示集群中节点的各种状态信息,他由运行在各个节点上的gmond守护进程来采集 CPU、内存、磁盘利用率、I/O负载、网络流量情况等方面的数据。然后汇总到gmetad守护进程下,使用rrdtool存储数据,然后将历史数据以曲线方式通过PHP页面呈现。这里用来监控Flume的运行信息。

1. 安装配置

  1. 安装epel软件源和httpd、php服务yum install epel-release yum -y install httpd phpyum -y install rrdtool perl-rrdtool rrdtool-devel yum -y install apr-develyum -y install ganglia-gmetad # 安装ganglia-web时间比较久【也有可能是我的网络不好】 yum -y install ganglia-web yum install -y ganglia-gmond
  2. 安装其他依赖
  3. 安装ganglia的三大组件
  4. 修改配置文件

【养成好习惯,修改配置文件前先备份一下,正所谓有备无患 :smirk: 这里要修改4个配置文件】

【第 :one: 个配置:ganglia.conf】

这里解决了Web页面报:You don't have permission to access /ganglia on this server. 的问题。

代码语言:shell
复制
vim /etc/httpd/conf.d/ganglia.conf
代码语言:shell
复制
# 原内容
Alias /ganglia /usr/share/ganglia

<Location /ganglia>
  Order deny,allow
  Deny from all
  Allow from 127.0.0.1
  Allow from ::1
  # Allow from .example.com
</Location>

# 修改后
Alias /ganglia /usr/share/ganglia

<Location /ganglia>
 Require all granted
</Location>

【第 :two: 个配置文件:gmetad.conf】

代码语言:bash
复制
vim /etc/ganglia/gmetad.conf
# 配置数据源 名称 IP地址
data_source "tcloud_source" tcloud

【第 :three: 个配置文件:gmond.conf】

代码语言:bash
复制
vim /etc/ganglia/gmond.conf 
代码语言:bash
复制
# 修改后的模样
cluster {
 name = "tcloud_source"
 owner = "unspecified"
 latlong = "unspecified"
 url = "unspecified"
}
udp_send_channel {
 host = tcloud
 port = 8649
 ttl = 1
}
udp_recv_channel {
 port = 8649
 bind = tcloud
 retry_bind = true
}

【第 :four: 个配置文件:/etc/selinux/config】

代码语言:bash
复制
vim /etc/selinux/config
代码语言:shell
复制
# 配置这两项
SELINUX=disabled
SELINUXTYPE=targeted
# selinux修改需要重启才能生效 临时生效命令
[root@tcloud ~]# setenforce 0
setenforce: SELinux is disabled

2. 启动验证

代码语言:bash
复制
# 启动 httpd 服务
[root@tcloud ~]# systemctl start httpd.service
# 启动 gmetad 服务
[root@tcloud ~]# systemctl start gmetad.service
# 启动 gmond 服务
[root@tcloud ~]# systemctl start gmond.service

访问 http://tcloud/ganglia 进行验证

在这里插入图片描述
在这里插入图片描述

如果出现以上权限问题,修改/var/lib/ganglia目录的权限:

代码语言:bash
复制
chmod -R 777 /var/lib/ganglia

成功页面为:

在这里插入图片描述
在这里插入图片描述

3. 监控测试

1) 修改 ${FLUME_HOME}/conf/flume-env.sh配置

代码语言:bash
复制
vim /usr/local/flume/conf/flume-env.sh
# 添加一下配置【添加的时候不要换行】这里是为了大家看得清楚
	JAVA_OPTS="
	-Dflume.monitoring.type=ganglia 
	-Dflume.monitoring.hosts=tcloud:8649 
	-Xms100m -Xmx200m
	"

2) 启动一个Flume任务进行测试【我们用 付诸实践 01 里的第一个进行举例】需要注意的是要增加一些监控参数。

代码语言:bash
复制
# 1.启动
[root@tcloud ~]# flume-ng agent \
-n a1 \
-c conf \
-f /home/flume/test/test-exec-memory-logger.properties \
-Dflume.root.logger=INFO,console \
-Dflume.monitoring.type=ganglia \
-Dflume.monitoring.hosts=tcloud:8649
代码语言:bash
复制
# 2.发送数据进行测试
[root@tcloud ~]# echo "Test" >> /tmp/log.txt
[root@tcloud ~]# echo "Ganglia" >> /tmp/log.txt

页面显示【云服务器性能不行,为了截这张图等了很久 :traffic_light:】:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

图例说明:

字段(图表名称)

字段含义

EventPutAttemptCount

source尝试写入channel的事件总数量

EventPutSuccessCount

成功写入channel且提交的事件总数量

EventTakeAttemptCount

sink尝试从channel拉取事件的总数量。这不意味着每次事件都被返回,因为sink拉取的时候channel可能没有任何数据。

EventTakeSuccessCount

sink成功读取的事件的总数量

StartTime

channel启动的时间(毫秒)

StopTime

channel停止的时间(毫秒)

ChannelSize

目前channel中事件的总数量

ChannelFillPercentage

channel占用百分比

ChannelCapacity

channel的容量

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 安装配置
  • 2. 启动验证
  • 3. 监控测试
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档