非腾讯云主机监控

最近更新时间:2024-10-15 16:04:51

我的收藏

背景

本文主要引导用户如何快速采集非腾讯云主机的监控数据,降低用户配置成本。

接入方式

方式一:一键安装(推荐)

操作步骤

2. 在实例列表中,选择对应的 Prometheus 实例。
3. 进入实例详情页,单击数据采集 > 集成中心
4. 在集成中心找到并单击非腾讯云主机监控,即会弹出一个安装窗口。




步骤一:安装并运行 node_exporter

1. 在需要上报数据的主机上执行以下脚本:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x
node_exporter_install && ./node_exporter_install
执行脚本会自动触发以下动作:下载 node exporter、运行 node exporter、检查数据上报、完成(数据成功暴露在9100端口)。
脚本执行结果示例如下:



说明:
脚本中默认的参数:port=9100,path=/metrics ,如需自定义参数或对脚本进行重启、停止、健康检查、查看日志等操作,可使用 systemctl 来管理。
自定义参数:
修改 port,执行脚本语句替换为:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.listen-address=":9100"
修改 path,执行脚本语句替换为:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.telemetry-path="/metrics"
说明:
更多自定义参数的配置指引可参考 文档说明
常用的脚本管理操作:
重启:
systemctl restart node_exporter
停止:
systemctl stop node_exporter
状态检查:
systemctl status node_exporter
日志查看:
journalctl -u node_exporter
2. 保证主机网络与 Prometheus 实例内网互通
如已通过专线连通,则可以通过内网上报,无需任何操作。否则需要通过公网上报,操作如下:
主机需要开通公网 IP,作为采集目标 IP。
Prometheus 实例所在 VPC 的路由表需要配置 NAT 网关,可参考 TKE Serverless 集群如何放通外网
3. 主动放开安全组限制
主机安全组的入站规则,需要配置允许访问的授权策略:协议类型为自定义 TCP、端口为上述脚本中的<port>,源地址为0.0.0.0/0。

步骤二:配置抓取任务




参数
说明
任务名称
集成名称,命名规范如下:
名称具有唯一性。
名称需要符合下面的正则:'^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$'。
指标采集间隔(s)
输入指标采集间隔,单位s。
采集目标地址
输入采集目标地址,格式:host:port,支持添加多个。
指标采集路径
输入指标采集路径,默认为/metrics。

方式二:自定义安装

上述步骤一中脚本安装的方式,还可以替换为自定义安装,参考下述指引。

1. 下载安装 node_exporter:

在需要上报数据的主机上,下载并安装 node_exporter,您可以点击进入 Prometheus 开源官网下载地址 node_exporter,也可以直接执行下列命令:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter -O node_exporter
目录为当前文件夹:




2. 运行 node_exporter 采集基础监控数据:

赋予权限,执行 node_exporter并查看日志。
chmod +x node_exporter && nohup ./node_exporter &
cat nohup.out
如下图所示即为执行成功:



可通过下列命令,查看暴露在9100端口的监控数据:
curl 127.0.0.1:9100/metrics
如下图为执行命令后看到的暴露出来的指标监控数据:



完成上述操作后,需在页面中配置抓取任务,参考方式一中的 配置描述

查看监控

前提条件

Prometheus 实例已绑定 Grafana 实例。

操作步骤

1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择数据采集 > 集成中心,在集成中心页面找到非腾讯云主机监控卡片并点击弹出集成页面,选择 Dashboard > Dashboard 安装/升级 来安装对应的 Grafana Dashboard。
3. 打开 Prometheus 实例关联的Grafana实例地址,在 Dashboards页面查看相关的监控大盘。







配置告警

1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择告警管理,可以添加相应的告警策略,详情请参见 新建告警策略