背景
本文主要引导用户如何快速采集非腾讯云主机的监控数据,降低用户配置成本。
接入方式
方式一:一键安装(推荐)
操作步骤
1. 登录 Prometheus 控制台。
2. 在实例列表中,选择对应的 Prometheus 实例。
3. 进入实例详情页,单击数据采集 > 集成中心。
4. 在集成中心找到并单击非腾讯云主机监控,即会弹出一个安装窗口。
步骤一:安装并运行 node_exporter
1. 在需要上报数据的主机上执行以下脚本:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +xnode_exporter_install && ./node_exporter_install
执行脚本会自动触发以下动作:下载 node exporter、运行 node exporter、检查数据上报、完成(数据成功暴露在9100端口)。
脚本执行结果示例如下:
说明:
脚本中默认的参数:port=9100,path=/metrics ,如需自定义参数或对脚本进行重启、停止、健康检查、查看日志等操作,可使用 systemctl 来管理。
自定义参数:
修改 port,执行脚本语句替换为:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.listen-address=":9100"
修改 path,执行脚本语句替换为:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.telemetry-path="/metrics"
说明:
常用的脚本管理操作:
重启:
systemctl restart node_exporter
停止:
systemctl stop node_exporter
状态检查:
systemctl status node_exporter
日志查看:
journalctl -u node_exporter
2. 保证主机网络与 Prometheus 实例内网互通
如已通过专线连通,则可以通过内网上报,无需任何操作。否则需要通过公网上报,操作如下:
主机需要开通公网 IP,作为采集目标 IP。
Prometheus 实例所在 VPC 的路由表需要配置 NAT 网关,可参考 TKE Serverless 集群如何放通外网。
3. 主动放开安全组限制
主机安全组的入站规则,需要配置允许访问的授权策略:协议类型为自定义 TCP、端口为上述脚本中的<port>,源地址为0.0.0.0/0。
步骤二:配置抓取任务
参数 | 说明 |
任务名称 | 集成名称,命名规范如下: 名称具有唯一性。 名称需要符合下面的正则:'^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$'。 |
指标采集间隔(s) | 输入指标采集间隔,单位s。 |
采集目标地址 | 输入采集目标地址,格式:host:port,支持添加多个。 |
指标采集路径 | 输入指标采集路径,默认为/metrics。 |
方式二:自定义安装
上述步骤一中脚本安装的方式,还可以替换为自定义安装,参考下述指引。
1. 下载安装 node_exporter:
wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter -O node_exporter
目录为当前文件夹:
2. 运行 node_exporter 采集基础监控数据:
赋予权限,执行 node_exporter并查看日志。
chmod +x node_exporter && nohup ./node_exporter &cat nohup.out
如下图所示即为执行成功:
可通过下列命令,查看暴露在9100端口的监控数据:
curl 127.0.0.1:9100/metrics
如下图为执行命令后看到的暴露出来的指标监控数据:
查看监控
前提条件
Prometheus 实例已绑定 Grafana 实例。
操作步骤
1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择数据采集 > 集成中心,在集成中心页面找到非腾讯云主机监控卡片并点击弹出集成页面,选择 Dashboard > Dashboard 安装/升级 来安装对应的 Grafana Dashboard。
3. 打开 Prometheus 实例关联的Grafana实例地址,在
Dashboards
页面查看相关的监控大盘。
配置告警
1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择告警管理,可以添加相应的告警策略,详情请参见 新建告警策略。