接入外部监控 Prometheus

最近更新时间:2024-10-11 15:23:01

我的收藏
TDMQ Pulsar 支持将专业集群的监控数据,接入用户到自建的 Prometheus ,更加利于用户对消息队列集群运行进行观测,同时可以通过 Prometheus 的监控数据,对业务 Workload 进行及时地 HPA,使得整体线上运维更加自动化。
高阶使用方式:
标准的 Prometheus 监控格式,实现后可以用自己的 Prometheus 通过我们提供的 Exporter 获取数据。
例如通过 Grafana 配置 Prometheus 数据源,K8s 获取 Prometheus 数据来进行 Workload HPA 等。
注意:
如果您的专业集群是在 2024 年 3 月 25 日前创建,如需开启此功能需要进行集群升级,请联系我们。

使用指南

2. 在左侧导航栏选择 集群管理,单击目标实例的“ID”,进入实例基本信息页面。
3. 单击进入监控信息 Sheet 页。
4. 在右上角单击 Prometheus 监控入口获取 按钮的获取监控目标,选择相应的网络类型及网络配置。

5. 单击提交,获取一组监控目标。

6. 修改配置文件 prometheus.yml,增加 node_exporter 抓取任务。
job_name: prometheus-tdmq-pulsar
honor_timestamps: true
scrape_interval: 60s
metrics_path: /tencent-cloud-metrics/
scheme: http
static_configs:
- targets:
- 10.x.x.x:10001
- 10.x.x.x:10002
honor_timestamps,设置为 true 时,Prometheus 将使用 Exporter 提供的指标时间戳,而不是使用 Prometheus 服务器接收到指标的时间戳。
scrape_interval,为抓取监控度量数据的频率,目前的监控指标是分钟级的。
metrics_path,获取监控指标的路径,请设置为 /tencent-cloud-metrics/。
scheme,配置访问资源的协议,当前仅支持 http。
7. 访问相应可视化界面,查看配置监控指标。
说明:
1. 该功能分别提供了专业集群的集群级、Topic 级、订阅级的监控数据,与控制台的指标项完全对齐。但是不同于控制台的是,控制台的监控数据是聚合后的,而通过 Prometheus 的数据是聚合前的,需要您自行在 Grafana 面板聚合展示。
2. 由于监控数据采集的路径不同和聚合逻辑不同,通过该功能抓取到的数据,与用户控制台所展示数据,在具体数值上可能存在差异。
3. 该功能仅专业集群支持。

指标说明

集群级

指标
指标名
集群消息生产速率
pulsar_caculate_rate_in
集群消息消费速率
pulsar_caculate_rate_out
集群消息存储大小
pulsar_storage_size
集群生产带宽峰值
pulsar_throughput_in
集群消费带宽峰值
pulsar_throughput_out

Topic 级

指标
指标名
消息生产速率
pulsar_caculate_rate_in
消息消费速率
pulsar_caculate_rate_out
消息生产流量
pulsar_throughput_in
消息消费流量
pulsar_throughput_out
生产者数量
pulsar_producers_count
消费者数量
pulsar_consumers_count
消息存储大小
pulsar_storage_size
消息堆积数量
pulsar_msg_backlog
消息积压大小
pulsar_storage_backlog_size
生产者数量限流次数
pulsar_publish_rate_limit_times
过滤消息数量
pulsar_tag_filter_rejected_msg_rate

订阅级

指标
指标名
消息堆积条数
pulsar_subscription_back_log
消息消费速率
pulsar_subscription_msg_rate_out
消息消费流量
pulsar_subscription_msg_throughput_out
未确认消息数
pulsar_subscription_unacked_messages
消费者数量
pulsar_subscription_consumers_count
延迟消息数量
pulsar_subscription_delayed
消息删除速率
pulsar_subscription_msg_rate_expired
过滤消息数量
pulsar_subscription_tag_filter_rejected_msg_rate