操作场景
前提条件
已使用弹性 MapReduce (EMR) 并开启 Prometheus Exporter 功能,详情查看 弹性 MapReduce (EMR) 快速入门。
使用与 EMR 相同的地域及私有网络 VPC,购买腾讯云 Prometheus 监控实例。可查看 Prometheus 监控服务支持的地域。
操作步骤
1. 登录 腾讯云可观测平台。
2. 在左侧菜单栏中单击 Prometheus 监控服务。
3. 在 Prometheus 实例列表中,选择对应的 Prometheus 实例。
4. 进入实例详情页,单击数据采集 > 集成中心。
5. 在集成中心找到并单击 EMR,即会弹出一个安装窗口,确认信息后点击保存即可。
6. 进入 EMR 控制台,点击集群的 ID/名称 > 实例信息,获取 EMR 集群所在地域、EMR 实例 ID。
7. 在 EMR 填写任务配置(Yaml 格式)。按下图红框依次填写任务名、EMR 集群所在地域、EMR 实例 ID。
支持指标
如何正确判断服务异常
EMR 的 service_status 指标在服务异常或者用户手动停止时都会显示0,无法正确区分异常服务。因为 EMR 无法直接提供服务异常的指标,只能判断用户是否手动停止。Prometheus 监控服务根据服务是否手动停止的信息,新增 emr_additional_service_status 指标,与 service_status 指标组合可用于区分异常服务,值为 0 表示服务异常:
(service_status{} * on(instance_id, host, type) group_left() (emr_additional_service_status{} == 1))