操作场景
采集 EMR on CVM 实例
前提条件
操作步骤
1. 登录 腾讯云可观测平台。
2. 在左侧菜单栏中单击 Prometheus 监控服务。
3. 在 Prometheus 实例列表中,选择对应的 Prometheus 实例。
4. 进入实例详情页,单击数据采集 > 集成中心。
5. 在集成中心找到并单击 EMR on CVM,即会弹出一个安装窗口,确认信息后单击保存即可。


6. 进入 EMR 控制台,单击集群的 ID/名称 > 实例信息,获取 EMR 集群所在地域、EMR 实例 ID。


7. 填写任务配置(Yaml 格式)。按下图红框依次填写任务名、EMR 集群所在地域、EMR 实例 ID。


采集 EMR on TKE 实例
前提条件
操作步骤
1. 登录 腾讯云可观测平台。
2. 在左侧菜单栏中单击 Prometheus 监控服务。
3. 在 Prometheus 实例列表中,选择对应的 Prometheus 实例。
4. 进入实例详情页,单击数据采集 > 集成中心。
5. 在集成中心找到并单击 EMR on TKE,即会弹出一个安装窗口。


6. 选择 EMR on TKE 实例所在容器集群,会自动查找容器集群中的 EMR on TKE 实例,选择需要采集的实例移动到右侧框,单击保存即可。
支持指标
如何正确判断服务异常
EMR on CVM 的 service_status 指标在服务异常或者用户手动停止时都会显示0,无法正确区分异常服务。因为 EMR 无法直接提供服务异常的指标,只能判断用户是否手动停止。Prometheus 监控服务根据服务是否手动停止的信息,新增 emr_additional_service_status 指标,与 service_status 指标组合可用于区分异常服务,值为 0 表示服务异常:
(service_status{} * on(instance_id, host, type) group_left() (emr_additional_service_status{} == 1))
EMR on TKE 不存在上述情况,可直接使用 service_status 指标,值为 0 表示服务异常。