文档中心>流计算 Oceanus>操作指南>作业监控>配置作业监控告警(数值指标)

配置作业监控告警(数值指标)

最近更新时间:2023-09-01 15:19:32

我的收藏
流计算 Oceanus 的数值指标监控告警策略是通过腾讯云可观测平台服务来实现的。本文针对一些常见的场景进行描述,更多详情可参见腾讯云可观测平台官方文档的 告警概述
注意
腾讯云可观测平台目前已关闭事件告警的配置能力,现在该功能已逐步迁移到 EventBridge,请参见 配置作业事件告警(异常事件) 文档来配置各类异常事件的告警。

查看作业告警策略

腾讯云可观测平台控制台 中选择告警管理 > 策略管理,默认可以查看所有产品的告警策略配置。在页面右上角点击高级筛选,监控类型选择云产品监控,策略类型选择“流计算 Oceanus”,即可查看所有为流计算作业配置的告警项。




新增作业告警策略

1. 腾讯云可观测平台控制台 中选择告警管理 > 策略管理,单击新建策略,输入策略名称,并填写可选的备注信息。
2. 策略类型下拉框中选择“流计算 Oceanus”,即提示选择“告警对象”。这里可以针对特定作业,或者所有作业进行策略配置,按 Shift 键即可多选。



3. 告警对象选择完毕,可选择“触发条件”。在 触发条件模板 中选择已经配置好的模板,或者新增模板。另外,如果不需要使用模板,则可以选择“配置触发条件”,这里可以对上述的多项监控指标做阈值配置和告警。



4. 配置告警通知,按照菜单配置通知模板即可。



5. 当所有内容配置完毕,单击完成,新建告警策略即立刻生效。
注意
“作业重启次数”和 “checkpoint 失败总次数”指标是累加型指标,配置监控告警的时候请使用环比的告警策略。

作业按标签配置告警

1. 标签 中选择标签列表 > 新建标签。



标签键和标签值,单击确定



2. 在创建作业或作业概览中选择标签。



作业概览页面中编辑标签:



编辑标签后单击确定即可。



3. 腾讯云可观测平台控制台 中选择告警管理 > 策略管理 > 新建策略 中选择按标签进行告警。



4. 配置告警通知。