告警管理简介

最近更新时间:2024-04-18 17:05:41

我的收藏

功能介绍

告警管理功能提供对 云产品监控应用性能监控前端性能监控云拨测 相关监控指标和 事件 的告警功能,支持用户为监控指标和事件设置告警触发规则与多种告警通知方式(电话、短信、邮件、微信、企业微信、钉钉、飞书、Slack 等)。当监控指标异常时,让用户可以第一时间接收到异常告警通知,及时响应处理故障,避免因异常发现不及时造成的业务损失。
腾讯云可观测平台告警管理功能支持用户自定义告警策略、告警通知和屏蔽规则,在接收到告警通知后,用户可点击查看告警详情。同时支持用户在告警大盘和告警历史页面查看最近一段时间内的告警信息。




应用场景

用户新建告警策略后,首先需要配置告警规则,用户可自定义选择告警对象和告警触发条件。告警规则配置完成后用户可选择系统预设通知模板用于接收告警消息,也可以自定义通知模板,让告警通知更灵活。对于已经创建完成的告警策略,用户也可以根据需要在自定义时间内屏蔽告警实例或告警策略,避免告警噪声干扰和信息过载的问题。用户可通过电话、短信、微信、企业微信等方式接收告警信息,并查看告警详情。当用户处理完告警异常使得指标恢复正常后,告警将会自动结束。



腾讯云可观测平台的告警管理功能可广泛应用于各种需要持续监控和快速响应异常的场景,如电商网站流量监控业务维护期间的告警管理

电商网站流量监控

对于电商行业的客户来说,网站流量情况会直接影响到业务的稳定性和网站用户的体验感。使用告警管理功能后,用户可以对网站流量、服务器负载、数据库性能等关键指标设置告警阈值和通知方式。一旦有关键指标超过告警阈值,用户可以第一时间收到告警通知,及时响应处理异常,保证业务的正常运行。相关运维人员也不必时刻查看监控指标,可以投入更重要的运维工作中,提高运维效率。

业务维护期间的告警管理

在业务维护期间,如进行变更、迁移等操作时,系统可能会产生大量在预期内的告警,可无需立即响应处理。用户可以配置告警屏蔽规则,在业务维护期内屏蔽这些在预期内的告警通知,减少干扰和误报,同时确保关键的告警能够及时通知触达用户。

使用限制

当前告警管理功能部分模块存在使用限制,具体限制模块及配额如下表所示:
限制模块
相关限制
告警策略
每种策略类型、每个项目:300个(无法更改此配额)。
默认策略
每种策略类型、每个项目仅有一个默认策略(无法更改此配额)。
短信配额
每用户、每月告警短信免费配额为1000条,不区分告警类型,每月1号重置。如需购买短信额度请参见 购买告警短信服务
告警历史
告警历史信息保存时长上限为半年。