一、告警功能整体介绍
在数字化时代,系统故障和异常随时可能引发连锁反应,因此告警的重要性不言而喻。腾讯云监控告警平台作为腾讯云可观测平台的重要组成部分,是承载着云产品监控、APM 监控、RUM 监控、云拨测监控等 6 种类型的统一告警平台,后续也将进行更多类型的监控覆盖。在云监控统一告警平台内,支持用户进行完整的告警运维流程,包括:告警配置、告警接收、告警历史查看、告警大盘分析等。
在告警生命周期中,第一步就是配置告警规则,告警策略配置决定了告警的质量和价值。告警平台为了满足不同使用者的业务需求,提供了如下图所示的丰富配置场景和一些高级配置功能。
但是对于小白来说,面对复杂的配置项会有焦虑和困惑,因此本文将介绍一个新功能,帮助小白用户快速完成一个基于专家经验的告警配置。
二、运维人可能经历过的崩溃时刻
● 关键业务出问题了,忘记给资源配置告警,背锅侠又是你?😱
● 领导让你配置告警策略,面对几十个参数一脸懵圈?🤯
● 半夜被一堆无关紧要的告警吵醒,结果发现阈值配错了?😫
别担心!腾讯云最新推出的「预设告警策略」功能,专治小白用户的告警配置难题!
下面哪个类型是你,快快用起来:
✅ 缺乏告警配置经验的开发者
✅ 需快速为全资源部署基础监控的企业
✅ 希望以行业最佳实践为起点的优化需求
三、开箱即用的专家方案
1
预设内容
配置项 | 说明 |
---|---|
策略名称 | 预设策略名称的命名规范是:产品名+预设告警策略,例如“云联网带宽预设告警” |
监控范围 | 自动覆盖当前及未来新增的指定产品资源 |
触发条件 | 指标(CPU/内存等)+ 阈值 + 1分钟检测粒度 + 通知周期(每一小时重复通知一次) |
通知渠道 | 预设通知对象是“系统预设通知模版”,也就是主账号的通知渠道。(可自定义修改) |
2
支持调整修改
● 可修改项 :告警策略基本信息、触发条件配置、告警接收人配置。
● 重置机制 :支持一键重置。另外,关闭预设策略后重新启用将恢复初始配置。
3
灵活管理
● 管理入口:“预设告警策略列表”有对不同产品类型的预设策略,用户进行一键开启后会同步在“告警策略列表”内创建一条对应的告警策略。
● 创建/删除操作:在“管理预设告警”页面启用预设策略后,告警策略列表中会同步创建一条告警策略。后续关闭预设策略,这条告警策略也会同步删除。
● 临时关闭/开启操作:用户可以在告警策略列表中对告警策略进行启停操作,满足暂时开启/关闭的需求。
四、三步极简操作指南
1
一键开启
在【管理预设告警】页面选择产品(如云服务器、数据库),确认配置信息后启用。
入口页面:
2
试运行调优
3
长期优化
基于业务特性微调:增删指标,调整阈值、粒度和持续检测周期等。在特殊活动期间可以进行指向性指标/阈值调整。
五、未来迭代计划
预设告警能力已经上线,接下来我们还会做这些方面的迭代,敬请期待!
● 产品丰富:丰富预设告警覆盖的产品,欢迎用户及时反馈哪些产品配置过程比较迷茫~
● 支持更多种预设策略:对同一个产品支持多种预设告警策略模版,满足不同需求场景的用户选择使用。
● 支持默认开启的策略:支持部分预设策略默认是开启的,基于云产品团队对策略本身重要程度考虑,会默认对非常重要的指标支持默认开启告警~
● 增加预设告警类型:当前预设告警策略中仅支持指标告警,后续会增加事件告警类型。
● 持续优化预设策略:我们会根据用户使用行为分析和用户反馈的意见,逐步地优化预设策略的配置内容。
关于腾讯云可观测平台
腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP)基于指标、链路、日志、事件的全类型监控数据,结合强大的可视化和告警能力,为您提供一体化监控解决方案。满足您全链路、端到端的统一监控诉求,提高运维排障效率,为业务的健康和稳定保驾护航。功能模块有:
点击播放视频快速了解👇
👇点击阅读原文立即体验
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有