前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云可观测平台「预设告警策略」上线!运维新手也能一键搞定告警配置!

腾讯云可观测平台「预设告警策略」上线!运维新手也能一键搞定告警配置!

作者头像
腾讯云可观测平台
发布于 2025-05-14 02:11:58
发布于 2025-05-14 02:11:58
840
举报

一、告警功能整体介绍

在数字化时代,系统故障和异常随时可能引发连锁反应,因此告警的重要性不言而喻。腾讯云监控告警平台作为腾讯云可观测平台的重要组成部分,是承载着云产品监控、APM 监控、RUM 监控、云拨测监控等 6 种类型的统一告警平台,后续也将进行更多类型的监控覆盖。在云监控统一告警平台内,支持用户进行完整的告警运维流程,包括:告警配置、告警接收、告警历史查看、告警大盘分析等。

在告警生命周期中,第一步就是配置告警规则,告警策略配置决定了告警的质量和价值。告警平台为了满足不同使用者的业务需求,提供了如下图所示的丰富配置场景和一些高级配置功能。

1.png
1.png

但是对于小白来说,面对复杂的配置项会有焦虑和困惑,因此本文将介绍一个新功能,帮助小白用户快速完成一个基于专家经验的告警配置。

二、运维人可能经历过的崩溃时刻

● 关键业务出问题了,忘记给资源配置告警,背锅侠又是你?😱

● 领导让你配置告警策略,面对几十个参数一脸懵圈?🤯

● 半夜被一堆无关紧要的告警吵醒,结果发现阈值配错了?😫

2.png
2.png

别担心!腾讯云最新推出的「预设告警策略」功能,专治小白用户的告警配置难题!

3.png
3.png

下面哪个类型是你,快快用起来:

✅ 缺乏告警配置经验的开发者

✅ 需快速为全资源部署基础监控的企业

✅ 希望以行业最佳实践为起点的优化需求

三、开箱即用的专家方案

1

预设内容

配置项

说明

策略名称

预设策略名称的命名规范是:产品名+预设告警策略,例如“云联网带宽预设告警”

监控范围

自动覆盖当前及未来新增的指定产品资源

触发条件

指标(CPU/内存等)+ 阈值 + 1分钟检测粒度 + 通知周期(每一小时重复通知一次)

通知渠道

预设通知对象是“系统预设通知模版”,也就是主账号的通知渠道。(可自定义修改)

2

支持调整修改

可修改项 :告警策略基本信息、触发条件配置、告警接收人配置。

重置机制 :支持一键重置。另外,关闭预设策略后重新启用将恢复初始配置。

3

灵活管理

管理入口:“预设告警策略列表”有对不同产品类型的预设策略,用户进行一键开启后会同步在“告警策略列表”内创建一条对应的告警策略。

创建/删除操作:在“管理预设告警”页面启用预设策略后,告警策略列表中会同步创建一条告警策略。后续关闭预设策略,这条告警策略也会同步删除。

4.png
4.png

临时关闭/开启操作:用户可以在告警策略列表中对告警策略进行启停操作,满足暂时开启/关闭的需求。

5.png
5.png

四、三步极简操作指南

1

一键开启

在【管理预设告警】页面选择产品(如云服务器数据库),确认配置信息后启用。

入口页面:

6.png
6.png
7.png
7.png

2

试运行调优

  • 告警过多?→ 适当调高阈值(如 CPU 告警从 80% 调整为 90%)
  • 告警不足?→ 降低阈值或缩短检测粒度(如5分钟→1分钟)
8.png
8.png

3

长期优化

基于业务特性微调:增删指标,调整阈值、粒度和持续检测周期等。在特殊活动期间可以进行指向性指标/阈值调整。

五、未来迭代计划

预设告警能力已经上线,接下来我们还会做这些方面的迭代,敬请期待!

产品丰富:丰富预设告警覆盖的产品,欢迎用户及时反馈哪些产品配置过程比较迷茫~

支持更多种预设策略:对同一个产品支持多种预设告警策略模版,满足不同需求场景的用户选择使用。

支持默认开启的策略:支持部分预设策略默认是开启的,基于云产品团队对策略本身重要程度考虑,会默认对非常重要的指标支持默认开启告警~

增加预设告警类型:当前预设告警策略中仅支持指标告警,后续会增加事件告警类型。

持续优化预设策略:我们会根据用户使用行为分析和用户反馈的意见,逐步地优化预设策略的配置内容。

关于腾讯云可观测平台

腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP)基于指标、链路、日志、事件的全类型监控数据,结合强大的可视化和告警能力,为您提供一体化监控解决方案。满足您全链路、端到端的统一监控诉求,提高运维排障效率,为业务的健康和稳定保驾护航。功能模块有:

  • Prometheus 监控:开箱即用的 Prometheus 托管服务;
  • 应用性能监控 APM:支持无侵入式探针,零配置获得开箱即用的应用观测能力;
  • 云拨测 CAT:利用分布于全球的监测网络,提供模拟终端用户体验的拨测服务;
  • 前端性能监控 RUM:Web、小程序等大前端领域的页面质量和性能监测;
  • Grafana 可视化服务:提供免运维、免搭建的 Grafana 托管服务;
  • 云压测 PTS:模拟海量用户的真实业务场景,全方位验证系统可用性和稳定性;
  • ......等等

点击播放视频快速了解👇

👇点击阅读原文立即体验

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云可观测 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
产品月报|Prometheus 支持一键采集容器指标,APM 新增性能剖析能力...
新增支持一键采集预设监控图表的所有指标,同时支持按照图表种类和预聚合规则筛选指标,提高指标采集的配置效率。
腾讯云可观测平台
2025/02/11
1140
产品月报|Prometheus 支持一键采集容器指标,APM 新增性能剖析能力...
产品月报|Prometheus 上线托管采集器,APM 发布探针2.3版本...
1.支持在新建云原生 API 网关时关联 Prometheus 监控,关联成功后可在网关实例详情页查看预设的常用指标监控面板。
腾讯云可观测平台
2025/02/11
740
产品月报|Prometheus 上线托管采集器,APM 发布探针2.3版本...
产品月报|Prometheus 支持在控制台快捷查看告警指标图表,APM 新增采样策略...
1.国际站容器服务的集群详情页支持一键开通 Prometheus 监控,开通完可直接查看常用指标监控图表。
腾讯云可观测平台
2025/02/11
950
产品月报|Prometheus 支持在控制台快捷查看告警指标图表,APM 新增采样策略...
客户案例|某车企建设统一监控平台实践
导语:文章主要介绍腾讯云 Prometheus 在监控出行行业的突出优势与解决方案,为客户运维团队降低了很多成本。
腾讯云可观测平台
2025/02/11
3440
客户案例|某车企建设统一监控平台实践
产品月报|Prometheus 优化告警功能,APM 国际站计费上线......
包括:新增支持从告警消息中链接跳转到对应实例、优化告警消息中告警对象的显示、支持告警内容换行、优化 Grafana 告警通道的交互和校验(提高客户配置成功率)、新增支持更多云产品监控等。
腾讯云可观测平台
2024/01/09
2410
产品月报|Prometheus 优化告警功能,APM 国际站计费上线......
产品月报|Prometheus 国际站容器控制台全新改版,APM 支持火焰图...
以下是问卷优质反馈的获奖号码,恭喜以下用户,礼品将在下周陆续发出~ 也再次感谢所有参与问卷填写的用户,感谢您的时间和用心反馈,期待我们下次活动再见:
腾讯云可观测平台
2024/03/07
2380
产品月报|Prometheus 国际站容器控制台全新改版,APM 支持火焰图...
智能运维可观测性:开启数字化运维新纪元
在云计算、大数据、人工智能等新一代信息技术迅猛发展的今天,企业数字化转型已成为不可逆转的趋势。随着业务线上化、架构分布式化和技术栈多元化的发展,传统运维模式正面临前所未有的挑战。智能运维可观测性(AIOps Observability)作为现代运维理念的核心,正在引领一场深刻的运维革命,为数字化时代的企业IT运营管理开辟全新路径。
运维老谭
2025/05/26
1890
智能运维可观测性:开启数字化运维新纪元
产品月报|Prometheus 支持新建容器集群时自动开通 Prometheus 监控,APM 支持用户自定义应用健康阈值...
2.Prometheus 国际站采集端架构升级,支持实例诊断、系统健康检查,并提升了采集 Agent 资源利用率和指标采集稳定性。
腾讯云可观测平台
2025/02/11
1220
产品月报|Prometheus 支持新建容器集群时自动开通 Prometheus 监控,APM 支持用户自定义应用健康阈值...
产品月报|Prometheus 支持在容器集群详情页一键开通,云拨测支持物理点绑定...
Prometheus 集成中心新增支持 Apache、MSSQL、Nginx 组件的一键安装,可一键安装集成相关监控数据。
腾讯云可观测平台
2024/05/13
2830
产品月报|Prometheus 支持在容器集群详情页一键开通,云拨测支持物理点绑定...
全链路追踪在腾讯云的落地思考与实践
随着微服务以及容器技术的发展,系统软件的构建方式也随之发生了改变,微服务调用关系错综复杂,传统的监控方案很难满足当下应用场景的需求,指标、链路追踪以及日志目前已经成为了云原生应用的“必备品”,当把它们集成在一起时,需要拥有一个更加成熟的现代化可观测体系来支撑,以便了解应用系统内发生的事情。通过可观测性体系的建立,我们可以更好的去洞察监控数据,从而能够更快速的做问题定界以及根因定位,降低 MTTR。
腾讯云可观测平台
2024/01/03
9001
全链路追踪在腾讯云的落地思考与实践
RUM、APM 强强联手实现全链路监控
导语:文章主要讲解如何让前端性能监控(RUM)和应用性能监控(APM)串联起来,在腾讯云可观测平台实现全链路高效监控。
腾讯云可观测平台
2025/02/11
1720
RUM、APM 强强联手实现全链路监控
一文详解腾讯云可观测平台 APM 采样方案
前言:本文直击传统采样方案的痛点,着重介绍腾讯云 APM 新推出的采样策略优势:既能降低 APM 使用成本,又不会对用户的使用体验带来明显影响。
腾讯云可观测平台
2025/02/11
2170
一文详解腾讯云可观测平台 APM 采样方案
产品月报|Prometheus 实例监控支持告警数量超限制被限流的统计,APM 全新 Demo 上线...
1.集成云监控新增快速采集【腾讯云数据仓库 TCHouse-C】的监控数据,支持配置采集云产品更多维度的数据。
腾讯云可观测平台
2025/02/11
1410
产品月报|Prometheus 实例监控支持告警数量超限制被限流的统计,APM 全新 Demo 上线...
「可观测」如何为「新能源车企」缓解运维焦虑?
导语:本文将探讨某新能源车企如何借助腾讯云可观测平台,实施可观测性方案,从而缓解运维焦虑,实现更高效的系统管理。
腾讯云可观测平台
2025/02/11
1720
「可观测」如何为「新能源车企」缓解运维焦虑?
【近期更新】 前后端链路打通,实现端到端全链路故障定位
前端性能监控(RUM) 1. 前后端链路打通,实现端到端全链路故障定位。 在前端 Skywalking 方式接入前端性能监控,后端 Skywalking 方式接入应用性能观测。在前端性能监控页面绑定 APM 相关业务系统,即可实现前后端链路打通,实现端到端全链路故障定位。联动排查前后端异常原因。 详细操作文档:https://cloud.tencent.com/document/product/1464/80520。 2. 增加地域筛选器,方便您分地域查看监控数据,更精准、快速排查异常。 3. 告警新
腾讯云可观测平台
2022/09/19
2.1K0
【近期更新】 前后端链路打通,实现端到端全链路故障定位
产品月报|Prometheus 支持跨账号采集 ,APM 支持对特定业务系统开启免费模式...
1.支持在容器集群详情页的 Prometheus 监控页面,一键安装集成中心中更多类型的组件监控,缩短用户使用路径。
腾讯云可观测平台
2025/02/11
960
产品月报|Prometheus 支持跨账号采集 ,APM 支持对特定业务系统开启免费模式...
可观测迁移实战:从自建困境到高效运维的华丽转身
在教育行业数字化转型进程中,某教育头部客户的运维团队面临自建 SkyWalking 监控系统的严峻挑战。随着业务规模扩张,系统运维复杂度呈指数级增长,运维团队每月 20% 以上工作时间都消耗在监控系统自身故障处理且微服务架构下的故障排查效率极低 ,针对这一现状,该团队通过技术架构升级与优化,与腾讯云可观测平台产研团队共创,实现了从传统自建监控体系向腾讯云可观测平台的迁移,同时也为教育行业监控系统转型提供实践范例。
腾讯云可观测平台
2025/06/11
740
可观测迁移实战:从自建困境到高效运维的华丽转身
中秋节~您有一封腾讯云监控的信件待查收......
尊敬的腾讯云监控用户: 您好, 褪去了盛夏的连月燥热,迎来了秋高气爽的日子。在这个充满希望的金黄色季节,我们祝愿您和您的业务也能收获无限可能。 春种一粒粟,秋收万颗子。白露已过,随着露珠一起凝结的,是枝头的硕果累累,回望过去的半年,云监控经历了太多的成长:产品功能不断完善,产品图鉴不断补全,无论如何成长,打造云原生场景下的一体化可观测性平台,是腾讯云监控不变的初心: 在过去的半年里,应用性能观测APM,前端性能监控RUM与日志服务CLS联动,完成指标-链路-日志的打通,实现请求级端到端全链路可观测; 在云
腾讯云可观测平台
2022/09/14
6530
中秋节~您有一封腾讯云监控的信件待查收......
产品月报|监控概览全新改版!告警管理新增值班功能......
可一键通过 Prometheus 监控进行统一采集、存储和可视化上述产品的基础监控数据。
腾讯云可观测平台
2023/08/10
3300
产品月报|监控概览全新改版!告警管理新增值班功能......
传统企业可观测建设之路
在数字化转型的浪潮中,我们面临着将“线下业务线上化”及实现“业务快速创新迭代”的迫切需求,这也进而要求支撑业务的应用系统更加敏捷、可扩展性更高。
嘉为蓝鲸
2024/06/28
2470
推荐阅读
产品月报|Prometheus 支持一键采集容器指标,APM 新增性能剖析能力...
1140
产品月报|Prometheus 上线托管采集器,APM 发布探针2.3版本...
740
产品月报|Prometheus 支持在控制台快捷查看告警指标图表,APM 新增采样策略...
950
客户案例|某车企建设统一监控平台实践
3440
产品月报|Prometheus 优化告警功能,APM 国际站计费上线......
2410
产品月报|Prometheus 国际站容器控制台全新改版,APM 支持火焰图...
2380
智能运维可观测性:开启数字化运维新纪元
1890
产品月报|Prometheus 支持新建容器集群时自动开通 Prometheus 监控,APM 支持用户自定义应用健康阈值...
1220
产品月报|Prometheus 支持在容器集群详情页一键开通,云拨测支持物理点绑定...
2830
全链路追踪在腾讯云的落地思考与实践
9001
RUM、APM 强强联手实现全链路监控
1720
一文详解腾讯云可观测平台 APM 采样方案
2170
产品月报|Prometheus 实例监控支持告警数量超限制被限流的统计,APM 全新 Demo 上线...
1410
「可观测」如何为「新能源车企」缓解运维焦虑?
1720
【近期更新】 前后端链路打通,实现端到端全链路故障定位
2.1K0
产品月报|Prometheus 支持跨账号采集 ,APM 支持对特定业务系统开启免费模式...
960
可观测迁移实战:从自建困境到高效运维的华丽转身
740
中秋节~您有一封腾讯云监控的信件待查收......
6530
产品月报|监控概览全新改版!告警管理新增值班功能......
3300
传统企业可观测建设之路
2470
相关推荐
产品月报|Prometheus 支持一键采集容器指标,APM 新增性能剖析能力...
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档