首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【YashanDB监控运维平台(YCM)】默认告警项

【YashanDB监控运维平台(YCM)】默认告警项

原创
作者头像
用户11441800
发布2025-06-25 16:44:32
发布2025-06-25 16:44:32
1100
举报

网页路径:【告警管理】>【告警策略】>【告警项】

告警项名称

告警建议

CPU使用率过高-Critical

请检查该服务器的CPU负载情况

CPU使用率过高-Warning

请检查该服务器的CPU负载情况

IP地址不存在-Critical

请检查该主机IP地址情况

Monit进程停止服务-Emergency

请联系管理平台运维人员,进行修复

node_exporter停止服务-Emergency

在ycm-agent安装路径下执行./monit/monitctl run start -g node_exporter拉起进程,若失败,排查失败原因。

NodeExporter被其他用户启动-Warning

停止并通过当前用户启动node_exporterjc

YCM-Agent被其他用户启动-Warning

请联系管理平台运维人员,进行修复

YCMAgent进程停止服务-Emergency

在ycm-agent安装路径下执行./monit/monitctl run start -g ycm-agent拉起进程,若失败,排查失败原因

YashanDB DN的max_workers小于所有CN的max_workers之和-Critical

建议修改DN、CN的MAX_WORKERS参数值

YashanDBExporter停止服务-Emergency

在YCM安装路径下执行./monit/monitctl run start -g yashandb_exporter拉起进程,若失败,排查失败原因

YashanDB主库与备库同步延迟过高-Critical

请检查网络环境

YashanDB主库与备库同步延迟过高-Emergency

当前备库与主库延迟过高,可查看V$instance视图查看当前备库的运行情况进行分析

YashanDB主库与备库同步延迟过高-Warning

请检查网络环境

YashanDB会话使用率过高-Critical

请检查数据库连接情况,修改最大连接数或停止某些连接

YashanDB会话使用率过高-Emergency

请检查数据库连接情况,修改最大连接数或停止某些连接

YashanDB多主DN共host-Critical

建议进行DN主备切换,将主DN部署在不同主机上面,防止单个主机压力过大

YashanDB存在异常长事务-Warning

数据库存在长事务,影响当前业务的性能和运行,建议查看V$transaction、v$session、v$sql_area视图获取该事务的详细情况,必要时可进行事务的回滚操作

YashanDB实例无法连接-Critical

请检查实例是否正常运行

YashanDB自选举发送心跳的周期配置不一致-Critical

建议修改主库与备库的HA_ELECTION_INTERVAL参数值,并保持一致,否则将会导致数据库异常业务切换

YashanDB自选举开关配置不一致-Critical

建议修改主库与备库的HA_ELECTION_ENABLED参数值,并保持一致,否则将会导致数据库异常业务切换

YashanDB自选举心跳超时时间配置不一致-Critical

建议修改主库与备库的HA_ELECTION_TIMEOUT参数值,并保持一致,否则将会导致数据库异常业务切换

YashanDB表空间(UNDO)使用率过高-Critical

建议查看当前时间段使用率变化趋势,若为异常激增,请查看相关对象进行分析或增加表空间大小

YashanDB表空间(UNDO)使用率过高-Emergency

建议查看当前时间段使用率变化趋势,若为异常激增,请查看相关对象进行分析或增加表空间大小

YashanDB表空间使用率过高-Critical

建议查看当前时间段使用率变化趋势,若为异常激增,请查看相关对象进行分析或增加表空间大小

YashanDB表空间使用率过高-Emergency

建议查看当前时间段使用率变化趋势,若为异常激增,请查看相关对象进行分析或增加表空间大小

YashanDB需要修复-Critical

请检查数据库的状态,若为need repair状态,建议重新build备机;若为异常状态,请具体分析并解决

YashanDB默认表类型不一致-Critical

建议修改主库与备库的DEFAULT_TABLE_TYPE参数值,并保持一致

内存使用率过高-Critical

请检查该服务器的内存使用情况

内存使用率过高-Warning

请检查该服务器的内存使用情况

内存剩余容量不足-Warning

请检查该服务器的内存使用情况

分布式YashanDB主库未运行-Warning

将主库拉起或将某个备库升为主库

分布式YashanDB多主库-Critical

建议将旧主机降为备机

分布式YashanDB存在pending事务-Warning

分布式数据库存在pending事务,建议查看DV$2PC_PENDING视图或事务分析获取pending事务的详细情况

单机YashanDB主库未运行-Warning

将主库拉起或将某个备库升为主库

单机YashanDB多主库-Critical

建议将旧主机降为备机

单机YashanDB多组开启自选举-Critical

将旧主机所在组关闭自选举

磁盘使用率过高-Critical

请检查该服务器的磁盘使用率情况

磁盘使用率过高-Warning

请检查该服务器的磁盘使用率情况

网络不可用-Critical

请检查服务器的网络情况,例如防火墙、网卡情况等

网络丢包率过高-Critical

请检查网络使用情况

网络吞吐量(接收)过大-Warning

请检查该服务器的吞吐情况

网络时延过高-Warning

请检查网络使用情况

Note: 其中告警项“网络不可用”,“网络时延过高”,“网络丢包率过高”只检测同网段主机。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档