异常诊断

最近更新时间:2024-01-05 14:55:01

我的收藏

功能描述

异常诊断功能为用户的数据库实例提供实时的性能监控、健康巡检、故障诊断,让用户既可以直观地感知数据库实例实时的运行状况,也可以定位实时出现的性能异常。

整体概览

登录 DBbrain 控制台,在左侧导航选择诊断优化,在上方选择对应数据库,然后选择异常诊断页。




查看监控概览

概览框可显示数据库的整体健康得分、异常诊断事件时间轴、拓扑图等信息。
在概览框上方可选择实时或者历史统计时间范围。
在诊断事件的时间轴上,可查看每次诊断事件发生的时间点。将鼠标悬浮在时间轴上,上下滚动鼠标滑轮,可放大/缩小时间轴范围。


健康得分显示实例的 CPU 使用率、内存使用率、连接使用率、读请求命中率。数据库健康得分结合 AI,更贴合用户数据库真实运行状况。
拓扑图显示实例的节点架构和发生告警的节点位置,将鼠标悬浮在对应节点上,也可查看节点指标统计信息。



查看诊断信息

诊断事件显示等级分为健康、提示、告警、严重、致命。DBbrain 会定期(每10分钟)的对实例进行健康巡检。
1. 在诊断提示框中,显示事件的风险等级分布。
2. 在诊断详情列表中,单击对应事件即可进入事件详情页。



3. 在事件详情中查看事件的现场描述。
事件详情:包括诊断项、起止时间、风险等级、持续时长、概要等信息。
现场描述:异常事件(或健康巡检事件)的外在表现现象的快照和性能趋势。


4. 忽略/取消忽略告警。
忽略告警功能,从单击忽略后,该实例由相同根因产生的诊断项告警也将被忽略。对于已被忽略的异常告警信息,将会被置灰色。
说明:
该功能仅针对诊断项为非“健康巡检”的异常告警。
取消忽略告警功能,从单击取消忽略后,该实例由相同根因产生的异常告警也将被取消忽略。默认不显示已忽略的诊断项。 在诊断提示中,鼠标悬浮在对应告警上,即可显示忽略操作,然后单击忽略。单击任意一条异常告警的忽略取消忽略,可忽略及取消忽略同类告警信息。

也可以进入事件详情页,在右上方单击忽略取消忽略

诊断项详细说明

诊断项为智能诊断的项目,其类别包括性能、可用性、可靠性、可维护性四类,每个诊断项仅属于一个类别。
诊断项名称
诊断项类别
说明
风险等级划分
节点 CPU 利用率
性能
节点 CPU 利用率过高
致命:节点 CPU 利用率 ≥ 95
严重:95<节点 CPU 利用率 ≥ 90
告警:90<节点 CPU 利用率 ≥ 80
提示:80<节点 CPU 利用率 ≥ 60
节点内存使用率
性能
节点内存使用率过高
致命:节点内存使用率 ≥ 95
严重:95<节点内存使用率 ≥ 90
告警:90<节点内存使用率 ≥ 80
提示:80<节点内存使用率 ≥ 60
节点连接使用率
性能
节点连接使用率过高
致命:节点连接使用率 ≥ 95
严重:95<节点连接使用率 ≥ 90
告警:90<节点连接使用率 ≥ 80
提示:80<节点连接使用率 ≥ 60
Proxy 连接使用率
性能
Proxy 连接使用率过高
致命:Proxy 连接使用率 ≥ 95
严重:95<Proxy 连接使用率 ≥ 90
告警:90<Proxy 连接使用率 ≥ 80
提示:80<Proxy 连接使用率 ≥ 60
Proxy 入流量使用量
性能
Proxy 入流量使用量过高
致命:Proxy 入流量使用量 ≥ 1536
严重:1536<Proxy 入流量使用量 ≥ 1228.8
告警:1228.8<Proxy 入流量使用量 ≥ 1024
提示:1024<Proxy 入流量使用量 ≥ 800
Proxy 出流量使用量
性能
Proxy 出流量使用量过高
致命:Proxy 出流量使用量 ≥ 1536
严重:1536<Proxy 出流量使用量 ≥ 1228.8
告警:1228.8<Proxy 出流量使用量 ≥ 1024
提示:1024<Proxy 出流量使用量 ≥ 800
Proxy 入流量限流
性能
Proxy 入流量限流
致命
Proxy 出流量限流
性能
Proxy 入流量限流
致命
错误命令
可维护性
存在错误命令
告警
高危命令
可维护性
存在高危命令
告警
连接性检查
可用性
数据库连接异常,无法链接数据库实例
致命