尊敬的腾讯云用户,为了给您提供更准确、完整的事件告警说明,云数据库 MySQL 计划于2024年07月01日下线“主节点服务故障”、“主节点服务故障恢复”、“备节点服务故障”、“备节点服务故障恢复”这四个事件指标,并将分别优化为“主节点服务拨测异常”、“主节点服务拨测异常恢复”、“备节点服务拨测异常”、“备节点服务拨测异常恢复”。涉及的事件指标的告警原理不变,本次优化仅针对事件名称、事件描述、处理方法和建议,以更好的帮助您理解。
说明:
下线时间
北京时间2024年07月01日(周一)。
优化后相关事件指标信息
事件中文名称 | 事件英文名称 | 事件类型 | 从属维度 | 有无恢复概念 | 事件描述 | 处理方法和建议 |
主节点服务拨测异常(原:主节点服务故障) | MasterHealthCheckError | 异常事件 | 云数据库 MySQL 实例维度 | 无 | 主实例可能因高负载、连接数满、运行异常、网络波动等情况导致无法判断当前主实例节点服务状态为存活。 | 可适当增加节点配置来降低风险发生的概率。 1. 如您收到 MasterHealthCheckRecovery 事件,则代表主节点恢复,HA 切换回滚,并未实际发生 HA。 2. 如您收到 Switch 和 SlaveHealthCheckRecovery,则代表发生 HA 并成功恢复。 3. 如您收到 Switch,但没收到 SlaveHealthCheckRecovery,则代表发生 HA 且原 Master 实例被重建。 |
主节点服务拨测异常恢复(原:主节点服务故障恢复) | MasterHealthCheckRecovery | 恢复事件 | 云数据库 MySQL 实例维度 | 无 | 数据库主节点出现服务异常后恢复。 | 数据库主节点服务异常(MasterHealthCheckError)已恢复,可正常运行。 |
备节点服务拨测异常(原:备节点服务故障) | SlaveHealthCheckError | 异常事件 | 云数据库 MySQL 实例维度 | 无 | 备实例可能因高负载、连接数满、运行异常、网络波动等情况导致无法判断当前备实例节点服务状态为存活。 | 可适当增加节点配置或只读节点数量来降低风险发生的概率。 1. 如您收到 SlaveHealthCheckRecovery,说明备节点已恢复。 2. 如您未收到 SlaveHealthCheckRecovery,则说明备节点拨测已超时重建。 |
备节点服务拨测异常恢复(原:备节点服务故障恢复) | SlaveHealthCheckRecovery | 恢复事件 | 云数据库 MySQL 实例维度 | 无 | 1. 数据库备节点出现服务异常后恢复。 2. 原主节点异常,主备切换后,原异常主节点恢复为备节点。 | 1. 数据库备节点服务异常(SlaveHealthCheckError)已恢复,可正常运行。 2. 数据库原主节点服务异常(MasterHealthCheckError)已恢复,可正常运行。 |
影响说明
本次更新对您的业务使用数据库无影响。如果您在2024年07月01日前设置了将要下线的事件指标的告警,下线后则不会触发旧的事件告警,请您及时设置新的事件指标的告警;如果您在2024年07月01日前没有设置将要下线的事件指标的告警,我们建议您届时设置新的事件指标的告警,便于您更清晰地发现拨测异常事件。