故障模拟

最近更新时间:2024-11-01 15:40:33

我的收藏

操作场景

云数据库 Redis® 提供自动故障切换能力,保障服务的可用性,自动故障切换包括 Proxy 节点的故障切换和 Redis Server(Redis 数据存储节点)的故障切换。
云数据库 Redis® 提供故障模拟功能,便于配合业务做故障模拟测试。您可以在控制台体验故障模拟功能。系统通过向所有的 Redis 主节点发送 shutdown 命令,触发自动的 HA(High Availability)逻辑来实现故障模拟。

Proxy 故障切换

云数据库 Redis® 标准架构和集群架构都有 Proxy 节点,标准架构的 Proxy 节点数量为3个,集群架构的 Proxy 数量随着分片数量线性增长,Proxy 节点的高可用设计如下:
多个 Proxy 节点保证 Proxy 服务的高可用和负载均衡。
Proxy 节点会部署到3个物理设备,以保障高可用。
Proxy 节点故障后,拨测系统会检测到节点不可用,并自动补充新的节点。

Redis Server 故障切换

Redis 标准架构和集群架构采用的是 Redis Cluster 原生的集群管理机制,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,节点故障判断的时效性取决于 cluster-node-timeout,默认值是15000ms,建议不要更改该参数。节点故障的判断,请参见 Redis Cluster 原生设计

使用须知

仅状态为运行中的实例才能进行故障模拟操作。
多可用区部署的实例才能进行故障模拟操作。同一可用区部署的实例不支持。

注意事项

故障模拟将导致 Redis 服务在一定时间范围内不可用,通常故障恢复的时间小于1分钟,如果您正在写入数据,可能会产生数据丢失,请谨慎操作。
故障模拟导致的服务不可用,将不计入 Redis 承诺的 服务 SLA 范围内。

前提条件

数据库版本要求:4.0及其以上。
实例状态运行中

操作步骤

1. 登录 Redis 控制台
2. 在右侧实例列表页面上方,选择地域。
3. 在实例列表中,找到需进行故障模拟的多可用区实例。
4. 单击实例 ID,进入实例详情页面。
5. 实例详情页面,单击节点管理页签,在更多操作的下拉列表中,选择模拟故障

6. 在弹出的模拟故障对话框,确认实例的名称及 ID,并了解故障模拟的原理及警告信息,单击确定。实例状态将变更为处理中
7. 在左侧导航,单击任务管理,可等待任务执行完成。实例状态恢复为运行中,即说明模拟成功。



API 接口

API 接口
API 含义
模拟故障接口
Proxy 模拟故障接口