背景
Redis 集群是业务存储热数据的重要组件,为保证业务的可用性,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,默认的心跳超时时间 (cluster-node-timeout) 为15s。如果此故障节点为主节点时,腾讯云 Redis 将采取故障切换机制,将重新从备节点选举新的主节点。
云顾问 - 混沌演练基于以上特性,提供手动方式跨过节点故障阶段直接模拟 HA 策略的故障动作,您可通过该手动故障方式模拟当 Redis 集群发生故障切换机制的短时间内对业务的影响。
演练实施
演练准备
准备一台多节点跨 AZ 属性的 Redis 实例。
演练步骤
步骤1:创建演练
1. 登录 云顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练。
2. 单击跳过,新建空白演练。
3. 填写基本信息。演练资源对象选择云资源类型下云数据库 Redis 内存版,并添加实例。
步骤2:添加动作
1. 点击立即添加,添加故障动作,故障动作选择 Redis 主备切换。
2. 设置动作参数处,根据模拟的容灾场景灵活选择主备切换模式:
优先同可用区切换
模拟主节点发生故障时,腾讯云Redis真实HA策略场景:数据最新节点优先提主;数据相同时优先同可用区其他节点选举。
优先跨可用区切换
模拟可用区整体故障时,其他可用区节点提主场景。
步骤3:执行演练动作
进入演练详情,在演练动作组中,点击执行,开始执行演练。
结果观测
以优先跨可用区模式为例,观察注入故障前后可用区是否变更。
故障前节点状态信息
故障后节点状态信息