实验设计

最近更新时间:2024-06-11 10:41:31

我的收藏

视频介绍



简介

实验开始前,我们需要遵循混沌工程实施的三个步骤:实验设计实验实施结果分析,其中最核心的是实验设计,在实验设计时,我们要考虑以下内容:



对于此次试验,我们可以做出如下的实验设计:
建立假设:网站服务在主力可用区故障时,备可用区仍然能够对外提供服务,即服务整体具备跨可用区容灾能力。
实验场景设计:测试环境演练,模拟部分生产流量。
系统评估指标设计:接口请求失败率、接口平均请求时延、故障恢复时长。
扰动类型设计
接入层:
CLB 外网 IP 封堵故障,模拟单可用区故障后 CLB 不可访问的情况,对长连接也生效。
逻辑层:
CVM 网络中断故障,模拟单可用区故障后 CVM 不可访问的情况,对长连接也生效。
数据层:
CRS 主节点故障,模拟单可用区故障后导致 CRS 主节点故障,CRS 主节点故障后,首先会进行主备切换,切换完成后,将尝试在原可用区重新拉起新节点,如果 CRS 配置有自动回切主可用区策略,拉起新节点后,主节点将自动回切到主可区,在切换过程中,业务可能出现闪断。
CDB 主备切换,模拟单可用区故障后导致 CDB 发生主备切换对业务造成的影响,在切换过程中,业务可能出现闪断。
扰动模式选择:单一扰动。
实验结果预期:服务具备跨可用区容灾能力,接入层、逻辑层、数据层故障后都能做到自动恢复。