现象描述
在您的 etcd 集群中,出现了数据量异常的情况。可能是 Key 的数量或 Lease 的数量与预期不符,导致运营风险增加。
处理步骤
数据量异常排查
1. 如果您的集群中 Key 的数量较大,可以先查看集群 Key 数量的监控统计,比对 Key 数量判断是否符合业务预期,如果 Key 数量与预期差异较大,可能是由于业务逻辑没有按照预期清理或者是业务误写入等原因引起。使用命令行工具 etcdctl 导出所有 Key 进行详细比对排查:
etcdctl get "" --from-key --keys-only
2. 如果您的集群中 Lease 的数量较大,可以使用命令行工具 etcdctl 查看 Lease 数量,比对 Lease 数量并判断是否符合业务预期。如果 Lease 数量与预期差异较大,可以从业务侧进行排查。
etcdctl lease list
数据量较大的建议
1. 如果您的集群中 Key 的数量超过100万,运营风险较大,建议从业务侧进行拆分,将数据分散到多个集群中。
2. 如果您的集群中 Lease 的数量超过10万,运营风险较大,建议从业务侧进行拆分,将 Lease 分散到多个集群中。
查看集群 Key 数量监控统计
1. 登录 云原生 etcd 控制台。
2. 进入 etcd 集群列表页面,在页面上方选择相关地域,在下方集群列表中找到您需要操作的 etcd 集群。
3. 可从实例列表页,单击对应集群
图标,进入实例详情页 > 实例监控。如下图所示: