黑石物理服务器在使用中,可能会由于出现故障,而需要进行维修。维修任务功能就是用于对故障的物理服务器,进行授权维修与确认结果。
授权途径
维修任务的实时授权拥有两个操作入口,其原理相同。
控制台授权
腾讯云助手授权
核心流程
故障维修的整体流程分为三个环节,依次进行:
故障发生
由腾讯云可观测平台订阅告警,以发现故障。
任务状态包含:未授权、未授权-暂不处理。
授权维修
由维修任务页进行授权,以维修故障。
任务状态包含:处理中。
确认恢复
由消息中心发出通知,用户前往维修任务页面进行确认,以结束任务。
任务状态包含:待确认、待确认-未恢复、已恢复。
注意
状态生命周期
未授权
故障发生后的状态。可由腾讯云可观测平台订阅告警发现故障发生。
此状态发生后一小时未处理,将由售后人工提醒。
未授权-暂不处理
选择暂不处理,此时为未授权状态,且不会有售后人工提醒。
处理中
已经进行授权,正在维修中。
待确认
维修已完成,需要用户确认设备已恢复正常。
此状态发生后7天未处理,则默认为确认恢复,此维修任务自动转为已恢复。
待确认-未恢复
维修已完成,用户判断硬件故障未修复,则转为此状态,并自助建立售后工单,由售后人工服务。
此状态下无超时规则,此任务不会自动转为已恢复。
已恢复
用户确认服务器故障已修复,服务器已恢复正常。此任务结束。
故障分类与维修规则
故障按维修方式分为三类,分别对应不同处理方式:
免关机维修(自动维修)
有冗余硬件故障,由于可直接在线更换硬件,无需停机维修,所以默认为自动授权,立即维修。
例如:硬盘故障(有冗余)等。
关机维修(需要授权)
无冗余硬件故障,需要停机维修,授权维修前需使该设备的业务已离线。
例如:内存故障、主板故障、硬盘故障(无冗余)等。
未确认原因故障(需要授权)
突发宕机情况下,未确认原因的故障类型,需要进行机房现场诊断类故障。
例如:Ping 不可达故障、自助重启失败故障等。