2024年8月14日,全球最大的代码托管平台GitHub遭遇了大规模的全站服务故障,核心服务几乎全部瘫痪。这次故障影响了GitHub的主网站及多项服务功能,包括Pull Request、GitHub Pages、Copilot和API等。以下是关于这次故障的相关信息:
故障原因
根据GitHub官方状态页面的消息,初步怀疑此次故障是由数GitHub 很快就发布了事故报告,称这是由于他们对数据库基础设施更改配置,从而引发流量路由受影响,结果导致关键服务意外失去数据库连接。GitHub迅速采取行动,正在紧急回滚这一变更以恢复服务。
故障影响
故障导致全球范围内的开发者无法访问或使用GitHub的核心功能,据Downdetector数据显示,有超过一万名用户报告了问题。
恢复情况
GitHub在经历数小时的服务中断后,于美国东部时间晚上8:26确认所有服务现已全面运行。
GitHub的回应
GitHub在服务恢复后,很快就发布了事故报告,详细说明了故障原因,并强调了没有数据丢失或损坏。GitHub还表示,他们将采取措施防止类似事件的再次发生。
GitHub表示将审查并改进其变更管理流程,以增强系统的稳定性和可靠性。
这次故障再次凸显了GitHub作为全球技术基础设施的重要性,同时也引发了对于技术平台稳定性与可靠性的广泛讨论。