7月23日,美国电信巨头AT&T又遭遇长达12小时的网络中断事件,调查结果暴露出了管理和技术实施方面存在的深层次缺陷。
美国联邦通信委员会(FCC)发布了一份详尽的报告,详细阐述了AT&T全网中断事件的始末。报告指出,这次中断是由于网管配置错误、内部程序未遵守、缺乏同行评审、测试不足等一系列因素共同作用的结果。
这些技术失误和管理漏洞的交织,最终导致了美国全国范围内的移动通信服务中断。
报告指出,7月23日AT&T的一名员工在进行例行夜间维护时,错误地将一个未经充分测试的新网元接入核心网络。这个新网元的配置与AT&T既定的设计和安装程序不符,且未经过同行评审。
问题的根源在于这个配置错误,下游网元将错误信息进一步传播到整个网络,触发了自动响应机制,导致所有网络连接被关闭。在短短几分钟内,数百万用户的语音服务和5G数据连接被切断,引发了美国范围内的通信中断。
值得一提的是,美国通信业近期可谓是多事之秋。就在网络瘫痪事件之前不久,AT&T刚刚公开了一起重大数据泄露事件,所有用户的长达6个月的短信和通话记录被盗。
更为严重的是,这次中断暴露出AT&T在测试和监控方面的严重不足。报告指出,AT&T在实验室测试和现场测试方面都存在不足,没有足够的保障措施和控制措施来确保网络更改的安全性。此外,AT&T的网络管理系统也未能有效应对突发状况,导致大面积拥塞和用户设备无法重新连接到网络。
毕竟AT&T作为美国一家具有百年历史的通讯企业,是美国最大的电话公司,如果连起码的稳定、可靠的通信服务都提供不了,那真的是美国通信业的悲哀。而且这次事件却让美国人对其运营能力和管理水平产生了严重质疑。
美国AT&T这次事件怎么说都是不应该发生的,数百万用户无法使用手机进行通信,无法访问互联网,甚至无法拨打紧急电话。同时对于AT&T而言,这次全网中断事件无疑是一次严重的信誉危机。
从更宏观的角度来看,这次AT&T全网中断事件也引发了美国通信行业的脆弱性。
领取专属 10元无门槛券
私享最新 技术干货