▼
▼
▼
【科技明说 | 阿明观察】10月4日,Facebook以及整个Facebook的生态服务如Whatsapp、Messenger、Instagram、Oculus都出现了问题与故障,与此同时,Facebook的企业端和内部服务也出现问题。整个宕机事件持续了近7小时。后续传出消息称,因工程师错误发出指令导致了这次Facebook大规模宕机。
针对Facebook2021年10月的这次宕机又给业内带来了哪些思考呢?
其一,这不是Facebook的首次宕机事件,作为全球性的互联网及相关创新业务的领导性公司,在安全设置与解决方案部署上Facebook也是花费了不少功夫,为何还会出现问题。这说明了软硬件本身是存在问题的,需要在运维方面不断优化,实现智能运维,对故障问题实现更快速准确的自动化报警与提示,以及提供更快速智能的解决之道。
其二,安全不是专门针对黑客与病毒的攻防战,对于系统与平台的日常稳定,从软硬件优化方面需要不断创新与迭代。
其三,对于灾备中心与演练方面,互联网企业往往不够重视,对分布式架构的安全信任与依赖性极强,一旦遭遇问题,宕机恢复的时间自然会比较长,甚至宕机恢复遭遇更大挑战。此外,吃一堑,长一智。以前是以前,现在是现在,灾备也需要与时俱进。
总结该事件的问题,不外乎三点,强化智能运维、持续软硬件优化、提升灾备级别。对此,该三点对任何互联网企业都适用。
(by Aming)
- END-
你
怎
么
看
?
欢迎文末评论补充!
欢迎各种爆料
欢迎八卦小道
科技明说全天候在线
阿明独家分析为你开启新视野
领取专属 10元无门槛券
私享最新 技术干货