首页
学习
活动
专区
圈层
工具
发布

反BOT系统引发的内存爆炸,Cloudflare遭遇六年来最严重断网事故

2025年11月18日,全球领先的CDN和网络安全服务提供商Cloudflare遭遇了大规模服务中断,导致包括Twitter(现为X)、Reddit、GitHub、Shopify、Discord、Twitch、Adobe、Dropbox以及多个政府和企业网站在内的全球性下线。

图片来源:tom’s HARDWARE

此次故障源于Cloudflare内部一个数据库系统的权限更改,该变更导致ClickHouse数据库将多个重复条目输出到Bot管理系统使用的"特征文件"中,使文件大小翻倍。运行在网络所有服务器上的流量路由软件对特征文件大小设有上限,当超大文件被分发到全球网络后,软件因超出预设内存限制而发生故障。

最初,Cloudflare团队误判此现象为大规模DDoS攻击所致。故障高峰期间,全球超过80%依赖Cloudflare服务的网站流量受到影响,用户访问时普遍遭遇500 Bad Gateway错误。截至17:06 UTC,Cloudflare所有系统和服务已全面恢复正常运行。

图片来源:Cloudflare

此次受影响的服务包括核心CDN与安全服务、Turnstile验证系统、Workers KV、Dashboard控制面板、Email安全系统以及Access身份验证服务。Cloudflare首席技术官John Graham-Cumming在博客中详细解释,此次中断是自2019年以来最严重的一次,也是过去6年中首次导致大部分核心流量完全停止的事件。

图片来源:X

事后,Cloudflare承诺将强化内部生成配置文件的校验机制、增加全局紧急开关、优化错误报告资源占用,并全面审查核心代理模块的失效模式。此次事件影响范围覆盖全球180多个国家和地区的用户,超过10,000个网站服务短暂中断,社交媒体上#CloudflareDown话题迅速登上趋势榜。

故障期间Cloudflare处理的 5xx 错误的数量 图片来源:Cloudflare

目前,Cloudflare已公开完整事故时间线与技术细节。并对此次中断给全球互联网用户带来的影响表示诚挚歉意。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oef7u0CrlmagTluXheIDMGFA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券