魔幻!工程师想修安全漏洞,却把20%网站修瘫痪,AI巨头集体断网
大家好,我是老陈瞰世界。
2025 年 11 月 18 日,不少人打开手机就懵了:ChatGPT 加载转圈、X 平台直接打不开、Spotify 的歌单刷不出来,就连想叫个 Uber 都显示网络错误。
这场突如其来的 “数字灾难”,源头竟是互联网 “幕后顶梁柱” Cloudflare 的一次常规更新,直接让半个地球的网络陷入瘫痪。
你发现没,这次宕机的离谱程度,刷新了很多人的认知。
全球足足 20% 的网站都靠 Cloudflare 吃饭,不管是购物用的亚马逊、开会用的 Zoom,还是 AI 界的巨头 OpenAI、xAI,全被这波故障按在了地上。
从 11 点 20 分故障爆发,到 17 点 06 分完全恢复,这漫长的近 6 小时里,网友们体验了一把 “无网之痛”。
故障最严重的时候,故障追踪平台 Downdetector 收到了超 210 万条报错,创下近年基建级故障的纪录。
更搞笑的是,Downdetector 自己也用了 Cloudflare 的服务,结果监测故障的工具先崩了,网友吐槽 “连吐槽故障都找不到地方”。
马斯克之前还嘲讽过亚马逊宕机,没想到这次风水轮流转,自家 X 平台直接崩到无法访问,估计老马也得捏把汗。
![]()
最绝的是 Cloudflare 的工程师,故障发生后想打开 ChatGPT 帮忙找解决方案,结果发现 AI 也断网了,堪称 “雪上加霜”。
说句实在话,咱们国内的基建是真靠谱。平时刷微信、看 B 站、追视频,就算高峰期也就偶尔加载慢一点,哪见过这种全平台 “集体罢工” 的情况?
对比之下,更能感受到这次全球宕机的严重性。受此影响,Cloudflare 股价当天就跌了 2.83%,接下来两天又接着小跌,三天累计蒸发不少市值,市场用脚投票表达了对这次故障的不满。
而且这次故障还挺 “反复横跳”,一开始系统一会儿能访问,一会儿又崩了。
后来才知道,是因为特征文件每五分钟更新一次,有的节点生成正确文件,有的生成错误文件,导致全网服务时好时坏,工程师一开始还误以为是遭到了大规模黑客攻击。
从另一个角度看,这次搞崩半个互联网的故障,原因简单到让人不敢信,完全不像科技巨头该犯的错。
事情的来龙去脉其实很简单:Cloudflare 的工程师想做个 “安全升级”,把数据库里公用的 “系统账号”,改成每个人专属的 “个人账号”,这样责任能更明确。
可谁能想到,这个看似无关紧要的操作,直接触发了系统里的 “老毛病”。
![]()
系统里藏着一段老代码,专门负责生成识别网络机器人的 “特征名单”—— 简单说就是区分 “真人” 和 “AI 爬虫” 的 “黑名单”。
以前这段代码只看一个数据库,没任何问题。这次权限一调整,它突然能看到另一个备份数据库了,而代码里没写 “只看其中一个”,结果把两个数据库的名单全扒了过来,名单直接翻倍。
更坑的是,Cloudflare 的核心转发软件有个死规定:为了保证速度,特征名单不能超过 200 条。
这个翻倍后的名单一推送到全球服务器,软件直接 “懵圈” 了 —— 读不完这么长的名单,触发了内存溢出保护,干脆直接 “罢工”,为了安全切断了所有网络连接。
![]()
我跟你讲,用大白话翻译一下就是:物业给保安换了副新眼镜,本意是让他看得更清楚。
结果眼睛度数不对,保安看黑名单时出现重影,100 人的名单看成了 200 人,保安 “脑容量” 不够直接 “死机”,最后把大楼门禁全锁了,不管是好人坏人都进不来。
其实修复起来一点都不复杂,工程师后来停止了错误文件的生成,换上了正确的特征文件,再重启核心代理,问题就解决了。
但就是这么一个小小的逻辑漏洞,让全球互联网付出了巨大代价,说它是 “草台班子操作” 都不为过。
![]()
而且这次故障还影响了不少关键服务:很多网站的登录验证框打不开,因为 Turnstile 服务崩了;开发者用的 Workers KV 工具也出问题,导致不少程序没法正常运行。
甚至电子邮件的垃圾邮件检测都受了影响,准确性下降了不少。
说句实在话,这次宕机看着是个技术失误,背后其实藏着 AI 时代的大隐患。导致崩溃的核心,是 Cloudflare 的 “机器人管理系统”,而它的主要对手,就是 2025 年到处都是的 AI 爬虫。
现在 AI 大模型训练需要海量数据,互联网上全是这些自动化的 “数据搬运工”,疯狂抓取各种信息。
Cloudflare 作为 “守门人”,只能不断升级防御系统,在特征名单里加各种判断标准 —— 比如鼠标怎么动、点击频率多少、IP 地址有没有异常,这些都叫 “特征”。
为了对付越来越狡猾的 AI 爬虫,特征名单越加越长,早就快逼近 200 条的上限了。这次的权限调整,不过是压垮骆驼的最后一根稻草。
更讽刺的是,受害者和 “始作俑者” 其实是同一批人:OpenAI、xAI 这些公司,一边派爬虫全网扒数据,逼着 Cloudflare 升级防御;一边又靠 Cloudflare 保护自己的服务,结果最后被防御系统的故障 “反杀”。
这就像为了防野兽,把城墙修得又高又厚,最后城墙自己塌了,把城里的人全埋了。咱们不得不面对一个现实:为了对抗 AI 的滥用,互联网基建变得越来越复杂,可越复杂就越容易出问题,脆弱性也越来越高。
![]()
不过这次也有 “用魔法打败魔法” 的正面例子。吴恩达团队反应超快,在宕机期间直接用 AI 复刻了 Cloudflare 的核心功能,让自家的相关服务很快就恢复了运行,堪称 AI 救场的典范。
还有个小插曲特别有意思,X 上有个叫 Rob Hallam 的网友发帖,自称是搞崩全球互联网的工程师之一,还调侃自己 “用一个正则表达式就让 20% 互联网瘫痪”。
网友们纷纷留言 “求开除这位大神”,算是这场灾难里的一点小笑点。
一场常规更新搞崩半个互联网,Cloudflare 的事故给所有人敲了警钟。
![]()
现在互联网对单一基建的依赖太深,而 AI 时代的攻防内卷,又让这些 “数字底座” 变得越来越复杂、越来越脆弱。
技术发展的本意是让生活更便捷,可如果基础打不牢,再先进的AI也得 “趴窝”。
未来 AI 只会越来越强,基建的稳定性就得跟上,不然下次可能就不是瘫痪几小时那么简单了。毕竟咱们现在的生活早就离不开网络,谁也不想再体验一次 “回到原始社会” 的黑暗时刻。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.