网易首页 > 网易号 > 正文 申请入驻

最危险AI只找到1个漏洞?神话破灭现场

0
分享至

Anthropic宣称Claude Mythos能"攻破所有主流系统和浏览器",但安全研究员翻遍漏洞数据库后只找到1个能确认关联的CVE。这个号称会"搞垮互联网"的模型,实际战绩可能不到40个——甚至可能为零。

神话制造现场:4月7日的宣言


4月7日,Anthropic发布Claude Mythos Preview时扔下一颗重磅炸弹。

官方声明称,该模型已发现并能开发针对零日漏洞(zero-day,即未公开、无补丁的安全漏洞)的利用代码,覆盖"所有主流操作系统和主流浏览器"。

Anthropic的警告措辞极为严厉:如果将这种"零日机器"向公众开放,将"造成大规模混乱并摧毁我们所知的互联网"。

解决方案是Project Glasswing——一个仅限约50家企业和机构参与的封闭测试计划。参与者名单堪称科技巨头全明星:AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks、英特尔,以及Anthropic自己。

逻辑很清晰:让大玩家们先用AI找出自家产品的漏洞,赶在坏人之前修复。

但三周过去,一个尴尬的问题浮出水面——到底找到了多少?

数据库掘地三尺:75条记录里的真相

VulnCheck研究员Patrick Garrity决定亲自查证。他检索了包含超过32.7万条记录的CVE数据库(通用漏洞披露数据库,安全行业的漏洞标准命名系统),搜索条件是"2月以来所有包含Anthropic字样的记录"。

结果:75条命中。

但细分后情况骤变。35条是Anthropic自身工具的漏洞——Claude Code、MCP Inspector及其第三方集成的问题。这些是Anthropic被攻击,而非Glasswing的攻击成果。

剩余40条确实归功于Anthropic或其关联研究员,但Garrity在博客中明确指出:"这些可能是Glasswing的发现,但我们无法保证。"

这40条的归属呈现三种模式:

• Anthropic核心研究团队
• 研究员Nicholas Carlini个人
• 独立安全公司Calif.io(运营"MADBugs"项目,即"AI发现漏洞月"),署名格式为"Calif.io与Claude及Anthropic Research联合"

按受影响厂商分布:Mozilla Firefox浏览器28个,嵌入式SSL/TLS库wolfSSL 9个,F5 NGINX Plus 1个,开源操作系统FreeBSD 1个,开源软件库OpenSSL 1个。

只有一个CVE能被"直接关联"到Glasswing项目本身。

唯一确认的战利品:FreeBSD漏洞

CVE-2026-4747,FreeBSD远程代码执行漏洞,是Garrity确认与Glasswing直接挂钩的孤例。

该记录署名"Nicholas Carlini与Anthropic Research联合"。Carlini是知名安全研究员,其个人GitHub显示他长期专注于AI安全与漏洞研究,并非Glasswing专属成员。

关键疑点在于:这40个CVE的署名方式混杂了多种合作模式。Calif.io的MADBugs项目明确是独立运营,其"与Claude及Anthropic Research联合"的表述,无法区分是使用了Mythos模型,还是仅借助Claude系列的其他工具。

Garrity的措辞极为谨慎——"可能""无法保证""直接关联"——反映出安全研究社区对Anthropic宣传口径的核实困境。

数字迷雾:为什么确认这么难?

CVE数据库的署名机制本身制造了混乱。

当多个实体协作发现漏洞时,记录通常列出所有参与方。但"Anthropic Research"这一署名可能指代:使用Mythos模型的Glasswing项目、使用早期Claude版本的研究、或Anthropic安全团队的人工审计。

更关键的是时间线错位。Anthropic 4月7日才宣布Mythos模型,但Garrity搜索的是"2月以来"的记录。这意味着部分CVE可能产生于模型正式发布前,使用工具链存在本质差异。

Glasswing的封闭性加剧了信息黑箱。50家参与者的测试范围、发现漏洞的披露节奏、Anthropic的审核流程——全部不对外公开。外界只能依赖CVE数据库这一滞后指标,而数据库更新本身就有数周延迟。

Garrity的调查方法也有局限。他只检索了"Anthropic"字样,但漏洞发现者可能选择不署名、或使用"Claude"等变体。然而考虑到Anthropic的品牌动机,重大发现不太可能刻意隐藏关联。

宣传与现实的落差:一场预期管理事故?

Anthropic的原始声明构建了极高的能力预期。"所有主流操作系统和浏览器"的覆盖声明,配合"摧毁互联网"的风险渲染,天然引发外界对漏洞数量的想象——数百?上千?

但安全漏洞发现存在结构性瓶颈。

零日漏洞的挖掘需要深度系统知识、特定环境配置、以及反复试错。AI可以加速模式识别和代码分析,但复杂漏洞链的构造仍依赖人类研究员的直觉与验证。Carlini的个人参与——而非纯AI自主发现——恰恰说明了这一点。

Glasswing的设计也限制了产出规模。50家参与者的封闭测试,每家可能仅投入有限资源;漏洞披露需经厂商协调,周期漫长;高危漏洞的修复优先级高于公开CVE编号。

更深层的问题在于比较基准的缺失。Anthropic从未承诺具体数字,"40个可能相关"在绝对值上并非微不足道——但相较于宣传话术的冲击力,这个规模显得苍白。

这类似于自动驾驶领域的"完全自动驾驶"承诺:技术演示的惊艳与规模化落地的艰难,之间存在一道认知鸿沟。

行业涟漪:AI安全研究的信任成本

Garrity的调查本身已成为事件的一部分。

作为VulnCheck的研究员,他的工作具有第三方审计性质。当AI公司宣称具备颠覆性安全能力时,社区需要可验证的证据链——而非仅依赖厂商自述。这种"证明负担"的转移,是AI安全领域成熟化的标志。

对Glasswing参与者而言,现状可能并不糟糕。封闭测试的价值在于提前修复漏洞,而非公开CVE数量。苹果、微软等厂商的沉默,或许意味着他们确实获得了有价值的发现,只是选择不披露。

但对行业观察者来说,Anthropic的激进话术正在产生反噬。每一次"摧毁互联网"级别的警告,若无法对应可量化的成果,都会消耗社区信任储备。这在竞争激烈的AI安全赛道尤为危险——OpenAI、Google DeepMind同类产品正在路上,它们的宣传策略将直接参照Anthropic的得失。

Calif.io的MADBugs项目提供了另一种叙事可能:独立安全公司+AI工具的协作模式,可能比单一厂商的封闭测试更具可持续性。其"AI发现漏洞月"的命名,暗示了将AI漏洞研究常规化、而非事件化的企图。

追问:我们究竟在测量什么?

这场争议暴露了一个根本性的评估困境。

如果Glasswing的核心价值是"防止漏洞被恶意利用",那么公开CVE数量本身就是次优指标——最好的结果是漏洞被静默修复、从未获得编号。但Anthropic选择了高调宣传模型能力,又拒绝提供可验证的数据,这种矛盾制造了信息真空。

Garrity找到的"1个确认关联",与Anthropic暗示的"大规模混乱"能力之间,差距足以容纳多种解读:是模型被过度包装?是测试时间不足?是漏洞披露流程的延迟?还是"发现漏洞"与"获得CVE编号"本就是两个不同维度?

安全行业的历史提供了参照。2016年,Google的Project Zero以激进的90天披露政策震惊业界,初期同样面临"制造恐慌"的批评,但其透明的流程和可验证的成果最终建立了权威。Anthropic正处于类似的信任建设窗口期,但封闭测试的设计使其难以复制这一路径。

当Mythos模型最终面向更广泛群体开放时,真正的考验才会到来。届时,漏洞发现的规模、质量、以及与其他AI工具的对比,将构成无法回避的硬指标。

而此刻,那个悬而未决的问题仍在发酵:如果最危险的AI安全工具在三周内只能确认找到1个漏洞,我们之前对"AI将颠覆网络安全"的预期,是否建立在了错误的能力假设之上?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不知不觉都老了,这两位演员已经不在了,你还记得他们吗?

不知不觉都老了,这两位演员已经不在了,你还记得他们吗?

阿废冷眼观察所
2026-04-11 17:02:28
特朗普,最新暗示!美伊谈判、霍尔木兹海峡,大消息!原油跳水,美股爆发!

特朗普,最新暗示!美伊谈判、霍尔木兹海峡,大消息!原油跳水,美股爆发!

证券时报e公司
2026-04-15 07:57:46
美国若敢玩火,中方就敢动手!外交部这次的一个表态,极不寻常

美国若敢玩火,中方就敢动手!外交部这次的一个表态,极不寻常

赵探长TALK
2026-04-16 12:49:00
从282群的录屏看,就是陈某汐!网友:全红婵说活着就好,我悟了

从282群的录屏看,就是陈某汐!网友:全红婵说活着就好,我悟了

开成运动会
2026-04-14 18:32:59
CBA又一巨人杀手!掀翻浙江后力挫江苏:福建为季后赛疯狂续命!

CBA又一巨人杀手!掀翻浙江后力挫江苏:福建为季后赛疯狂续命!

篮球快餐车
2026-04-17 02:18:56
一个30吨钢卷,滚出了2026最“重量级”的地狱笑话

一个30吨钢卷,滚出了2026最“重量级”的地狱笑话

果壳
2026-04-16 12:17:28
特朗普14日访华,普京随后到,遗憾拒在华会晤

特朗普14日访华,普京随后到,遗憾拒在华会晤

无情有思可
2026-04-16 13:40:56
台湾突然宣布,重磅决定!岛内数万人联名反对,郑丽文成众望所归

台湾突然宣布,重磅决定!岛内数万人联名反对,郑丽文成众望所归

丁丁鲤史纪
2026-04-16 17:19:11
洋洋总说马筱梅不听劝,曝其深夜痛哭内幕,准备搬家 张兰隔空表

洋洋总说马筱梅不听劝,曝其深夜痛哭内幕,准备搬家 张兰隔空表

杰丝聊古今
2026-04-16 22:36:43
零跑D19卖22万:谁给它的勇气?

零跑D19卖22万:谁给它的勇气?

摸鱼算法
2026-04-16 20:52:14
宝马捅破天了!以“车还没造,就路测几百万公里”的文案暗讽同行

宝马捅破天了!以“车还没造,就路测几百万公里”的文案暗讽同行

火山詩话
2026-04-16 06:54:55
反转来了,中方全面断供钨原料,日本作冒险决定,拒不还中国文物

反转来了,中方全面断供钨原料,日本作冒险决定,拒不还中国文物

米果说识
2026-04-16 22:08:59
惨败!6亿豪阵啊!输得太扎心了!又要重建了?

惨败!6亿豪阵啊!输得太扎心了!又要重建了?

篮球盛世
2026-04-16 12:36:36
探路“一人公司” 程序员“Yapie”炒股亏130万后 搭建出估值3000万AI社交+音乐平台

探路“一人公司” 程序员“Yapie”炒股亏130万后 搭建出估值3000万AI社交+音乐平台

中国经营报
2026-04-16 13:36:12
特朗普“反向封锁”霍尔木兹海峡,伊朗8000万人恐难撑过一个月

特朗普“反向封锁”霍尔木兹海峡,伊朗8000万人恐难撑过一个月

民间胡扯老哥
2026-04-14 06:00:51
美国性感女星:受够了胸罩!我不在乎这对香肠掉到膝盖

美国性感女星:受够了胸罩!我不在乎这对香肠掉到膝盖

可爱小菜
2026-04-16 19:03:27
抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

日落于西
2026-04-15 16:04:57
1985年,国安叛徒藏身南美,中国6名兵王万里锄奸,FBI颜面尽失

1985年,国安叛徒藏身南美,中国6名兵王万里锄奸,FBI颜面尽失

干史人
2026-04-14 21:10:03
山西省机关事务管理局原二级巡视员祁晓虎被开除党籍

山西省机关事务管理局原二级巡视员祁晓虎被开除党籍

界面新闻
2026-04-16 21:03:17
西媒:皇马想找声名显赫的教练而非少帅;卡马文加很可能离队

西媒:皇马想找声名显赫的教练而非少帅;卡马文加很可能离队

懂球帝
2026-04-17 02:12:14
2026-04-17 06:12:49
硅屿手记
硅屿手记
有态度网友ytd
2720文章数 11关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:美伊下次会晤可能在本周末举行

头条要闻

特朗普:美伊下次会晤可能在本周末举行

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

房产
手机
时尚
数码
本地

房产要闻

人人人人!封关后首届消博会,挤爆了!

手机要闻

OPPO Find X10:8000mAh超大电池+双2亿影像,中屏机皇实锤!

爆火的前额叶梗,让多少年轻人主动确诊「脑残」?

数码要闻

荣耀史上最短发布会,发布荣耀史上最强MagicBook数字系列

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版