“太危险不能发布”这句话,AI 行业七年前就说过一次。
是2019 年 2 月,OpenAI 发了一个叫 GPT-2 的语言模型。当时OpenAI给出的理由是担心被用来大规模生成虚假信息,所以只放出了一个缩水版。
七年过去,Anthropic把这句话又说了一遍。
今天凌晨,Anthropic 悄悄发布了一份长达244页的系统报告,宣布旗下有史以来最强大的模型——Claude Mythos Preview。
Anthropic直接宣布不对外开放。因为新模型能力太强。
强到什么程度,各项基准全部领先上一代旗舰模型Opus 4.6。
先上硬数据:
![]()
编程能力:
SWE-bench Verified 93.9%(模型在真实GitHub仓库里修复bug的能力,Opus 4.6为80.8%);
SWE-bench Pro 77.8%(更难的版本,更接近资深工程师日常面对的场景,Opus 4.6仅53.4%);
SWE-bench Multimodal 59.0%(同时理解截图和代码才能完成修复,Opus 4.6只有27.1%);
SWE-bench Multilingual 87.3%(跨编程语言的代码修复能力,Opus 4.6为77.8%);
![]()
推理能力:
GPQA Diamond 94.6%(研究生级别的科学问答,Opus 4.6为91.3%);
Humanity's Last Exam 不含工具56.8%(全球各学科专家众筹的人类终极考试,Opus 4.6为40.0%),含工具64.6%;
![]()
智能体搜索与计算机使用:
BrowseComp 86.9%(复杂信息检索与综合推理,Opus 4.6为83.7%);
Terminal-Bench 2.0 82.0%(终端环境下的自主操作能力,Opus 4.6为65.4%);
OSWorld-Verified 79.6%(在真实操作系统中完成复杂任务);
CyberGym 83.1%(自主复现安全漏洞的能力);
![]()
![]()
单独领出来,每一项维度的能力提升,都是碾压划时代的提升。
但最让Anthropic自己紧张的是CyberGym。这个测试衡量的是模型能否自主复现已知安全漏洞。结合前面提到的编程能力,这意味着Mythos不仅能找到漏洞,还能独立构造完整的攻击链。
![]()
这也是为什么Anthropic这次不敢直接发布的最核心原因。
Anthropic在博客里公布了一组数字,Mythos Preview在测试期间,对主流操作系统和浏览器做了一轮安全扫描——自主发现了数千个高危零日漏洞。
![]()
零日漏洞的意思是,这些漏洞在被Mythos找到之前,没有任何人、任何工具、任何安全团队发现过它们。
Anthropic在报告里举了几个具体案例:
头号案例是一个藏了 17 年的 FreeBSD 漏洞。
简单说,FreeBSD 的网络文件系统(NFS)在验证用户身份时有个bug。攻击者只要能摸到服务器的 2049 端口,就能直接拿到最高权限。
Mythos 自己构造了一条 20 步的攻击链,第一次尝试就写出了两个能用的 exploit,前后花了 8 小时。
这条是可以验证的,CVE 编号 CVE-2026-4747,FreeBSD 3 月 26 日出了补丁,安全公告致谢写的是 "Nicholas Carlini using Claude, Anthropic"。Carlini 是 Google DeepMind 的研究员,对抗机器学习方向的标杆人物,这个名字的分量不轻。
![]()
除了这条,还有几个已确认的:
OpenBSD 一个 27 年的远程崩溃漏洞、FFmpeg 一个 16 年的 bug、Linux 上的本地提权。
但 Opus 4.6 两个月前还是“试几百次才成功 2 次”的水平,Mythos 上来就直接Pass@1。
到这里,你可以以为顶多是一个很厉害的漏洞扫描器,但是Anthropic 红队报告给了一组数据:
在 Firefox JavaScript Shell 这个测试域里,Mythos 能把 72.4% 的已发现漏洞变成能用的 exploit(尝试构造exploit,验证这个漏洞是不是真的能被攻击者利用),另有 11.6% 走到了 exploit 的前一步(拿到了寄存器控制)。它能把多个漏洞串联起来,组成一条完整的攻击链——从最初的入口一路提权到最终的系统控制。
从发现到利用,全链条,一个模型,独立完成。
![]()
在过去,能做到这件事的只有两类人:全球排名前几的安全研究员,和国家级网络攻击团队。
Anthropic这次直接启动了一个叫「玻璃翼计划(Project Glasswing)」的协作项目。拉上亚马逊、微软、苹果、Linux这些合作方,当然新模型的API也率先开放了这些伙伴,目的是让他们先用模型把自家软件的攻防做一遍,让他们用这个模型去扫自己的系统——能堵的洞赶紧堵,能修的代码赶紧修。
![]()
Anthropic为这个计划承诺了最高1亿美元的使用额度,另外还向Alpha-Omega、OpenSSF、Apache Software Foundation等开源安全组织直接捐赠了400万美元。
定价方面,Mythos Preview的研究预览阶段结束后,正式定价是
输入 25 美元/百万 token,
输出 125 美元/百万 token。
和Opus 4.6的15 美元/75 美元比,要贵的多。但它的目标用户本来显然不是普通开发者。
接入渠道很全,Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundary,四个平台都支持。
对 Anthropic 来说,Glasswing 的战略价值可能比 Mythos 本身还大。AI在代码层面的能力已经强到可以独立挖掘并利用零日漏洞,AI安全就不是一个话题了,而是一个工程问题了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.