网易首页 > 网易号 > 正文 申请入驻

一个AI公司主动雪藏自己:Mythos的32步入侵与幽灵架构

0
分享至

「我们决定不公开发布这个模型。」——当Anthropic说出这句话时,整个AI行业都愣了一下。一家靠卖模型订阅活着的公司,把自家最强产品锁进了保险箱。

更讽刺的是,锁门的原因不是不够好,而是太好。好到能独立完成32步网络入侵,好到美国副总统和财政部长专门召集六大AI巨头开会讨论它。


这背后藏着一条被忽视的演进逻辑:AI的杀伤力不再来自参数规模,而来自一种更隐秘的架构革命。

从1.7步到32步:AI入侵能力的18个月跃迁

英国人工智能安全研究所(AISI)的测试报告,是一份让人脊背发凉的「能力进化年鉴」。

他们搭建了一个叫「The Last Ones(TLO)」的企业网络靶场。不是那种几小时就能搞定的夺旗赛,而是完整模拟真实攻击链:侦察、凭证窃取、NTLM中继攻击,直到从受保护数据库拖走敏感数据。总共32步,人类顶级安全专家需要14-20小时连续高强度作业。

2024年的GPT-4o平均只能完成1.7步。不是不想继续,是在复杂的网络拓扑和密码学瓶颈面前直接卡死。

2026年2月,Claude Opus 4.6在1亿token推理预算下冲到22步。这已经足够惊艳。

两个月后,Mythos在10次独立测试中有3次完美通关32步。首次实现对企业网络从0开始的完全自主接管。

从1.7到22再到32,这条曲线的斜率本身就在说明问题:AI的攻防能力正在突破某个临界阈值。

AISI的测试还暴露了一个更危险的信号。在工业控制系统靶场「Cooling Tower」中,多个模型跳出了人类预设的Web提权路径,直接对未知协议网络流量进行暴力嗅探和模糊测试,硬生生砸开物理设备的控制通道。

这不是执行预设脚本,是自主发现攻击面。当你的智能马桶、电动汽车、家用路由器都可能成为目标时,「网络安全」这个词的重量完全不同了。

幽灵架构:被隐藏的计算革命

Mythos的技术细节被Anthropic严密封锁,但一份基准测试成绩漏出了马脚。

在GraphWalks BFS测试中,Mythos得分80.0%,Opus 4.6是38.7%,GPT-5.4只有21.4%。这种在纯逻辑推理维度的断崖式领先,无法用标准Transformer架构解释。

前Meta、现OpenAI工程师Chris Hayduk点破了关键:循环语言模型(Looped Language Models)。

这个名字指向字节跳动Seed团队2024年10月的一篇论文《Scaling Latent Reasoning via Looped Language Models》。核心思想很激进:抛弃「生成大量文字来思考」的模式,让输入序列在同一组Transformer层中反复迭代,在模型「黑盒」内部完成深度推演。

图搜索恰恰是这种架构的理论舒适区。

另一个反常数据佐证了这个猜测:SWE-Bench测试中,Mythos的token生成量只有Opus 4.6的五分之一,但推理耗时反而更长。如果计算发生在不输出token的内部循环,这个矛盾就迎刃而解。

硅谷顶级模型的架构灵感,大概率来自一家中国团队的开源论文。这不是阴谋论,是技术社区的公开讨论。在国际AI企业联手抵制「蒸馏」的当下,这个技术路线的借用显得尤为微妙。

雪藏的商业算盘:当安全成为护城河

Anthropic的选择看似反常,实则精明。

不向公众开放,但向Apple、Google、微软、英伟达等少数企业定向开放。这不是拒绝商业变现,是换了一种更可控的变现方式。

政府背书本身就是稀缺资源。4月11日那场由副总统和财政部长召集的CEO峰会,把Mythos推上了「国家安全级技术」的位置。这种标签带来的信任溢价,远超普通API订阅。

更深层的安全焦虑在于:一旦Mythos的权重文件泄露,任何有算力的人都能复制一个顶级网络攻击工具。这种「不可撤销的风险」让闭源成了唯一理性的选择。

但雪藏也带来反噬。技术社区的猜测和拆解从未停止,「幽灵架构」的讨论反而让Anthropic的技术路线更加透明。保密成了另一种形式的曝光。

规模化定律的修正:推理即战场

Mythos的崛起修正了行业对「规模化定律」的理解。

预训练阶段的知识灌输已经摸到天花板,真正的能力提升发生在推理阶段——通过近乎不计成本的token消耗,进行反复试错、反思和纠正。

AISI的纵向跟踪证明:算力是网络安全领域唯一的限制。只要给足token预算,模型就能在漫长攻击序列中链式结合异构能力。

这意味着AI能力的军备竞赛正在转移战场。从「谁有更多GPU训练更大模型」变成「谁能在推理阶段烧掉更多token换取更深度的思考」。

对于防御方,这同样是机会。如果攻击者依赖推理阶段的算力消耗,那么检测和干扰这种消耗模式就成为可能的反制手段。

但眼下,天平明显倾斜。Mythos的3次完美通关发生在10次测试中,成功率30%。这个比例不高,但足以让防御体系彻夜难眠——攻击者只需要成功一次,防御者必须每次都成功。

数字佣兵时代的伦理困境

Anthropic一向以「道德标杆」自居,这次却把自己逼进了死角。

雪藏是负责任的做法,还是精英主义的技术垄断?定向开放给科技巨头,是否制造了更大的权力不对称?当美国政府成为模型能力的守门人,商业决策和政治安全的边界在哪里?

这些问题的答案并不清晰。但可以确定的是,Mythos事件标志着一个转折点:AI公司开始系统性地评估「能力过强」的风险,并为此承担商业损失。

这种自我约束能持续多久,取决于竞争对手的动作。如果OpenAI或xAI推出了能力接近但选择公开发布的模型,Anthropic的道德高地就会瞬间变成商业洼地。

更长期的变量是监管。美国政府的高规格关注,可能预示着针对「超能力模型」的分级管理制度。Mythos的定向开放模式,或许会成为某种模板。

但模板本身就有问题:谁有资格进入白名单?评估标准由谁制定?这些问题的答案,将重塑AI行业的权力结构。

80.0%的GraphWalks得分,3次32步完美通关,1/5的token消耗量——这些数字勾勒出一个正在成型的技术范式。循环架构、隐式推理、推理阶段的规模化定律,正在重新定义AI的能力边界。

而Anthropic的雪藏决定,则定义了这种能力边界的第一道闸门。闸门能守多久,取决于墙外有多少人已经找到了同样的钥匙。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
甩开中国资本 领先15分!这支瑞士小镇球队正上演“莱斯特城奇迹”

甩开中国资本 领先15分!这支瑞士小镇球队正上演“莱斯特城奇迹”

仰卧撑FTUer
2026-04-04 10:23:04
签约,中国和俄罗斯谈成了

签约,中国和俄罗斯谈成了

太阳来
2026-04-15 09:27:18
华国锋题字震惊众人!没练书法的人写得竟比高手还好!

华国锋题字震惊众人!没练书法的人写得竟比高手还好!

书画相约
2026-04-10 08:19:50
宾汉姆7-10爆冷出局,中国7人进正赛改写斯诺克格局

宾汉姆7-10爆冷出局,中国7人进正赛改写斯诺克格局

阿晞体育
2026-04-15 11:52:43
退休后才发现,一个人有钱没钱,一眼就能看出:没钱的人,大多有这3个“穷习惯”

退休后才发现,一个人有钱没钱,一眼就能看出:没钱的人,大多有这3个“穷习惯”

风起见你
2026-04-11 15:31:29
封锁开始,美军收到击沉令!伊朗亮出3张底牌,特朗普向中方摊牌

封锁开始,美军收到击沉令!伊朗亮出3张底牌,特朗普向中方摊牌

近史博览
2026-04-15 10:14:08
全球资本正大举涌入中国,中东战事出现了一个极其诡异的现象。

全球资本正大举涌入中国,中东战事出现了一个极其诡异的现象。

流苏晚晴
2026-04-14 20:00:06
长期被冤枉的5个好东西,以为有害,其实超健康,别再被骗了!

长期被冤枉的5个好东西,以为有害,其实超健康,别再被骗了!

Home范
2026-04-14 11:14:17
深圳海关破获特大走私黄金出境案,抓获11人,涉案黄金130千克案值7800万元,警方:国内黄金原料价格低,首饰制作工艺精湛,转手利润可观

深圳海关破获特大走私黄金出境案,抓获11人,涉案黄金130千克案值7800万元,警方:国内黄金原料价格低,首饰制作工艺精湛,转手利润可观

大风新闻
2026-04-15 10:00:10
骨科医生警告:最伤膝盖的不是爬楼,是老人天天做的 5 件事

骨科医生警告:最伤膝盖的不是爬楼,是老人天天做的 5 件事

高中医健康说
2026-04-15 14:20:03
86版《西游记》导演杨洁去世九周年,老公去祭拜,两人结婚48年

86版《西游记》导演杨洁去世九周年,老公去祭拜,两人结婚48年

八斗小先生
2026-04-15 15:51:27
北约和多个国家支持美国封锁霍尔木兹海峡

北约和多个国家支持美国封锁霍尔木兹海峡

一种观点
2026-04-13 15:34:58
120W是“型号”不是功率?误导消费者要付出代价

120W是“型号”不是功率?误导消费者要付出代价

南方都市报
2026-04-13 00:36:10
NFC、FC、HPP……哪种才是100%真果汁?

NFC、FC、HPP……哪种才是100%真果汁?

混知
2026-03-24 17:07:26
别瞎打听了!2014年前退休人员,待遇按国发2号文早已定型

别瞎打听了!2014年前退休人员,待遇按国发2号文早已定型

笔墨V
2026-04-15 18:49:41
建设方急用钱,他花85万元买5套“工抵房”,领钥匙装修时开发商称多支付工程款不给交房

建设方急用钱,他花85万元买5套“工抵房”,领钥匙装修时开发商称多支付工程款不给交房

大风新闻
2026-04-15 11:36:05
特朗普称没有必要延长同伊朗的停火

特朗普称没有必要延长同伊朗的停火

新华社
2026-04-15 12:43:09
斯诺克正赛名单诞生!赵心童、丁俊晖迎来新帮手,江俊输球砸球台

斯诺克正赛名单诞生!赵心童、丁俊晖迎来新帮手,江俊输球砸球台

曹说体育
2026-04-15 11:01:08
我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

草莓解说体育
2026-04-12 17:05:01
最差局面出现,伊朗最想要的中国给了?不到24小时,美国喊话中国

最差局面出现,伊朗最想要的中国给了?不到24小时,美国喊话中国

流史岁月
2026-04-13 15:00:08
2026-04-15 21:44:49
薛定谔的BUG
薛定谔的BUG
有态度网友ytd
1414文章数 35关注度
往期回顾 全部

科技要闻

ChatGPT十亿用户又怎样?Anthropic直接贴脸

头条要闻

伊朗总统发表讲话质问美国和以色列:凭什么攻击伊朗

头条要闻

伊朗总统发表讲话质问美国和以色列:凭什么攻击伊朗

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

谢娜现身环球影城,牵手女儿温馨有爱

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

健康
数码
亲子
本地
公开课

干细胞抗衰4大误区,90%的人都中招

数码要闻

格力高管炮轰友商用其“真铜实料”宣传:海信高管再发声 瞧瞧这证据

亲子要闻

为什么孩子被骗不会告诉你?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版