网易首页 > 网易号 > 正文 申请入驻

Claude强到不敢发的Mythos,被质疑用了字节Seed技术

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI


Claude最强“神话”模型,可能用到来自字节的技术?

这条猜测直接冲上热搜榜。



这款“强到不敢公开发布”的Mythos模型,确实刺激了人们对下一代LLM架构的想象。

社区正在热烈讨论它是否采用了循环语言模型(Looped Language Model)架构。

这个概念来自字节Seed团队与多个高校合作的一篇论文,Yoshua Bengio也参与其中。



关键线索在于Anthropic公布的一组测试数据。

字节论文指出,图搜索是循环算法相比标准RLVR具有巨大理论优势的领域之一。

再看Mythos,正是在广度搜索优先的图搜索测试GraphWalks BFS中,超越对手GPT5.4最多。



80%对21.4%,接近4倍的差距。

在其他类型的任务上,并没有出现如此异常的分差。

说明这种进步很可能不是来自通用的Scaling Law,而是架构创新

循环语言模型:同一层”多转几圈”,小模型碾压大模型

GraphWalks BFS测试,就是给模型一个复杂的图结构,让它做广度优先搜索,从起点出发,一层一层地访问所有相邻节点。

标准Transformer处理这类问题只能一次前向传播,从头走到尾,输出结果,没有“迭代”这个概念。

Mythos在图遍历上拿到了80%的分数,表明它内部很可能在“”反复计算”,对同一组信息来回处理了好几遍。

那么什么样的架构能实现“反复计算”?

字节Seed团队在论文中提出LoopLM循环语言模型。



简单总结LoopLM有三个特点。

1、不写长文思考,在模型内部潜空间迭代,不额外输出更多token。

2、简单题少想几步,难题多想几步,自动调节。

3、预训练时就学 “怎么在潜空间思考”,而不是只学 “怎么预测下一个token”。

在实验中,团队训练了Ouro系列循环语言模型,内置了循环思考。



测试结果,1.4B的Ouro模型性能对标约4B的传统模型。2.8B的Ouro模型相当于8B–12B的传统模型。



至于循环模型的能力提升来自何处,论文详细分析了知识存储vs知识操作的区别。

知识存储(Knowledge Storage)的容量是有限的,大约每个参数2bits,不管用什么架构,这个数字基本不变。

循环也不会让你“记住”更多东西。

但知识操作(Knowledge Manipulation)不一样,把已知事实组合起来做多跳推理、执行程序、搜索图结构,这类能力随循环步数和训练tokens指数级增长。

换句话说,循环模型没有给AI一个更大的知识库,但它让AI在知识库库里的搜索和组合能力提升了一个量级。

那么Mythos究竟是不是循环模型架构,有人总结出除了GraphWalks之外的更多线索。



三条线索指向循环模型架构

第一条线索,也就是广度优先图搜索测试结果。

Mythos除了分数是GPT5.4的4倍,比上一代Opus提升幅度也异常大。



第二条线索,Anthropic报告Mythos每个任务使用的token数量是Opus4.6的1/5,但速度更慢

(价格也贵5倍!)

这在标准Transformer框架下很难说得通,token少,生成步骤就少,应该更快才对。

但循环模型刚好解释了这个矛盾:推理不发生在token层面,而是发生在潜空间,计算量花在了看不见的地方。

线索三,Mythos在网络安全方面非常突出。

Mythos在CyberGym测试上拿到83.1%,Opus4.6是66.6%,领先近17个百分点。

以及找到上千个零日漏洞,主流操作系统和浏览器全都没逃过。

漏洞发现的本质就是对控制流图做遍历。找到一条从输入到危险函数的路径,也就是图的可达性问题。

又是图遍历。又是循环架构的天生强项。

说了这么多,终归只是大家的猜测,Anthropic没有公开任何关于Mythos架构的信息,很可能以后也不会公开。

但有一句话值得思考:

Scaling Law改善一切,相对均匀,架构创新在匹配其归纳偏置的任务上创造异常尖峰值。



循环Transformer的归纳偏置就是迭代图算法。Mythos的异常尖峰,恰好出现在图遍历任务上。

Anthropic不说,但测试数据已经替它说了。

字节论文:
https://arxiv.org/abs/2510.25741

参考链接:
[1]
https://x.com/ChrisHayduk/status/2042711699413926262
[2]
https://aiia.ro/blog/claude-mythos-looped-language-model-theory

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曼城花1.2亿买的后腰,评分比替补门将还低3分

曼城花1.2亿买的后腰,评分比替补门将还低3分

热血体育社
2026-04-13 16:27:58
美股期指全线跳水,芯片股盘前下挫,金银下跌,霍尔木兹海峡又有新消息

美股期指全线跳水,芯片股盘前下挫,金银下跌,霍尔木兹海峡又有新消息

台州交通广播
2026-04-13 20:05:40
4月26日起,北京又一大型商场暂停营业!

4月26日起,北京又一大型商场暂停营业!

美丽大北京
2026-04-12 21:54:29
比土木更难就业的专业出现了:全班同学都没签三方,辅导员被气晕

比土木更难就业的专业出现了:全班同学都没签三方,辅导员被气晕

黯泉
2026-04-11 15:57:13
抢走王朔,睡遍京圈,定居国外多年的“坏种”徐静蕾,成最终赢家

抢走王朔,睡遍京圈,定居国外多年的“坏种”徐静蕾,成最终赢家

橙星文娱
2026-04-13 11:46:44
掀掉洋葱顶,整治宗教泛滥的第一步

掀掉洋葱顶,整治宗教泛滥的第一步

黑哥讲现代史
2026-03-14 15:46:38
38岁老板娘沦为陪睡工具:揭秘黑茶高端骗局,入局者10有9个离婚

38岁老板娘沦为陪睡工具:揭秘黑茶高端骗局,入局者10有9个离婚

云景侃记
2026-02-12 22:21:30
国内套现7个亿后,她露出了身后的美国国旗,整个家族共套现20亿

国内套现7个亿后,她露出了身后的美国国旗,整个家族共套现20亿

阅微札记
2026-04-13 19:43:44
三观炸裂!翟欣欣出轨聊天记录流出,尺度大到咂舌,判12年都嫌少

三观炸裂!翟欣欣出轨聊天记录流出,尺度大到咂舌,判12年都嫌少

有范又有料
2025-09-29 14:21:11
第四届烂柯杯首轮七盘中韩战 王世一VS卞相壹马靖原挑战申真谞

第四届烂柯杯首轮七盘中韩战 王世一VS卞相壹马靖原挑战申真谞

劲爆体坛
2026-04-13 19:13:47
又一起吃他汀猝死!医生再三提醒:春季吃他汀的人,要警惕这4点

又一起吃他汀猝死!医生再三提醒:春季吃他汀的人,要警惕这4点

岐黄传人孙大夫
2026-04-13 14:10:03
当年一个师长一个排长,28 年后师长成为上将,排长却成为了大将

当年一个师长一个排长,28 年后师长成为上将,排长却成为了大将

云霄纪史观
2026-04-12 18:11:35
包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,孙道存有多放荡

包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,孙道存有多放荡

云景侃记
2026-03-15 22:05:44
上午10点!北京国安做出重要决定:申诉廖力生手球+韦世豪逃红牌

上午10点!北京国安做出重要决定:申诉廖力生手球+韦世豪逃红牌

球场新视角1号
2026-04-13 10:48:49
三位中国象棋特级大师遭终身禁赛重罚,世界冠军蒋川被禁赛五年

三位中国象棋特级大师遭终身禁赛重罚,世界冠军蒋川被禁赛五年

米修体育
2026-04-13 13:57:57
美媒预测:第三次世界大战可能在5个地点爆发,2个在中国家门口

美媒预测:第三次世界大战可能在5个地点爆发,2个在中国家门口

说宇宙
2026-04-11 09:15:03
2000吨英国潜艇消失,我国暗中打捞拆解研究,39年后首相却上门讨要

2000吨英国潜艇消失,我国暗中打捞拆解研究,39年后首相却上门讨要

睡前讲故事
2026-03-30 13:48:58
中国女篮官宣19人集训名单:韩旭李月汝领衔 张子宇杨舒予在列

中国女篮官宣19人集训名单:韩旭李月汝领衔 张子宇杨舒予在列

醉卧浮生
2026-04-13 19:16:50
特朗普威胁若中国为伊朗提供军事装备将加征50%关税,外交部回应

特朗普威胁若中国为伊朗提供军事装备将加征50%关税,外交部回应

极目新闻
2026-04-13 15:50:01
卫星化学股价再创新高

卫星化学股价再创新高

每日经济新闻
2026-04-13 13:34:26
2026-04-13 21:08:49
量子位 incentive-icons
量子位
追踪人工智能动态
12466文章数 176449关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

媒体:欧尔班败选不仅是一国之事 牵扯到与中国的关系

头条要闻

媒体:欧尔班败选不仅是一国之事 牵扯到与中国的关系

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

今夜,出大事了,3种结果

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

本地
艺术
数码
时尚
健康

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

艺术要闻

22位中国当代名家油画作品

数码要闻

前行者推32kHz回报率磁轴键盘ES68破晓,预售到手低至699元

“小红鞋”今年春夏又火了!这4双怎么搭都好看

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版