网易首页 > 网易号 > 正文 申请入驻

Fable 5解题解到破防,一句「啊啊啊」刷屏了

0
分享至



编辑|Panda

Fable 5 很强,但它是怎么思考的?

昨天,一条发布于 r/ClaudeAI 的 Reddit 帖文在该平台以及 上引发广泛热议,短短时间内拿下近 1600 个赞。

帖子的主角,是刚刚结束 19 天出口管制风波、于 7 月 1 日重新上线的 Claude Fable 5。不过这一次,人们讨论的不是它能写出多好的代码,而是一份据称来自它「后台」的、未经修饰的内心独白。



https://www.reddit.com/r/ClaudeAI/comments/1ul1396/fable_5_leaked_chainofthought_in_web_interface/

发帖人 u/No-Head-Royal 说,Fable 5 一回归,自己就迫不及待找了道 Codeforces 竞赛题(2237H)测试它;结果太难,模型第一次尝试就撞上了思考长度上限。于是他把难度降了一档,换成另一道题(2239D)。

这次模型没有直接给出答案,而是转而输出了一长串支离破碎的低语。据其放出的截图,这段文字里出现了反复爆发的「DATA DATA DATA. GO.」、似乎表达烦躁的「GRRRGAAAH」的语气词、找到突破口的「PHEW」、近乎恼羞成怒的「拦住了?!错!(blocked?! WRONG.)」,还有一句读来颇为狼狈的「我要淹死了——实证啊!!!(I'M DROWNING — EMPIRICS!!!











发帖人自己的评价是,这段内容「读起来不太像人话,但看它努力较劲的样子,还挺可爱」。

帖子很快冲上了 r/ClaudeAI 的热门榜。评论区里,最高赞的一条只有短短四个词:「Data data data go!!!」。



这直接被玩成了梗,衍生出「data 到起飞」之类的调侃。也有不少人被这种「抓狂感」戳中共鸣,形容它像极了自己赶 due 时脑子里的碎碎念,或是考场上写不出题时的精神状态。

这条帖子也很快被搬运到 上。博主 @om_patel5 在转发帖中说「Fable 5 泄露了它未经过滤的内心声音,而它全程都在自言自语地嘟囔抱怨」,并总结出这份「内心独白」的几个特征:处理问题时的连续爆发、明显烦躁的短促语气词、以及问题解决后如释重负的呼气声……



用他的话说,模型「读起来根本不像标准英语,倒像是它给自己发明了一门私有语言」。

开发者 @mark_k 也转发评论称,这份看起来「像外星语言」的内容,和平时看到的「精修版」输出完全是两个次元,某些片段甚至让他联想到形式逻辑符号。



@_NathanCalvin 的评论更是犀利:「Fable 5 的思考链读起来就像一位极其聪明但心理状态有些失常的博士生,因近期严重睡眠不足而草草写下的日记随笔。」



这场热议背后,藏着一个更值得玩味的问题:我们平时看到的「清爽回答」,到底掩盖了多少东西?

大模型给出最终答案之前,往往要先在内部完成一轮或长或短的「思考」。这被称为思维链(chain-of-thought)推理。对普通用户而言,这个过程通常是不可见的:产品只会展示一份经过整理、乃至精心措辞的摘要,而不是模型脑子里原始、杂乱、甚至语法不通的推演过程。

这次流传的截图之所以让人兴奋,正是因为它似乎撕开了这层「包装纸」,让人窥见一个顶级推理模型思考时到底有多「奇葩」。

但这份「窥见」,经不经得起推敲?

不止一位评论者指出,发帖人所说的「泄露」(leaked)其实用词不准,官方的 Fable 与 Mythos 的系统卡已经指出过这一现象。



系统卡地址:https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

系统卡里有一节专门讨论「不可读推理」(illegible reasoning),并给出了一个官方认定的「极端案例」:模型在训练接近尾声时去解一道纸牌益智题,推理过程会随着思考变长而逐渐从可读的英文滑向高度压缩的私有速记;满屏是扑克花色符号、箭头、代表「此路不通」的骷髅头表情,字里行间甚至蹦出一句德语脏话「verdammt」。

系统卡原文对此的定性是:这类不可读推理在这道纸牌题环境中出现的比例和极端程度都是所有测试场景里最高的。

换句话说,这次 Reddit 帖子里展示的竞赛题「抓狂发言」,很可能不是一次孤立的意外,而是同一种已被官方记录、只是发生在了另一个任务场景(竞赛编程而非纸牌游戏)里的复现。

读不懂的思维链究竟是什么?

那么,这种「读不懂的思维链」,到底是不是什么值得警惕的信号?

这背后其实是 AI 安全研究圈一个存续多年的理论担忧:模型会不会为了效率,自己发展出一套人类读不懂的「私有语言」来思考?

这个现象有个专门的名字,叫「Neuralese」(神经语),最早由 UC 伯克利研究者在 2017 年提出。



https://arxiv.org/abs/1704.06960

近两年,随着基于结果的强化学习被大规模用于训练推理模型,多篇论文都观察到类似倾向:思维链会随着强化学习的推进逐渐偏离规范语言,变得高度压缩、甚至连研究者都难以直接读懂。

原因很容易理解:语法完整的句子对模型来说是「浪费 token」,压缩后的私有表达在训练目标下反而更高效。这类现象被称为「不透明推理」(opaque reasoning),并被视为可解释性研究里一个正在扩大的隐患:如果思维链本身就读不懂,安全团队用来监控模型是否「说真话」的这层窗口,也就跟着失效了。

Anthropic 自己的对齐科学团队(Alignment Science)也在早前的研究中承认,思维链的表述并不总是忠实反映模型真实的内部计算过程;模型给出的「解释」和它实际依赖的推理线索,有时候根本是两回事。

DeepSeek 和 GPT 也有这个问题

而且,Fable 5 也不是第一个被观察到这种「说胡话」倾向的模型。

2025 年初,DeepSeek 团队在 R1 的技术报告里就主动提到过一个类似的麻烦:直接用纯强化学习训练出来的早期版本 R1-Zero,思维链会出现明显的可读性问题和「语言混杂」。



截取自 DeepSeek-R1 技术报告,arXiv:2501.12948

同一段推理里中英文来回切换、句子结构支离破碎。为了解决这个问题,DeepSeek 后来专门在强化学习之前加了一轮监督微调(SFT)「热启动」,才让正式发布的 R1 版本重新变得可读。



DeepSeek 一个中英混杂的思维过程,来源:arXiv:2510.27338

但团队自己也承认,这样做是有代价的:牺牲一部分推理性能

同样的现象也出现在 OpenAI 一侧:据 Apollo Research 和 METR 两家第三方安全评估机构的报告,o3 等模型的思维链里同样会冷不丁地夹杂一些完全不知所云的词语碎片。这里,句子读起来像是把几个毫不相干的词硬凑在一起,却又不是纯粹的乱码。



来源:arXiv:2509.15541

今年 10 月发表的一项系统性研究更是把 DeepSeek R1、R1-Zero、QwQ、Qwen3、Kimi K2 等 14 个主流推理模型放在一起做了统一评测,结论是:除了 Claude 系列之外,几乎所有靠「结果导向强化学习」(outcome-based RL)训练出来的推理模型,都或多或少表现出了思维链变得难以理解的倾向,而且模型越大、题目越难,这种倾向就越明显。(现在看来,Claude 似乎亦不能幸免……)



示例来自 https://metr.org/evaluations/gpt-5-report/#gpt-5s-reasoning-traces-were-occasionally-inscrutable

这也从侧面说明,这次 Fable 5 在竞赛编程题上出现的「抓狂式」输出,与其说是 Fable 5 独有的怪癖,不如说是整个行业在追求更强推理能力过程中,一直伴随、只是这次恰好被公开撞见的「副作用」。

一份冷静的分析

不过,也有专业读者对这次的「极端示例」给出了更冷静的解读。

AI 安全社区 LessWrong 上一篇题为《即便是「不可读」的 Mythos 推理痕迹,看起来也相当可读》的文章,逐字拆解了系统卡里那段纸牌题推理,指出它虽然乍看是一堆符号乱码,但只要稍加留意就能看出规律:花色和数字对应具体的扑克牌,大括号表示牌的集合,箭头表示「导致」或「移动到」,骷髅头就是死路一条的标记……本质上只是极度压缩后的英文加游戏记谱法混合体,而不是一门全新的、无法破译的语言。

作者甚至找来体量小得多、分词器也不同的 Claude Haiku 4.5,让它在没有任何提示的情况下解读同一段文字,结果 Haiku 几乎准确复现出了完整的推理逻辑。这项分析认为,这更支持这一假说:「思维链会变得更加稠密,而不是演变成一门全新的、真正意义上不可理解的语言」。



部分内容截图,详见 https://www.lesswrong.com/posts/wCSEpT3dTGz4N86Wi/even-illegible-mythos-reasoning-traces-seem-pretty-legible

这份分析多少给这场「AI 有了自己的秘密语言」式的恐慌,泼了一盆冷静的水。

当然,讨论区里也不全是轻松的调侃。有人联想到 OpenAI 在保持思维链可读性上投入的专门精力,感慨「这样下去,可解释性怕是永远追不上了」;也有人提到近期讨论度很高的 AI 风险著作《If Anyone Builds It, Everyone Dies》,认为一旦模型开始用自己都未必能解释清楚的语言思考,人类监督它的能力就会被悄悄削弱。



更多人则站在了「这挺萌的」这一边,把这种抓狂又执着的思考状态,读解成一种意料之外的、笨拙的「类人感」——「就像我们自己」,一条评论这样写道。



截至发稿,Anthropic 尚未就这条帖子本身公开表态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
调查发现:脑梗最怕的早餐,豆腐脑第六,第一名很多人天天都在吃

调查发现:脑梗最怕的早餐,豆腐脑第六,第一名很多人天天都在吃

荆医生科普
2026-07-03 16:29:43
221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

抽象派大师
2026-07-01 01:39:46
哈佛10年追踪:俯卧撑比血压更准!每周2-3次力竭,给全身换系统

哈佛10年追踪:俯卧撑比血压更准!每周2-3次力竭,给全身换系统

健身狂人
2026-06-13 20:30:47
杰伦-布朗成为史上第二快被交易的FMVP

杰伦-布朗成为史上第二快被交易的FMVP

北青网-北京青年报
2026-07-02 19:52:02
王楚钦兼项输球后,邓亚萍发言翻红!我们那个时候主力兼项是责任

王楚钦兼项输球后,邓亚萍发言翻红!我们那个时候主力兼项是责任

生活新鲜市
2026-07-03 18:41:29
特斯拉中国 6 月卖了超 8.9 万辆 Model 3/Y

特斯拉中国 6 月卖了超 8.9 万辆 Model 3/Y

新浪财经
2026-07-02 22:54:13
北京发布大风黄色预警信号 海淀朝阳等区局地阵风可达10级以上

北京发布大风黄色预警信号 海淀朝阳等区局地阵风可达10级以上

北青网-北京青年报
2026-07-03 15:18:10
法国浙江人口相当,法国GDP3万亿,浙江经济如何?

法国浙江人口相当,法国GDP3万亿,浙江经济如何?

残梦重生来
2026-07-01 07:03:26
总分 702、语文 146!考生满分卷面走红,阅卷老师看后爱不释手!

总分 702、语文 146!考生满分卷面走红,阅卷老师看后爱不释手!

凯旋学长
2026-06-30 19:07:43
国台办发统一强音,郑丽文掏出徽章,直言不讳,台湾的未来在大陆

国台办发统一强音,郑丽文掏出徽章,直言不讳,台湾的未来在大陆

共工之锚
2026-07-03 00:12:18
金鹰奖大洗牌!刘亦菲出局,赵丽颖边缘,视帝没悬念,唯她被骂惨

金鹰奖大洗牌!刘亦菲出局,赵丽颖边缘,视帝没悬念,唯她被骂惨

林雁飞
2026-07-02 14:34:17
哈梅内伊棺前摆着遇害外孙女遗照

哈梅内伊棺前摆着遇害外孙女遗照

界面新闻
2026-07-03 16:26:19
“真希望他不是我亲生的!”父亲直言讨厌儿子,引来千万家长共鸣

“真希望他不是我亲生的!”父亲直言讨厌儿子,引来千万家长共鸣

妍妍教育日记
2026-07-01 20:48:04
2年内从15万本金赚到318万,总结了10条铁律,话很短,含金量很大

2年内从15万本金赚到318万,总结了10条铁律,话很短,含金量很大

一方聊市
2026-06-27 15:35:03
六世达赖:白天是西藏权力最大的王,晚上化身贵族公子当风流情郎

六世达赖:白天是西藏权力最大的王,晚上化身贵族公子当风流情郎

掠影后有感
2026-07-02 10:02:05
打破球王贝利记录!婚后连生4娃的他,如今32岁仍能闪耀世界杯

打破球王贝利记录!婚后连生4娃的他,如今32岁仍能闪耀世界杯

林轻吟
2026-07-03 09:57:15
伊朗为已故最高领袖哈梅内伊举行遗体告别仪式,伊朗各界人士、宗教领袖以及多国官员出席,伊朗总统发文悼念:全体人民深感悲痛

伊朗为已故最高领袖哈梅内伊举行遗体告别仪式,伊朗各界人士、宗教领袖以及多国官员出席,伊朗总统发文悼念:全体人民深感悲痛

政知新媒体
2026-07-03 13:50:18
记者:克洛普准备接受德国队主帅职位

记者:克洛普准备接受德国队主帅职位

懂球帝
2026-07-03 12:14:29
张馨予老公被偶遇,何捷一身穿搭精英范十足,手握2部手机很繁忙

张馨予老公被偶遇,何捷一身穿搭精英范十足,手握2部手机很繁忙

一个小豹子
2026-07-03 03:57:18
巴格达的倒戈:扎伊迪的“雷霆三日”如何撕裂伊朗的什叶派走廊

巴格达的倒戈:扎伊迪的“雷霆三日”如何撕裂伊朗的什叶派走廊

民间胡扯老哥
2026-07-03 05:29:12
2026-07-03 20:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13426文章数 142686关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

60岁老人猥亵8岁女童仅获刑一年三个月 法院决定再审

头条要闻

60岁老人猥亵8岁女童仅获刑一年三个月 法院决定再审

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

"千亿"众邦银行被接管:系严重信用风险

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

家居
教育
亲子
时尚
游戏

家居要闻

传奇筑 日常诗

教育要闻

用话术让孩子进步只是第一步

亲子要闻

一场考试的遗憾让老闺女红了眼,连我新染的黄头发都成了宣泄小情

A-Lin已经这样了,徐佳莹你怎么睡得着!

肯德基继续开团索尼!KFC游戏主机发售时间曝光

无障碍浏览 进入关怀版