网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Meta「透视」AI思维链：CRV推理诊断，准确率达 92%！

2025-10-23 12:23:49　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：倾倾

【新智元导读】在最近一篇来自Meta FAIR团队的论文里，研究者找到了一种前所未有的方式——他们能实时看到AI的思考过程。这项名为CRV的方法，通过替换模型内部的MLP模块，让每一步推理都变得「可见」。这不是隐喻，而是可量化的现象。Meta用它让错误检测精度提升到92.47%，也让人类第一次得以窥见AI是怎么想错的。

「Meta刚刚找到一种方法，可以实时观察AI的思维过程崩溃。」

一条看似寻常的推文，在AI圈炸开了锅。

发帖人是研究员@JacksonAtkinsX，他称Meta的新技术能让机器的思维「透明化」——不仅能看到模型在想什么，还能看见它在哪一步彻底「想错」。

在Meta FAIR团队刚发布的论文中，这项被称为CRV（Circuit-based Reasoning Verification）的新方法，就像一台「AI脑部X光机」：

它能追踪语言模型的每一次推理、记录每一条电流路径，甚至捕捉到思维崩溃的瞬间。

论文链接：https://arxiv.org/abs/2510.09312?utm_source

当屏幕上那张电路图突然从整洁的网状，变成混乱的线团——研究者第一次，看见了AI的思维是怎么崩溃的。

Meta「看见」了AI是怎么想错的

Meta刚刚找到一种方法，可以实时观察AI的思维过程崩溃。

当研究员Jackson Atkins发出这条推文时，AI社区瞬间沸腾了

乍一听像科幻小说的桥段。AI在思考的时候忽然断链、炸裂，而研究者却说能直接看到那一刻。

但这不是夸张。在Meta FAIR团队刚发表的论文《Verifying Chain-of-Thought Reasoning via Its Computational Graph》中，他们提出了一种新方法：CRV（Circuit-based Reasoning Verification）。

这项技术能让研究者在模型「思考」的过程中，看到它的推理电路。

当模型推理正确时，它的「内部电路图」干净、有条理；一旦模型犯错，电路图立刻变得纠缠、杂乱。

推理指纹特征对比图。错误推理在这些特征上普遍更加分散、混乱。

研究团队将这种电路结构称为模型的「推理指纹（reasoning fingerprint）」。

他们发现，错误并不是随机的，而是有形、有迹可循：只要读取这张「电路指纹图」，就能预测模型是否即将犯错。

在算术推理实验中，CRV 的检测精度（AUROC）从76.45提升至92.47，误报率从63.33%降至37.09%。

更令人震撼的是，当研究者关闭一个错误激活的乘法特征神经元后，模型立即修正了计算。

例如在表达式 (7 × ((5 + 9) + 7)) 中，模型原本输出105，干预后改为147——完全正确。

错误推理并非随机，而是电路执行过程中的结构性失败。

Meta FAIR的研究者用一句话概括他们的目标：要让AI不仅能「给出答案」，更能「证明自己想得对」。

重塑推理结构

给机器装上「透明大脑」

要想让AI的思维过程变得「可见」，Meta做了一件几乎颠覆常识的事：他们重新改造了语言模型的大脑结构。

这项被命名为CRV（Circuit-based Reasoning Verification）的方法，核心思想不是提升模型性能，而是让AI的每一步推理都能被验证、被追踪。

我们的目标不是让模型更聪明，而是让它的思考过程本身变得可验证。

AI的大脑不再是黑盒：每个「神经元」都能被看见

研究团队首先将模型中的传统MLP模块替换为一种可解释的稀疏结构——Transcoder层。

在不同层将MLP替换为Transcoder后，模型的损失值在短时间内迅速下降并趋于稳定。

Transcoder层的训练稳定性证明。CRV 不是理论概念，而是可以在大模型上稳定运行的真实工程结构。

每个Transcoder都像一组带标签的神经元，能代表特定的语义特征，例如「加法」「乘法」「括号」或「进位」。

这样一来，研究者就能在推理过程中，看到哪些神经元被激活、何时点亮、如何传递。

论文把这一步称为「X-Ray」，即为模型安装一层「透视皮肤」。

研究者形容它像「在黑箱里装上摄像机」：每一层的计算过程不再是难以解读的向量，而是清晰的电路信号。

AI的思维可以画出来：Meta让推理变成一张电路图

当模型执行一步推理时，系统会绘制出一张归因图（Attribution Graph），节点代表被激活的特征，边表示它们之间的信息流动。

每一次逻辑跳转、每一个概念结合，都会在图上留下痕迹。

这张图不是静态的，而是随推理动态变化的「思维轨迹」。

当模型看到「3+5=」时，研究者可以实时看到「加法特征」从底层被点亮、信息如何层层汇聚到输出。

而当模型出错时，路径就会打结、分叉、环绕——像一条错乱的神经信号。

CRV 方法流程示意图中展示了从「替换MLP模块」、构建归因图、提取结构特征，到最后交由诊断分类器判定「正确/错误」的全过程。

让AI自己暴露错误：Meta发现「思维崩溃」的指纹

当思维电路图生成后，Meta提取了大量结构特征：节点数量、图密度、平均边权、路径长度、中心性……

这些数据构成了模型的「思维指纹」。

接着，他们训练了一个分类器——它不读文字，也不看答案，只看结构。在实验中，研究者发现：

当图结构纠缠、分布混乱时，模型几乎一定在推理出错。

也就是说，模型是否思考正确，不必等它说完答案，只要观察那张「电路图」的形态，就能提前判断。

CRV的出现，让语言模型第一次拥有了「可诊断的神经结构」。

Meta并没有让AI更聪明，而是让人类第一次能看见AI是如何出错的。

黑箱不再完全密封，智能第一次露出了自己的「电路断层」。

不止是论文，更是AI研究的分水岭

在Meta公布实验结果后，最直观的震撼来自这组对比图：

CRV与多种验证方法的性能对比。图中展示了不同方法在算术推理任务下的检测表现。

红线代表 CRV，无论是在AUROC（检测精度）、AUPR（正确预测率）还是FPR@95（误报率）上，都远高于或低于其他方法。

这意味着它不仅能看见推理电路的结构，更能精准判断模型是否会想错。

这样的结果让许多研究者意识到：CRV不只是一次模型改造，而是一次观念的翻转。

过去，我们判断一个模型是否推理正确，只能看它的答案。

它写出一段chain-of-thought，人类再去揣测逻辑是不是连贯，结论是不是对的。

这一切都发生在黑箱之外——我们只能看到输出，却无法追踪「它是怎么想的」。

而Meta的CRV，把这条思维链第一次摊在显微镜下。研究者不再靠猜，而是能直接看到模型内部的逻辑路径：

每一次特征被点亮，每一条信号被传递，都能在图上找到对应的「电路」。

他们不是在评估答案，而是在验证思维的结构本身。

更重要的是，CRV让「可解释性」和「可靠性」第一次真正接上了。

在过去的研究里，前者关注看懂模型，后者追求信得过模型，两条路几乎平行——我们能看到热力图，却依然不知道为什么模型会错。

而在Meta的实验中，研究者既能解释模型为什么出错，也能预测下一步它可能在哪出错。

CRV也许是通向「可控智能」的第一步。当推理错误能被结构化地识别，就意味着它可以被预测、干预，甚至被修复。

论文中有一个著名的例子——关闭一个错误激活的神经特征后，模型立刻修正答案。

这说明错误并非偶然，而是电路级的故障。如果未来能实时监测这些特征，我们或许能在幻觉发生前按下「刹车」。

从这一刻起，AI的错误不再是神秘的灵异事件。它们是有形的、可诊断的。

不同任务中正确与错误推理的拓扑特征分布。图中蓝色表示正确推理，红色表示错误推理。

Meta把黑箱的盖子掀开了一条缝——让人类第一次有机会，不只是造出智能，而是看懂智能本身。

能看懂AI的那天

我们离「可控智能」还有多远？

就算Meta已经能「看见AI在想什么」，这项技术距离真正落地，仍有一段漫长的路要走。

在论文结尾部分，研究团队自己就坦率地写下了「局限与未竟之处」。

我们的方法目前需要大量计算资源，因为必须将所有MLP层替换为Transcoder层，并计算完整的归因图。

也就是说，要让模型变得可见，代价是巨大的：每一层都要被重建，每一个特征都要被追踪。

光是绘制一次完整的归因图，就可能消耗掉普通训练的数十倍算力。这不是能随意做出的功能，而是需要投入巨大的工程。

更现实的问题是——规模。

实验仅在最大8B参数规模的模型上进行，将其扩展到更大模型仍需后续研究。

CRV目前只在中等体量的模型上被验证，而如今主流的大语言模型动辄上百亿、甚至上千亿参数，要让整个推理电路都能被看见，几乎不可能在短期内完成。

更棘手的是泛化问题。

CRV在算术任务上表现亮眼，但一旦换到自然语言推理、常识问答、代码生成这类复杂任务时，归因图结构的规律会完全不同，错误特征不再稳定，诊断效果明显下降。

最后，Meta团队也提醒读者：

Transcoder架构只是原始MLP的一种近似，并非完美替代。

这意味着，研究者看到的那些「电路轨迹」，其实是经过重新投影后的近似结构。

Meta的CRV不是让机器更聪明，而是让人类第一次得以窥见智能的内部结构。

那些曾被称为「幻觉」的错误、不确定的跳跃、莫名的偏差，如今都能被描摹成一张电路图，被一点点拆解、理解、修复。

或许距离真正「可靠」的AI还很远，但这一步已经改变了方向。

人类不再只是 AI 的使用者，而是它的读者、医生，也是见证者。

当机器的思维第一次被照亮，这束光也照进了我们自己的认知——照见了我们对智能的渴望、恐惧，以及那句始终悬在科学尽头的问题：

我们究竟是在教会机器思考，还是在学会看懂自己？

参考资料：

https://x.com/JacksonAtkinsX/status/1977721832909177032

https://arxiv.org/abs/2510.09312?utm_source=chatgpt.com

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

硅谷今夜学中文！Cursor被曝「套壳」国产，AI顶级人才全是华人

新智元 2025-11-01 13:15:47
12 跟贴 12
「不仅会想，还能准确去做」VLA-R1把「推理+行动」带进真实世界

机器之心Pro 2025-10-27 19:12:41
0 跟贴 0

AGILE：自监督+交互式强化学习助力VLMs感知与推理全面提升

机器之心Pro 2025-10-20 18:30:03
0 跟贴 0

AI安全上，开源仍胜闭源，Meta、UCB防御LLM提示词注入攻击

机器之心Pro 2025-07-30 14:59:51
0 跟贴 0
谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

钛媒体APP 2025-11-01 18:21:14
0 跟贴 0

马斯克，最新预言！

每日经济新闻 2025-11-02 14:32:04
127 跟贴 127

LeCun预言成真！790年长视频，炼出最强开源「世界模型」

新智元 2025-11-03 12:34:20
0 跟贴 0
美团新独立APP，点不了菜只能点AI

量子位 2025-11-03 11:52:25
0 跟贴 0

视频生成模型无损加速两倍，秘诀是「抓住attention时空稀疏性」

机器之心Pro 2025-05-07 19:05:34
2 跟贴 2
LLM能替代数据科学家了？DeepAnalyze帮你告别手动分析数据

量子位 2025-11-01 12:24:39
1 跟贴 1
以判别式监督学习强化推理LLM，解决难度偏差和熵崩塌难题

机器之心Pro 2025-10-28 11:14:55
0 跟贴 0
美团王兴狂卷大模型！开源561B“全能”龙猫模型，上线首款AI通用助手App

智东西 2025-11-03 13:30:55
0 跟贴 0
Meta裁员、OpenAI重组:万字复盘谷歌起笔的AI史诗,如何被改写剧本

机器之心Pro 2025-11-03 10:43:25
0 跟贴 0
AI深度应用关键元年，快手重塑内容与商业价值

机器之心Pro 2025-11-03 14:44:42
0 跟贴 0
特斯拉人形机器人，新进展曝光！

每日经济新闻 2025-11-03 14:54:07
0 跟贴 0
老电工懵了，起保停电路？还是启保停电路

电工老安 2025-11-01 11:30:12
4 跟贴 4
让LLM不再话痨，快手HiPO框架来了

机器之心Pro 2025-11-03 15:10:48
0 跟贴 0
为什么军用设备的内部结构会这么美？

胡侃杂史 2025-11-02 23:39:34
1 跟贴 1
官宣将播！6部新剧强势来袭，新闻女王2回归，大家想追哪部？

好叫好伐 2025-11-01 18:18:38
0 跟贴 0
男人修电路的速度是有目共睹的

鱼哥追剧 2025-10-30 16:19:20
1 跟贴 1
“半夜吓得一激灵！”网友反映iPhone半夜会自动拨号给陌生人，怎么回事？

都市快报橙柿互动 2025-10-31 15:48:31
17000 跟贴 17000
带你们看看本田Jet的内部结构：造飞机，本田也很强！

少数派报告Report 2025-10-31 22:28:27
3 跟贴 3
1斤豆芽卖28.8元？网友直呼“吃不起”，知名餐饮品牌回应

都市快报橙柿互动 2025-11-02 16:20:16
8536 跟贴 8536
对面神装加透视，怎么打啊！

后来剪影 2025-10-30 11:27:12
1 跟贴 1
异性之间相互吸引，这奇妙规律从古至今，诚不欺我

墨林电影 2025-10-31 14:21:23
15 跟贴 15
被围乌军开始投降！俄国防部公开乌军俘虏视频

看看新闻Knews 2025-11-02 17:27:40
8591 跟贴 8591
三亚海滩“长满”了俄罗斯人！网友调侃：我在这里反而成了“老外”

封面新闻 2025-11-02 12:57:02
148 跟贴 148
马来西亚首富之子买上海大平层 449平米1.17亿元

每日经济新闻 2025-11-02 23:32:08
64 跟贴 64
全兴和润，构建“品牌+个性风味”表达式

微酒 2025-10-30 20:53:04
0 跟贴 0
甘肃一地众多市民使用简易工具淘金？周边商户：年初就开始，曾被政府叫停，近期随着河道清理出现回潮

都市快报橙柿互动 2025-11-02 18:52:52
3125 跟贴 3125
变速箱的内部结构，真的太复杂了

焦点视讯 2025-11-03 00:45:47
1 跟贴 1
国外为救一只鸟，全国总电路要断，老杂志记载竟成真视频

搞笑风火轮 2025-10-31 00:00:00
0 跟贴 0
中国小伙手搓战舰模型火爆外网，美国网友：我去，真能跑，还能

科普世界奇闻 2025-11-03 10:49:40
0 跟贴 0
突然爆火！青岛街头，一大群人裹着羽绒服排长队，就为了买它！网友：足足排了4个小时，高低要尝尝什么味儿

环球网资讯 2025-11-01 14:24:07
925 跟贴 925
抽象鱼鹰直升机模型，地球火种武士级威震天

明哥的游戏流程和模玩分享 2025-11-02 12:05:47
6 跟贴 6
他们在1993年就提出了Scaling Law

量子位 2025-09-03 10:24:41
0 跟贴 0
祝贺！全红婵复出首战告捷

央视新闻客户端 2025-11-02 20:53:35
725 跟贴 725
590一年级全班都不会做，家长看了也蒙圈，规律竟如此简单

我服子佩 2025-11-02 11:55:49
3 跟贴 3
儿童每天规律睡眠不少于9小时肥胖风险更低

生活帮 2025-11-03 12:24:45
0 跟贴 0
今天继续找规律，“平方数”，一起看一看，有点难度

探寻历史的足迹 2025-10-30 13:58:46
0 跟贴 0

朝鲜专列进京有多离谱？金正恩来中国为何坐火车不坐飞机？

朝鲜专列进京有多离谱？金正恩来中国为何坐火车不坐飞机？

诗意世界

2025-09-17 13:19:48

“黄暴之最”，“胸”涌澎湃，这些“限制级”影片，值得一看

“黄暴之最”，“胸”涌澎湃，这些“限制级”影片，值得一看

棱镜电影

2025-11-02 13:14:47

同为战神，为何四野名将不敢顶撞林总，而三野却有多人不服粟裕？

同为战神，为何四野名将不敢顶撞林总，而三野却有多人不服粟裕？

诺言卿史录

2025-11-02 04:10:03

云南一学校通报学生出现身体不适的情况：住院学生已全部康复出院返回学校

云南一学校通报学生出现身体不适的情况：住院学生已全部康复出院返回学校

极目新闻

2025-11-02 19:29:13

尊界S800拆车：排行榜最高分，这就是国产车的顶级水平！

尊界S800拆车：排行榜最高分，这就是国产车的顶级水平！

大飙车

2025-11-01 20:55:56

九大汽车集团10月销量，上汽破45万，比亚迪破44万，吉利破30.7万

九大汽车集团10月销量，上汽破45万，比亚迪破44万，吉利破30.7万

西莫的艺术宫殿

2025-11-03 05:55:44

全红婵没想到，全运会还没开始，院长苏炳添凭一句话实现口碑暴增

全红婵没想到，全运会还没开始，院长苏炳添凭一句话实现口碑暴增

三公子娱乐丫

2025-11-02 21:00:03

妹子“把胸放桌上休息”被拍走红！女菩萨们不服发照片PK：最后这波赢麻了

妹子“把胸放桌上休息”被拍走红！女菩萨们不服发照片PK：最后这波赢麻了

经典段子

2025-10-11 22:34:42

非要和小两口睡一张床的婆婆，12刀剁掉了儿媳的头，江苏真事儿

非要和小两口睡一张床的婆婆，12刀剁掉了儿媳的头，江苏真事儿

左堤路小车神

2023-11-22 19:55:20

天津市滨海新区人民政府现任区长、副区长及工作分工

天津市滨海新区人民政府现任区长、副区长及工作分工

阿天爱旅行

2025-11-03 11:36:52

40岁魔笛太拼了：斜线狂奔25米超车22岁小将！意甲第1核心

40岁魔笛太拼了：斜线狂奔25米超车22岁小将！意甲第1核心

叶青足球世界

2025-11-03 09:15:33

那个敢跟王家卫叫板的古二，像极了在职场上苦苦挣扎的我们

那个敢跟王家卫叫板的古二，像极了在职场上苦苦挣扎的我们

情感大头说说

2025-11-03 01:44:38

同学聚会没人跟我说话，我吃完饭离开，班长宣布：感谢王总买单

同学聚会没人跟我说话，我吃完饭离开，班长宣布：感谢王总买单

秋风专栏

2025-10-31 15:27:38

难怪特朗普抛弃欧洲，美方终于公开真相：美军的真正目标是中国

难怪特朗普抛弃欧洲，美方终于公开真相：美军的真正目标是中国

素年文史

2025-11-03 13:00:03

周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

温情邮局

2025-09-08 14:23:26

从今天起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

从今天起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

来科点谱

2025-11-03 09:17:21

曾国藩弄死何桂清：一场教科书级别的权力斗争

曾国藩弄死何桂清：一场教科书级别的权力斗争

掠影后有感

2025-10-30 08:26:48

曼联的痛：拉什福德重回巅峰，神级停球后小角度爆杆破门，太牛了

曼联的痛：拉什福德重回巅峰，神级停球后小角度爆杆破门，太牛了

侧身凌空斩

2025-11-03 03:29:09

最美“吸血鬼”泳装照曝光后，网友慌了：不能再瘦下去了啊！

最美“吸血鬼”泳装照曝光后，网友慌了：不能再瘦下去了啊！

陈天宇

2025-11-03 00:32:01

62岁刘德华晒一日三餐，网友：太狠了，难怪看起来像40岁

62岁刘德华晒一日三餐，网友：太狠了，难怪看起来像40岁

手工制作阿歼

2025-11-01 00:30:58

AI产业主平台领航智能+时代

13772文章数 66236关注度

往期回顾全部

科技要闻

余承东内部信：鸿蒙下一步要实现上亿覆盖

头条要闻

美媒：中国正迅速充实石油储备或与俄油设施遭袭有关

头条要闻

美媒：中国正迅速充实石油储备或与俄油设施遭袭有关

体育要闻

开拓者官宣召回杨瀚森队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克：未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振深蓝L06包你开得爽

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

教育

旅游

家居

公开课

数码要闻

消息称联想拯救者 Y700 小平板 2026 款暂定明年上半年登场

教育要闻

AI时代应该培训小朋友什么能力

旅游要闻

新西兰：对持有效澳大利亚签证的中国公民免签

家居要闻

岁月柔情现代品质轻奢

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版