网易首页 > 网易号 > 正文 申请入驻

Meta AI 推理新论文:模型记住套路,推理 token 砍半

0
分享至


大数据文摘出品

Meta 又一次在 AI 推理上“开了挂”。

一份新论文显示,Meta 的研究团队找到一种让大模型“用更少思维,想得更清楚”的办法。

这篇论文名为《Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors》,发表于2025 年 9 月 17 日,来自Meta 团队与普林斯顿大学、蒙特利尔大学联合研究。


作者包括Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 与 Sanjeev Arora

论文地址: https://arxiv.org/abs/2509.13237

论文提出一个新机制,让大语言模型(LLM)能在每次推理后,总结自己重复用到的步骤,并把它们存为简短指令,称为“行为(Behavior)”。

下一次遇到类似问题,模型不再重复推,而是直接调用这些“行为”

效果惊人。

在数学推理任务上,Meta 团队实测:模型在准确率不下降的前提下,推理所需的 token 数量最多减少 46%

也就是说,同样一道题,模型少想一半,却答得一样准。

研究团队称,这让模型“学会记得自己怎么思考”,相当于给 LLM 装上了“思维缓存”。

思维有手册:AI的“行为记忆术”


“行为复用”(Metacognitive Reuse)框架

Meta 把这个机制叫做“行为手册(Behavior Handbook)”。

当模型解决问题时,它会记录下自己的整个推理过程。

然后再回头反思,分析哪些步骤是常见套路,比如“容斥原理”“有理化分母”“代入后先化简”。

模型会为这些套路起名、写说明,变成一条条“行为指令”。

这些指令被收进一本不断扩充的手册里。

论文把这种机制称为“元认知路径(Metacognitive Pathway)”,意思是模型在“思考自己的思考”。

举个例子:当模型遇到一道掷骰子概率题,它可能调用behavior_total_outcomes(计算所有可能结果)和behavior_inclusion_exclusion(用容斥原理避免重复计数)。

调用完就不再多说废话,答案照出。

所以,每个行为是一段压缩的思维过程。它把原本要几十步才能重建的推导,浓缩成一句话。

论文展示了多个实验结果。在MATH数据集上,行为调节推理(Behavior-conditioned Inference)让模型的推理token平均减少近一半;在AIME–24/25高难数学题上,模型在低预算(2048–8192 tokens)下仍保持稳定精度。

自我复盘,像人一样“省思考”

长期以来,大模型被诟病“啰嗦”:每解一道题,都要展开冗长的 chain-of-thought,把所有中间步骤重新铺一遍。

这不仅浪费 token,也拉低了模型吞吐量。Meta 让模型自己反思,自己提炼,自己精简。


行为提取提示设计

论文设计了三种模式:

第一种,是“行为调节推理”(Behavior-conditioned Inference)。模型从手册里调出相关行为提示,带着它们去解题。
结果:少写46%的token,准确率不降反升。

第二种,是“行为引导自我改进”(Behavior-guided Self-improvement)。模型用自己总结的行为来指导下次推理。
结果:正确率比普通“自我批改”提升10%。

第三种,是“行为调节监督微调”(Behavior-conditioned SFT)。Meta 研究者用带有行为提示的推理数据去训练学生模型。
结果:学生模型学会推理,比传统微调版本更聪明、更高效。

实验中,Meta 使用了R1-Llama-70B作为“元认知策略师”,并测试了Qwen3-32B、Llama-3.1-8B 等多个学生模型

几乎所有模型都出现了相同现象:推理token直线下滑,性能保持平稳。

研究者把这一现象形容为:“模型从慢推导变成快反应。”它不再每次都重写思维,而是像人一样,学会了用经验来省思考。

注:头图AI生成

作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信Q1yezi,共同交流行业动态与技术趋势!

GPU 训练特惠!

H100/H200 GPU算力按秒计费,平均节省开支30%以上!

扫码了解详情☝


点「赞」的人都变好看了哦!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她是高鑫夫妇的女儿,不拍广告不进娱乐圈,读上海重点高中是学霸

她是高鑫夫妇的女儿,不拍广告不进娱乐圈,读上海重点高中是学霸

仙味少女心
2025-11-05 06:29:43
遭38岁老人无情碾压!天津末节4-22崩盘,辽宁4连胜掌声送给大韩

遭38岁老人无情碾压!天津末节4-22崩盘,辽宁4连胜掌声送给大韩

后仰大风车
2025-11-07 18:00:13
国足主帅出炉:足协为何选择邵佳一也不用高洪波,答案就是两个字

国足主帅出炉:足协为何选择邵佳一也不用高洪波,答案就是两个字

姜大叔侃球
2025-11-06 20:55:06
郭美美,没救了

郭美美,没救了

钧言堂
2025-11-06 19:04:37
女医生出轨后续!高清私照被扒,身材好气质佳,难怪副院把持不住

女医生出轨后续!高清私照被扒,身材好气质佳,难怪副院把持不住

一只番茄鱼
2025-11-07 15:38:20
细节被扒?和王楚钦恋情曝光?25岁生日,谁注意孙颖莎裤子

细节被扒?和王楚钦恋情曝光?25岁生日,谁注意孙颖莎裤子

乐聊球
2025-11-06 14:27:53
爆冷!全运会天津女排0-3河南,李盈莹拖不动全队,朱婷发挥神勇

爆冷!全运会天津女排0-3河南,李盈莹拖不动全队,朱婷发挥神勇

骑马寺的少年
2025-11-07 20:50:48
“木头姐”重申特斯拉2600美元目标价:该估值的90%是基于特斯拉的自动驾驶出租车业务,这还不包括擎天柱机器人

“木头姐”重申特斯拉2600美元目标价:该估值的90%是基于特斯拉的自动驾驶出租车业务,这还不包括擎天柱机器人

和讯网
2025-11-07 16:47:07
郑丽文称台湾是“国家”,蒋万安再次亮明立场,坚持反对两岸统一

郑丽文称台湾是“国家”,蒋万安再次亮明立场,坚持反对两岸统一

阿校谈史
2025-11-07 16:36:49
赖清德下令台军备战,蒋万安亮明态度反对统一!台海局势一触即发

赖清德下令台军备战,蒋万安亮明态度反对统一!台海局势一触即发

刚哥说法365
2025-11-04 10:32:20
预言2026选情,吴子嘉:郑丽文整合蓝白,赖清德会“输到脱裤”

预言2026选情,吴子嘉:郑丽文整合蓝白,赖清德会“输到脱裤”

海峡导报社
2025-11-06 16:23:19
福特探险者新车型上市,外观很硬朗,5座,2.3T动力,10AT+四驱

福特探险者新车型上市,外观很硬朗,5座,2.3T动力,10AT+四驱

沙雕小琳琳
2025-11-07 12:39:01
上海又有顶流演唱会!连嗨6场,部分道路和地铁口将临时管控,警方最新提醒→

上海又有顶流演唱会!连嗨6场,部分道路和地铁口将临时管控,警方最新提醒→

鲁中晨报
2025-11-07 19:23:17
高梓淇节目聊和蔡琳离婚真相,有点后悔,向8岁儿子保证没女朋友

高梓淇节目聊和蔡琳离婚真相,有点后悔,向8岁儿子保证没女朋友

甜柠聊史
2025-11-07 13:55:47
禁止特朗普绕过国会对委内瑞拉动武议案被否

禁止特朗普绕过国会对委内瑞拉动武议案被否

澎湃新闻
2025-11-07 07:38:04
“刘思涵的校服在非洲”火上热搜,博主否认摆拍:在安哥拉生活一年多,这里有很多二手中国衣服,一件最低不到10元

“刘思涵的校服在非洲”火上热搜,博主否认摆拍:在安哥拉生活一年多,这里有很多二手中国衣服,一件最低不到10元

洪观新闻
2025-11-06 10:55:09
浦东嘉里中心偶遇奚梦瑶,她个子好高像巨人一样但长相不是很漂亮

浦东嘉里中心偶遇奚梦瑶,她个子好高像巨人一样但长相不是很漂亮

乡野小珥
2025-11-07 00:05:57
山航空姐换上羊毛衫+平底鞋!网友点赞:好看又保暖,还利落

山航空姐换上羊毛衫+平底鞋!网友点赞:好看又保暖,还利落

全国妇联女性之声
2025-11-07 10:43:38
马斯克逆袭哲学:你每天躺着不运动不学习不挣钱,你离完蛋不远

马斯克逆袭哲学:你每天躺着不运动不学习不挣钱,你离完蛋不远

杏花烟雨江南的碧园
2025-10-31 16:30:03
反转来了!美高院三人倒戈,贝森特摊牌:没了关税整个国家会陪葬

反转来了!美高院三人倒戈,贝森特摊牌:没了关税整个国家会陪葬

易昂杨
2025-11-07 15:09:07
2025-11-07 21:35:00
大数据文摘 incentive-icons
大数据文摘
专注大数据,每日有分享!
6791文章数 94509关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

韩执政党提议:反华辱华者可判处监禁

头条要闻

韩执政党提议:反华辱华者可判处监禁

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

王家卫的“看人下菜碟”?

财经要闻

荷兰政府:安世中国将很快恢复芯片供应

汽车要闻

美式豪华就是舒适省心 林肯航海家场地试驾

态度原创

教育
旅游
健康
公开课
军事航空

教育要闻

收藏:2026山东【高考缴费】详细步骤来了!

旅游要闻

打造红色经典名片!韶山与大湾区文化旅游、红色教育深度合作

超声探头会加重受伤情况吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中国第三艘航空母舰福建舰入列

无障碍浏览 进入关怀版