网易首页 > 网易号 > 正文 申请入驻

Meta AI 推理新论文:模型记住套路,推理 token 砍半

0
分享至


来源:大数据文摘出品

Meta 又一次在 AI 推理上“开了挂”。

一份新论文显示,Meta 的研究团队找到一种让大模型“用更少思维,想得更清楚”的办法。

这篇论文名为Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors,发表于 2025 年 9 月 17 日,来自 Meta 团队与普林斯顿大学、蒙特利尔大联合研究。


作者包括 Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 与 Sanjeev Arora

论文地址: https://arxiv.org/abs/2509.13237

论文提出一个新机制,让大语言模型(LLM)能在每次推理后,总结自己重复用到的步骤,并把它们存为简短指令,称为“行为(Behavior)”。

下一次遇到类似问题,模型不再重复推,而是直接调用这些“行为”

效果惊人。

在数学推理任务上,Meta 团队实测:模型在确率不下降的前提下,推理所需的 token 数量最多减少 46%

也就是说,同样一道题,模型少想一半,却答得一样准。

研究团队称,这让模型“学会记得自己怎么思考”,相当于给 LLM 装上了“思维缓存”。

思维有手册:AI的“行为记忆术”


“行为复用”(Metacognitive Reuse)框架

Meta 把这个机制叫做“行为手册(Behavior Handbook)”。

当模型解决问题时,它会记录下自己的整个推理过程。

然后再回头反思,分析哪些步骤是常见套路,比如“容斥原理”“有理化分母”“代入后先化简”。

模型会为这些套路起名、写说明,变成一条条“行为指令”。

这些指令被收进一本不断扩充的手册里。

论文把这种机制称为“元认知路径(Metacognitive Pathway)”,意思是模型在“思考自己的思考”。

举个例子:当模型遇到一道掷骰子概率题,它可能调用behavior_total_outcomes(计算所有可能结果)和 behavior_inclusion_exclusion(用容斥原理避免重复计数)。

调用完就不再多说废话,答案照出。

所以,每个行为是一段压缩的思维过程。它把原本要几十步才能重建的推导,浓缩成一句话。

论文展示了多个实验结果。在 MATH 数据集上,行为调节推理(Behavior-conditioned Inference)让模型的推理token平均减少近一半;在 AIME–24/25 高难数学题上,模型在低预算(2048–8192 tokens)下仍保持稳定精度。

自我复盘,像人一样“省思考”

长期以来,大模型被诟病“啰嗦”:每解一道题,都要展开冗长的 chain-of-thought,把所有中间步骤重新铺一遍。

这不仅浪费 token,也拉低了模型吞吐量。Meta 让模型自己反思,自己提炼,自己精简。


行为提取提示设计

论文设计了三种模式:

第一种,是“行为调节推理”(Behavior-conditioned Inference)。模型从手册里调出相关行为提示,带着它们去解题。
结果:少写46%的token,准确率不降反升。

第二种,是“行为引导自我改进”(Behavior-guided Self-improvement)。模型用自己总结的行为来指导下次推理。
结果:正确率比普通“自我批改”提升10%。

第三种,是“行为调节监督微调”(Behavior-conditioned SFT)。Meta 研究者用带有行为提示的推理数据去训练学生模型。
结果:学生模型学会推理,比传统微调版本更聪明、更高效。

实验中,Meta 使用了 R1-Llama-70B 作为“元认知策略师”,并测试了 Qwen3-32B、Llama-3.1-8B 等多个学生模型

几乎所有模型都出现了相同现象:推理token直线下滑,性能保持平稳。

研究者把这一现象形容为:“模型从慢推导变成快反应。”它不再每次都重写思维,而是像人一样,学会了用经验来省思考。

注:头图AI生成

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官媒怒批!郑智化道歉无用,“狐狸尾巴”早藏不住了!

官媒怒批!郑智化道歉无用,“狐狸尾巴”早藏不住了!

智凌纵横
2025-11-03 11:18:00
武松断臂出家后,梁山无一人看望,唯独曾最瞧不上他的人还记得他

武松断臂出家后,梁山无一人看望,唯独曾最瞧不上他的人还记得他

鹤羽说个事
2025-10-30 15:56:40
张兰与亲家母同框,祖孙三代游成都,一家团圆好幸福,孩子也开心

张兰与亲家母同框,祖孙三代游成都,一家团圆好幸福,孩子也开心

小咪侃娱圈
2025-11-03 08:59:42
饶颖:赵忠祥与我发生关系多年,他有特殊癖好,令我身心受到伤害

饶颖:赵忠祥与我发生关系多年,他有特殊癖好,令我身心受到伤害

凡知
2025-05-07 16:00:01
至此,蔡振华留下的王牌全部打完了

至此,蔡振华留下的王牌全部打完了

中场阴谋家
2025-11-01 08:18:57
医生忠告:吃完降压药千万别碰这3样食物,患者要牢记,不能大意

医生忠告:吃完降压药千万别碰这3样食物,患者要牢记,不能大意

今日养生之道
2025-10-23 08:08:38
4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

观察鉴娱
2025-11-03 09:56:41
泰山可能赛季结束很快就宣布新教练是谁?瓦科是过去式了,就这样

泰山可能赛季结束很快就宣布新教练是谁?瓦科是过去式了,就这样

新新自圆其说说体育
2025-11-03 11:37:21
“这么骚的教练,健身房居然都有?你别不信!”

“这么骚的教练,健身房居然都有?你别不信!”

健身S叔
2025-10-28 16:22:51
指数短线拉升,沪指再度翻红

指数短线拉升,沪指再度翻红

每日经济新闻
2025-11-03 11:11:06
宇宙到底有多大?不敢想象,看了之后会让你疯狂!

宇宙到底有多大?不敢想象,看了之后会让你疯狂!

宇宙时空
2025-11-02 09:37:51
谁能想到啊!不光曾黎没预料到,于和伟估计也挺意外

谁能想到啊!不光曾黎没预料到,于和伟估计也挺意外

小光侃娱乐
2025-11-03 11:35:03
刘亦菲于适恋情?孟子义靠赵樱子入行?陈瑶又被耽误了?翁青雅对朱珠耍大牌?老牌女星乱发脾气?

刘亦菲于适恋情?孟子义靠赵樱子入行?陈瑶又被耽误了?翁青雅对朱珠耍大牌?老牌女星乱发脾气?

十锤星人
2025-11-02 22:45:02
高盛:中国股市正迈进增长期 AH股指数明年底潜在回报达30%

高盛:中国股市正迈进增长期 AH股指数明年底潜在回报达30%

财联社
2025-11-03 09:20:10
工作中你闯过啥大祸?网友:所以领导这都没有请他走吗

工作中你闯过啥大祸?网友:所以领导这都没有请他走吗

解读热点事件
2025-10-31 00:15:03
王传福投出深水炸弹,比亚迪王炸新车一炮而红

王传福投出深水炸弹,比亚迪王炸新车一炮而红

象视汽车
2025-11-02 07:00:05
李连杰状态太好了,手术3个月豪宅游泳,62岁脱光上衣自证清白!

李连杰状态太好了,手术3个月豪宅游泳,62岁脱光上衣自证清白!

娱圈小愚
2025-11-03 10:30:35
16岁少年在未管所遭殴打致死案一审宣判:同监区3名罪犯获刑,最高被判死缓

16岁少年在未管所遭殴打致死案一审宣判:同监区3名罪犯获刑,最高被判死缓

红星新闻
2025-11-02 21:41:21
也是恩人!双杀成都 主场全华班迎战海港 就看能否帮忙狙击申花

也是恩人!双杀成都 主场全华班迎战海港 就看能否帮忙狙击申花

80后体育大蜀黍
2025-11-02 20:18:52
理想汽车,又打了一场翻身仗?

理想汽车,又打了一场翻身仗?

电动势
2025-11-03 09:10:18
2025-11-03 12:27:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4296文章数 37332关注度
往期回顾 全部

科技要闻

马斯克为这事开骂:“他们什么都不懂”!

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

艺术
家居
亲子
旅游
房产

艺术要闻

70后夫妻住700㎡,太太拥有专属楼层:婚姻更稳了

家居要闻

吸睛艺术 富有传奇色彩

亲子要闻

专注力的真相,这3点比“不打断”更重要

旅游要闻

无“青绿”不敦煌

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

无障碍浏览 进入关怀版