网易首页 > 网易号 > 正文 申请入驻

别直接训!给主模型加个错题本,6B轻松超越8B | NeurIPS

0
分享至


新智元报道

编辑:LRST

【新智元导读】传统训练只关注模型输出对错,最新研究在大模型训练中引入「错题本」,记录了模型犯错时的内部思考状态,包括问题、推理过程和错误位置,更接近人类反思学习。通过辅助模型学习这些「错题本」,能实时校正主模型预测,提升性能。

很多人回顾自己的学习经历时都会发现:能力真正产生跃迁,并不是刷题数量最多的时候,而是开始系统整理「错题本」的阶段

关键并不在于把错误答案抄下来,而在于持续追问——当时为什么会这么想?是哪一步的判断出现了偏差?这种错误是偶发的,还是反复出现的思维模式?

正是通过这种反思式学习,人类逐渐学会识别自身的「错误规律」,在复杂和不确定问题面前变得更加稳健。

那么,一个问题随之而来:大语言模型有没有属于自己的「错题本」?

在当前主流训练范式中,大模型的学习过程高度简化为一个循环:

  • 给定输入 → 预测输出

  • 与标准答案对比 → 计算loss

  • 通过反向传播更新参数

从本质上看,这一过程强调的是「如何更好地拟合正确答案」。

模型只需要知道结果对不对,而并不真正关心:我当时是通过怎样的内部推理路径走到这个错误结论的?

这也揭示了一个关键缺失:当前的大模型并不缺数据,也不缺算力,而是缺少一种类似人类的深度反思能力——即围绕错误本身展开的结构化复盘。

伊利诺伊大学厄巴纳-香槟分校、普林斯顿大学的研究人员发表的最新论文,提出了一个非常「人类化」的概念:Mistake Log(错题本)。


论文链接:https://arxiv.org/pdf/2505.16270

代码链接:https://github.com/jiaruzouu/TransformerCopilot

与传统训练仅关注最终输出不同,Mistake Log的目标并不是回答「模型错没错」,而是刻画一个更本质的问题:模型是在什么样的内部状态下犯下这个错误的?

换句话说,它关注的不是答案,而是错误产生的全过程

Mistake Log的三层结构



Question:模型当时在解决什么问题?

在训练过程中,每一个输入都会被映射为一个问题级别的表示,用于刻画「模型此刻面对的任务语境」。这一步对应的是:我当时在做哪一道题?

Rationale(核心):模型当时的内部推理状态

这是该方法与标准SFT拉开差距的关键所在。研究并不满足于观察最终生成的token,而是直接读取Transformer在所有层、所有token位置上的隐藏状态表示。这些高维向量并非人类可读的文字解释,而是模型真实的内部思考轨迹:


其中,t表示第t个训练步奏、i表示第i个 token、l表示第l层 Transformer、h表示模型计算过程中这一刻的隐状态。

将这些隐藏状态整体收集后,就得到了一个完整的Rationale轨迹:


它可以被视为模型在犯错瞬间的「认知状态快照」。

这一步类似于人类在复盘错题时回忆:「我当时是基于哪个公式推导的?」「为什么在这个分支做出了错误判断?」

Mistakes:逐token精细刻画错误来源

不同于用一个标量loss模糊衡量整体错误,该工作在token级别定位偏差:(1)对比模型预测分布与真实分布;(2)计算两者在每个 token 上的差距:


  • 模型预测分布:

  • 真实正确分布:

  • 两者之间的 discrepancy(差距):

由此构建出一张错误热力图,精确回答这样的问题:错误是从哪一个 token 开始出现的?又是如何一步步累积放大的?一条完整的Mistake Log包含什么?

最终,每一次训练迭代都会生成一条三元组:

  • Question:任务语境

  • Rationale:内部推理状态

  • Mistakes:逐 token 的偏差刻画

如果训练进行了T步,那么模型就隐式地积累了T条结构化「错题记录」:


如何真正「利用」这些错题本?

作者进一步提出了一个极具启发性的设计:引入一个辅助模型 Copilot,专门学习主模型(Pilot)的Mistake Log。


Copilot 的训练方式

辅助模型的输入形式:将任务对应的输入语境表示,与主模型在推理阶段产生的内部中间表示


进行联合建模,以刻画模型当前的决策状态;

辅助模型的训练目标:学习预测主模型在生成过程中各个token层面的误差分布


,用于判断哪些位置更易产生偏差以及偏差程度的大小。

换言之,Copilot学习的是:在什么样的内部推理状态下,主模型更容易犯哪类错误?

Polit-Copilot的协同推理


在生成过程中,Copilot输出的纠错logits会与主模型原始logits融合,从而在token生成阶段进行实时修正。最终的模型不再只是「记住答案」,而是具备了一种能力:基于历史错误经验,动态修正当前推理轨迹。

理论结果:纠错是有保证的

论文进一步证明:只要Copilot能较准确地预测错误趋势,且纠错权重λ选取在合理区间内,那么在每一个token维度上,融合后的预测期望误差严格小于原始模型的误差


这意味着,Mistake Log并非启发式技巧,而是具有明确理论支撑的纠错机制。

纠错提升

小模型也能「以小博大」

实验在多种主流模型(如LLaMA-3、Qwen2.5)和10个推理基准任务上验证了该方法的有效性。一个尤为亮眼的现象是:大模型 Pilot+小规模 Copilot+的组合,往往能显著提升性价比。

LLaMA-3.2-3B+3B Copilot(总6B参数)的性能超过原始8B的 LLaMA-3.1-8B。

这表明:纠错能力本身,可能比单纯扩大模型规模更关键。


讨论与展望

该工作首次系统性地定义并探索了大模型训练中的Mistake Log 机制,但这仅仅是一个起点。

当前主流的「反思式」方法,多依赖于显式思维链(Chain-of-Thought)和多Agent外部纠错,这些方法更多停留在输出层面,而Mistake Log则直接作用于模型内部认知状态

一个值得深入研究的问题是:基于模型自身内部状态的「自我反思」,是否比依赖外部文本或代理的纠错方式更加有效?

此外,Mistake Log 的表示形式、错误模式的抽象方式,以及Copilot的结构设计,都仍有广阔的优化空间。目前方法在稳定性和泛化性上仍存在提升余地,值得在未来工作中进一步深入优化。

参考资料:

https://arxiv.org/pdf/2505.16270

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阴雨一整天 明天更冷雨更大→

阴雨一整天 明天更冷雨更大→

上海预警发布
2026-04-28 10:46:03
房地产老板:很多大佬负债超万亿 许家印进去因踩红线 歌舞团不算

房地产老板:很多大佬负债超万亿 许家印进去因踩红线 歌舞团不算

风过乡
2026-04-28 13:02:08
美国科学研究:用直觉来做决定,准确率达90%

美国科学研究:用直觉来做决定,准确率达90%

尚曦读史
2026-04-21 10:15:02
61岁何智丽现状:从日本回老家上海,与老友聚餐,面色红润没发福

61岁何智丽现状:从日本回老家上海,与老友聚餐,面色红润没发福

以茶带书
2026-04-14 14:09:22
个人收款被查了!2026年个人收款高于这个数,要小心!

个人收款被查了!2026年个人收款高于这个数,要小心!

新浪财经
2026-04-21 22:04:32
博主不喜欢游戏出现大雷美女!称喜欢这种的人太可悲

博主不喜欢游戏出现大雷美女!称喜欢这种的人太可悲

游民星空
2026-04-27 11:06:30
韩国散户“扫货”中国 PCB龙头

韩国散户“扫货”中国 PCB龙头

每日经济新闻
2026-04-28 11:40:19
《蜜语纪》前妻登场,戳穿了檀寄舟真面目,才懂许蜜语为何选纪封

《蜜语纪》前妻登场,戳穿了檀寄舟真面目,才懂许蜜语为何选纪封

小猫追剧
2026-04-28 11:55:23
父母爱情:安杰被骗了一辈子!到死都不知龙凤胎并非江德福亲生

父母爱情:安杰被骗了一辈子!到死都不知龙凤胎并非江德福亲生

卡西莫多的故事
2026-03-10 10:28:28
51年洪学智妻子寻女无果,到老乡家歇脚老乡惊呼:你要找得就是我

51年洪学智妻子寻女无果,到老乡家歇脚老乡惊呼:你要找得就是我

芊芊子吟
2026-03-31 09:30:07
大势已定!只拥有 1 套房的家庭,今明两年难逃 5 大结局

大势已定!只拥有 1 套房的家庭,今明两年难逃 5 大结局

新浪财经
2026-04-26 22:40:05
生死战隐身!哈登天王山一战软过一战,10.8分28%命中率满是无奈

生死战隐身!哈登天王山一战软过一战,10.8分28%命中率满是无奈

宝哥精彩赛事
2026-04-28 00:24:56
DeepSeek-V4-Pro优惠官宣延期 活动持续至今年5月31日

DeepSeek-V4-Pro优惠官宣延期 活动持续至今年5月31日

财联社
2026-04-28 13:47:07
原中国银行保险监督管理委员会副主席王兆星逝世,享年67岁

原中国银行保险监督管理委员会副主席王兆星逝世,享年67岁

上观新闻
2026-04-28 06:29:08
锁定欧冠席位?电讯报:若击败利物浦,卡里克留任理由将更充分

锁定欧冠席位?电讯报:若击败利物浦,卡里克留任理由将更充分

云隐南山
2026-04-28 12:42:24
S家再传噩耗!71岁S妈紧急送诊,丧女加难见外孙,双重打击彻底垮掉

S家再传噩耗!71岁S妈紧急送诊,丧女加难见外孙,双重打击彻底垮掉

八卦王者
2026-04-28 11:24:47
枸杞再次成为关注对象!医生发现:吃枸杞时,千万多留意这几点!

枸杞再次成为关注对象!医生发现:吃枸杞时,千万多留意这几点!

39健康网
2026-04-23 10:33:51
备战G1赛前,谁注意广东教练组?开会到深夜,各方面都需做好准备

备战G1赛前,谁注意广东教练组?开会到深夜,各方面都需做好准备

篮球资讯达人
2026-04-28 11:33:12
伦敦世乒赛今日打响!4月28日全赛程出炉,雨果首秀+国乒赛程

伦敦世乒赛今日打响!4月28日全赛程出炉,雨果首秀+国乒赛程

宝哥精彩赛事
2026-04-28 09:54:14
伦敦世乒赛搞出新规!国乒紧急调整,孙颖莎回京,立马开练太拼了

伦敦世乒赛搞出新规!国乒紧急调整,孙颖莎回京,立马开练太拼了

阿纂看事
2026-04-27 16:25:51
2026-04-28 14:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15082文章数 66818关注度
往期回顾 全部

教育要闻

留学海南?不出国门接轨国际,这条高性价比升学路径来了!

头条要闻

辞任杭州市市长后 姚高员已任浙江省政府党组成员

头条要闻

辞任杭州市市长后 姚高员已任浙江省政府党组成员

体育要闻

季后赛最新局势:雷霆4-0晋级首队 4队3-1

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

俞敏洪再遭重击

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

艺术
游戏
本地
时尚
公开课

艺术要闻

静·观--第二届全国静物油画作品展 作品选刊

手机也能远程玩KK?贝锐向日葵20周年xKK官方对战平台限时联动福利来了!

本地新闻

用青花瓷的方式,打开西溪湿地

T恤+阔腿裤、衬衫+阔腿裤,今年夏天最火的搭配,谁穿谁时髦!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版