网易首页 > 网易号 > 正文 申请入驻

破解AI对不同上下⽂位置的敏感度不⼀致,新框架来了

0
分享至

Pos2Distill团队 投稿
量子位 | 公众号 QbitAI

语言模型遭遇严重的位置偏见,即模型对不同上下⽂位置的敏感度不⼀致。模型倾向于过度关注输⼊序列中的特定位置,严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。

例如,在对⽐两个候选答案时,模型常因偏好⾸个选项⽽损害其作为评估器的公正性与可靠性。



针对这⼀挑战,论⽂提出了 Pos2Distill,⼀个创新的“位置到位置”蒸馏框架。该框架旨在将模型在优势位置的强⼤能⼒迁移⾄劣势位置,从⽽有效缓解位置偏⻅。

其核⼼思想恰如古语所云:“解铃还须系铃⼈”,利⽤模型⾃⾝已习得的知识,来纠正其⾃⾝的系统性偏差。

其基本原理可以概括为:利⽤位置本⾝造成的性能不均衡,来对抗位置偏差这⼀问题。

团队发现,位置偏差在“检索”和“推理”这两类任务中诱发的表现不同,因此基于上述核⼼原理,团队分别设计了两种专⻔的实现⽅案:Pos2Distill-R1和Pos2Distill-R2。

采⽤Pos2Distill⽅法后,模型在⻓⽂本检索和推理任务中的所有位置上都表现出更好的⼀致性,这两个专⻔设计的系统不仅在各⾃对应的任务上表现优异,彼此之间还表现出很强的跨任务泛化能⼒。



已有的工作:在信息丰富的场景中,例如检索增强⽣成、⻓上下⽂推理以及将⼤语⾔模型(LLM)⽤作评判者等,位置偏差构成了重⼤障碍。当关键信息被任意分布在输⼊的各个位置时,LLM 常常⽆法有效识别和整合这些核 ⼼内容,最终导致其在各种应⽤中出现意外的失败。为缓解PB问题:

一类工作试图通过修改与上下⽂敏感度不均相关的关键架构组件或内部表示来进⾏减轻位置偏见。然⽽,尽管近期在缩⼩性能差距⽅⾯取得了⼀些进展,模型在“优势位置”和“劣势位置”之间的信息利⽤率依然存在巨⼤差异。

另⼀类研究⽅法则采⽤了密集的上下⽂感知训练,通过合成具有细粒度信息感知的训练数据来提升模型性能。但是,这类数据驱动的⽅法通常在数据合成和计算资源⽅⾯都需付出⾼昂的成本。

因此,学术界和⼯业界迫切需要⼀种能够克服这些局限、既有效⼜⾼效的策略来缓解PB。

方法

先导实验:分析揭示,PB在“检索”和“推理”这两种不同的任务范式下表现出不同的⾏为。

Natural PB for Retrieval:在检索任务 (retrieval)中,PB主要表现为“词元偏移”(token-shifting),即在黄金文档所处位置不同,大部分的response具有相似的前缀,只在关键的生成位置发生分歧,由此诱发retrieval的失败。 一旦这些错误的token能够被修正,模型又可以输出正确的答案;

Compound PB for Reasoning:在推理任务中,PB 既体现在检索过程中的变化,也体现在推理过程中发生的改变,最终导致思维链条的偏移(thought shifting)。因此,至关重要的是通过整合真正相关的信息与推理链来重塑整体的响应轨迹。



针对这两种情况相应地开发了两个系统:Pos2Distill-R1 和 Pos2Distill-R2。Pos2Distill-R1 通过引⼊ KL 散度(Kullback-Leibler divergence)损失来提供细粒度的纠正信号,从⽽缓解检索任务中的“词元偏移”。

Pos2Distill-R2 则通过蒸馏来⾃优势位置输⼊的优质CoT响应,来指导和纠正劣势位置的推理轨迹,从⽽解决推理任务中的“思维偏移”。



算法设计(Pos2Distill-R1 for Retrieval):
该框架由两个核心模块组成:如图 4a 所示的平凡位置激活优势位置锚定。前者促进将高表现的优势位置中的有效处理能力迁移至利用不足的无效位置;后者确保优势位置已建立性能的保持,从而缩小无效位置与优势位置之间的差距。

平凡位置激活:为纠正 token shifting 行为,在每个生成步骤中利用 KL 散度作为细粒度的对齐信号。



位置感知的对齐:PB引发的优势位置与不同平凡位置之间的对齐难度具有位置依赖性,因此具有高对齐难度的位置应该优先实施梯度更新。



因此激活平凡位置的损失为:



优势位置的锚定:在蒸馏过程中,模型会意识到关键信息可能出现在上下文窗口的任意位置,这可能会削弱对优势位置(sink position)的显著注意力,从而潜在地损害在多样下游任务中的整体能力。为防止这一问题引入锚定损失,以保持优势位置的有效性。



训练目标损失:融合了激活损失(activation loss)和锚定损失(anchoring loss),形式化表示为:



算法设计(Pos2Distill-R2 for Reasoning):

首先从优势位置 采样链式思维(CoT)推理轨迹。类似于检索任务的过程,为每组位置构建 (K) 个不同的平凡提示。随后使用交叉熵(CE)损失函数对提示及其对应的推理轨迹 (Cadv) 进行优化,以有效捕获推理模式。形式化地表示为:



实验

Pos2Distill-R1实验结果:Pos2Distill-R1 表现出鲁棒且⼀致的性能,⽆论⻩⾦⽂档的位置如何,都显著减少了由位置引起的性能差异。例如,在 WebQ 数据集,Pos2Distill-R1 使 Llama-3-8B 在20个位置上实现了 56.7%的平均准确率。该性能与 dgold 位于最佳“汇聚位置”(sink position)时达到的 57.9% 相当,这说明从优势到劣势位置的知识迁移是成功的,⽽这正是 Pos2Distill-R1 的核⼼原理。



可解释性结果:由于PB源自于大语言模型的架构与参数,希望通过分析Pos2Distill-R1的内部动态机制来揭示其作用原理并提供可解释性说明。记录当黄金文档从1移动到20时,对20个文档的注意力分布。Pos2Distill-R1通过动态地将注意力焦点持续对齐到相关文档上,从而强化了上下文一致性,促进了更为准确的检索。



Pos2Distill-R2实验结果:⽆论是在域内性能还是在域外泛化⽅⾯,Pos2Distill-R2 都超越了现有的⾃我训练⽅法。如表2,在 MusiQue 数据集上训练时,Pos2Distill-R2 实现了 42.8 的精确匹配(EM)得分,优于所有领先的基线。此外,本⽅法表现出强⼤的跨领域泛化能⼒;例如,在 HotpotQA 数据集上,它达到了 58.3 的EM 得分,⽽最强的基线模型为50.9。研究结果表明,与传统的逐实例训练相⽐,训练⼤语⾔模型在多样化、分散的⻩⾦⽂档位置上进⾏推理,可能更有效地增强其⻓上下⽂推理能⼒。这⼀洞⻅为提升复杂⻓上下⽂任务中的推理能⼒提供了新视⻆。



关于两个系统的讨论:

两个系统都表现出对其相互任务的显著泛化能⼒。具体⽽⾔,主要为检索任务优化的 Pos2Distill-R1 证明了其增强的上下⽂检索能⼒也改善了⻓上下⽂推理,在 MusiQue 任务上产⽣了 3.3% 的增⻓。相反,为推理任务优化的 Pos2Distill-R2 表明,其所获得的在⻓上下⽂中的推理熟练度也增强了上下⽂感知,从⽽有益于检索性能。

尽管存在这种跨任务泛化,但每个系统在其主要领域都表现卓越:

Pos2Distill-R2 在复杂的⻓上下⽂推理任务上取得了更优性能,⽽ Pos2Distill-R1 在这些任务上表现滞后,在检索任务上则反之亦然。

这表明缓解位置偏差(PB)存在着不同的底层动态,并可能受到思维链(CoT)存在或缺失的影响。因此,开发这两种专⻔化的 Pos2Distill 设计被证明是既必要⼜有效的。



论文地址:

https://arxiv.org/abs/2508.15709

开源地址:

https://github.com/AMAP-ML/Pos2Distill

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

素衣读史
2026-03-25 21:26:46
王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

快看张同学
2026-03-26 10:19:39
巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

懂球帝
2026-03-26 06:43:02
调查发现:若50岁前没患这4种疾病,以后患癌的几率或微乎其微?

调查发现:若50岁前没患这4种疾病,以后患癌的几率或微乎其微?

医学科普汇
2026-03-26 20:55:03
以色列收到1.28万份战火损失赔偿申请

以色列收到1.28万份战火损失赔偿申请

财联社
2026-03-26 23:22:07
卡尔森:坏了!原来小丑不是特朗普,而是我自己

卡尔森:坏了!原来小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

新京报
2026-03-26 20:41:35
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
特朗普称伊朗送上“价值连城大礼”:允许8艘油轮通过海峡

特朗普称伊朗送上“价值连城大礼”:允许8艘油轮通过海峡

Nee看
2026-03-27 00:39:12
这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

动物奇奇怪怪
2026-03-26 17:48:01
森林狼逆火箭:申京努力了,然而杜兰特啊

森林狼逆火箭:申京努力了,然而杜兰特啊

张佳玮写字的地方
2026-03-26 13:03:18
怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

南风不及你温柔
2026-03-26 14:07:38
曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

古希腊掌管松饼的神
2026-03-25 11:08:46
日本公布中国游客免税店2月份消费数据,真的是打脸了!

日本公布中国游客免税店2月份消费数据,真的是打脸了!

消失的电波
2026-03-26 15:20:44
你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

夜深爱杂谈
2026-03-16 22:21:03
“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

大风新闻
2026-03-26 16:56:40
张晋血管堵80%差点闭眼,张雪峰却再没醒过来:有些努力真会要命

张晋血管堵80%差点闭眼,张雪峰却再没醒过来:有些努力真会要命

阿天爱旅行
2026-03-26 22:54:07
男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

张晓磊
2026-03-26 11:22:06
曝张雪峰在苏州举办葬礼,生前最后一次直播,趴桌子上身体已不适

曝张雪峰在苏州举办葬礼,生前最后一次直播,趴桌子上身体已不适

180视角
2026-03-25 16:58:57
2026-03-27 01:19:00
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176425关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
时尚
数码
公开课
军事航空

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

400万人爱过的女孩,被黄谣网暴180天后

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版