网易首页 > 网易号 > 正文 申请入驻

AI也爱看开头结尾?MIT团队揭秘大语言模型的位置偏见

0
分享至

研究表明,大型语言模型(LLM)往往会过度强调文档或对话开头和结尾的信息,而忽略中间部分。这种“位置偏差”意味着,如果律师使用 LLM 驱动的虚拟助手在 30 页的宣誓书中检索某个短语,当目标文本位于开头或最后几页时,LLM 更有可能找到正确的文本。

近期,麻省理工学院(MIT)的研究人员揭秘了这一现象背后的机制。

他们创建了一个理论框架来研究信息如何流经构成 LLM 核心的机器学习架构。结果发现,控制模型如何处理输入数据的某些设计选择会导致位置偏差

实验表明,模型架构(特别是那些影响信息在模型内部输入词之间传播的架构)可能引发或加剧位置偏差,训练数据也会加剧该问题。

除了找出位置偏差的根源,他们的框架还可用于诊断并在未来的模型设计中纠正这一问题。这可能会催生:在长时间对话中更能保持话题的可靠聊天机器人;在处理大量患者数据时推理更公平的医疗 AI 系统;能更仔细关注程序所有部分的代码助手。

麻省理工学院数据、系统与社会研究所(IDSS)和信息与决策系统实验室(LIDS)的研究生、该研究论文的第一作者 Xinyi Wu 表示:“这些模型是黑箱,因此作为 LLM 用户,你可能不知道位置偏差会导致模型输出不一致。你只是按自己希望的顺序将文档输入模型,并期望它正常工作。但通过更好地理解这些黑箱模型的底层机制,我们可以通过解决这些局限性来改进它们。”

其他作者包括麻省理工学院博士后 Yifei Wang,电气工程与计算机科学系副教授、IDSS 和计算机科学与人工智能实验室(CSAIL)成员 Stefanie Jegelka,以及土木与环境工程系教授兼系主任、IDSS 核心教员、LIDS 首席研究员 Ali Jadbabaie。该研究将在国际机器学习大会上发表。

分析注意力机制

Claude、Llama 和 GPT-4 等大型语言模型由一种称为 Transformer 的神经网络架构驱动。该架构专为处理序列数据设计,将句子编码为称为“token”的片段,通过学习 token 之间的关系来预测后续词汇。

这些模型之所以擅长此任务,得益于注意力机制。通过多层互联的数据处理节点,让 token 能够有选择地关注(即“注意”)与之相关的其他 token,从而理解上下文。

但当每个 token 都需要关注 30 页文档中的所有其他 token 时,计算量很快就会变得难以处理。因此工程师在构建 Transformer 模型时,通常会采用注意力掩码技术来限制 token 可关注的词汇范围。例如,因果掩码只允许词汇关注其前面的内容。

工程师们还使用位置编码技术,通过标记每个词汇在句子中的位置来提升模型表现。

MIT 研究团队建立了一个基于图论的理论框架,专门研究这些建模选择(注意力掩码和位置编码)如何影响位置偏差。“注意力机制内部所有元素都相互耦合纠缠,很难单独研究。图论作为一种灵活的语言,能清晰描述注意力机制中词汇间的依赖关系,并追踪其在多层网络中的传递路径。”Wu 解释道。

理论分析表明,因果掩码会使模型对输入文本开头产生固有偏好,即便数据本身并不存在这种偏差。当句子开头词汇对语义并不重要时,因果掩码仍会迫使 Transformer 过度关注起始部分。“虽然句子首尾词汇通常确实更重要,但如果将大语言模型用于非自然语言生成任务(如排序或信息检索),这种偏差会带来严重问题。”Wu 指出。

随着模型规模扩大、注意力机制层数增加,这种偏差会被放大,因为输入文本的前段内容会在模型推理过程中被更频繁地使用。

研究还发现,采用位置编码技术强化词汇与邻近词汇的关联可以缓解位置偏差。这种方法能将模型注意力重新聚焦到正确位置,但在深层网络中其效果会逐渐稀释。

需要注意的是,这些架构设计只是位置偏差的来源之一,部分偏差可能来自模型训练数据本身对词汇优先级的设定。“如果已知数据存在特定偏差,除了调整建模方案外,还应该对模型进行微调。”Wu 建议道。

“中间迷失”现象

在建立理论框架后,研究人员进行了一系列实验:在信息检索任务中,他们系统性地改变正确答案在文本序列中的位置。实验揭示出“中间迷失”现象——检索准确率呈现U型曲线:当正确答案位于序列开头时模型表现最佳;随着答案位置向中间移动,性能逐渐下降;而当答案接近末尾时,准确率又略有回升。

这项研究最终表明,通过采用不同的掩码技术、精简注意力机制的冗余层数,或策略性地运用位置编码,都能有效降低位置偏差并提升模型准确性。“通过理论与实验相结合,我们得以洞察那些当时尚不明确的模型设计选择所带来的影响。若要将模型应用于关键场景,必须清楚知晓其适用边界与失效原因。”Jadbabaie 强调。

未来,研究团队计划深入探究位置编码的影响机制,并研究如何在某些应用中策略性地利用位置偏差。“这项研究为 Transformer 模型的核心——注意力机制提供了珍贵的理论视角。他们通过令人信服的分析,阐明了 Transformer 行为中长期存在的异常现象,证明注意力机制(尤其是配合因果掩码使用时)会令模型对序列开头产生固有偏好。这篇论文实现了双重突破:既保持了数学严谨性,又深入揭示了现实系统的运行本质。”未参与该研究的斯坦福大学计算市场设计中心主任 Amin Saberi 教授评价道。

https://news.mit.edu/2025/unpacking-large-language-model-bias-0617

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国空调欧洲订单大增 集运企业:每天四五十台寄到转运仓库,多从成都和惠州发货

中国空调欧洲订单大增 集运企业:每天四五十台寄到转运仓库,多从成都和惠州发货

封面新闻
2026-07-02 20:05:04
江苏7月气候预测:3次高温5次降水,极端最高气温40℃

江苏7月气候预测:3次高温5次降水,极端最高气温40℃

现代快报
2026-07-02 18:06:46
泽连斯基紧急回国!

泽连斯基紧急回国!

每日经济新闻
2026-07-02 17:59:23
黄有龙澳洲赌债案一审落槌:2.8亿输光、2.7亿还清,亿元利息主张

黄有龙澳洲赌债案一审落槌:2.8亿输光、2.7亿还清,亿元利息主张

天气观察站
2026-07-02 14:42:09
7月1日起信访新规:进京上访,须持省级“通行证”,否则不登记

7月1日起信访新规:进京上访,须持省级“通行证”,否则不登记

混沌录
2026-07-01 18:10:39
官方:马特乌斯-费尔南德斯加盟热刺,据悉转会费8500万镑

官方:马特乌斯-费尔南德斯加盟热刺,据悉转会费8500万镑

懂球帝
2026-07-02 17:16:24
西安老板严鹏跳楼自杀!知情人曝原因,最后朋友圈曝光写好了遗言

西安老板严鹏跳楼自杀!知情人曝原因,最后朋友圈曝光写好了遗言

娱乐圈圈圆
2026-07-02 10:45:10
曼城官宣夏窗首签!安德森加盟,转会费1.16亿,队史最贵引援

曼城官宣夏窗首签!安德森加盟,转会费1.16亿,队史最贵引援

奥拜尔
2026-07-02 21:12:06
突发!以色列宣布:打死伊斯梅尔·马斯里

突发!以色列宣布:打死伊斯梅尔·马斯里

每日经济新闻
2026-06-30 11:36:05
一路走好!1天时间4位名人被曝去世,最大78岁,最小才30岁

一路走好!1天时间4位名人被曝去世,最大78岁,最小才30岁

借你一生
2026-07-02 10:26:03
“凯恩不说话,只是一味进球”,拯救了整个欧洲

“凯恩不说话,只是一味进球”,拯救了整个欧洲

澎湃新闻
2026-07-02 11:58:18
约40个国家的元首或高级官员将参加哈梅内伊葬礼,莫迪受邀却无法出席

约40个国家的元首或高级官员将参加哈梅内伊葬礼,莫迪受邀却无法出席

红星新闻
2026-07-02 13:10:14
黄有龙澳洲赌债案落槌:2.8亿输光、2.7亿本金偿还、亿元利息主张

黄有龙澳洲赌债案落槌:2.8亿输光、2.7亿本金偿还、亿元利息主张

阿讯说天下
2026-07-02 09:56:50
再见了!冯小刚,《抓特务》票房惨败,属于冯小刚的时代结束了

再见了!冯小刚,《抓特务》票房惨败,属于冯小刚的时代结束了

翰飞观事
2026-07-01 14:52:44
扎哈罗娃:冯德莱恩是个“出色的骗子”

扎哈罗娃:冯德莱恩是个“出色的骗子”

参考消息
2026-07-02 14:14:08
女子迟到4分钟,大闹广州东站,还殴打员工,真容流出,麻烦大了

女子迟到4分钟,大闹广州东站,还殴打员工,真容流出,麻烦大了

川渝视觉
2026-07-02 08:53:57
成都一女子不洗手抱孙子,儿媳怒斥不卫生,儿子一拳打面中,母亲扬言要儿子坐牢,儿子却说:她活该!6年后现状曝光...

成都一女子不洗手抱孙子,儿媳怒斥不卫生,儿子一拳打面中,母亲扬言要儿子坐牢,儿子却说:她活该!6年后现状曝光...

背包旅行
2026-07-02 14:33:11
两大死亡之组六队全灭,法国赢球却闹内讧,哈兰德86分钟封神

两大死亡之组六队全灭,法国赢球却闹内讧,哈兰德86分钟封神

枯蝶
2026-07-02 08:15:45
世卫组织宣布与邮轮相关的汉坦病毒疫情结束

世卫组织宣布与邮轮相关的汉坦病毒疫情结束

界面新闻
2026-07-02 21:31:04
队报:塞内加尔出局,球队主帅蒂奥遭炮轰

队报:塞内加尔出局,球队主帅蒂奥遭炮轰

懂球帝
2026-07-02 20:07:09
2026-07-02 22:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16914文章数 515070关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

美军印太司令部恢复原名 学者:是一种战略收缩的信号

头条要闻

美军印太司令部恢复原名 学者:是一种战略收缩的信号

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

本地
艺术
数码
房产
公开课

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

艺术要闻

突破200米!上海未来浦西第一高楼,最新进展

数码要闻

联想扬天S660 27英寸配置上新,6999元

房产要闻

稀缺预警!海岸线200米+限墅令下,海南「绝版硬通货」来了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版