网易首页 > 网易号 > 正文 申请入驻

百万token上下文≠记忆:长上下文模型初学避坑指南

0
分享至

你最喜欢的那个大语言模型,现在支持100万token的上下文窗口了。宣传页面上到处写着:“能装下整部《哈利·波特》系列!两遍!还带脚注!”

一个拥有百万token上下文窗口的模型听起来很强——实际上它也的确很强。但这里有件事得先说清楚:一个模型有100万token上下文能力,意味着它能接收大量输入。至于它是否记得住、找得到、关联得上、或者正确使用这些信息,完全是另一回事。


这就是本文想拆解的核心问题:上下文容量和实际能力不是同一个概念。上下文长度=模型能接收多少信息,能力=模型能多好地运用这些信息。能塞进去,不代表能理解透彻。

“模型能读很多东西,那它自然能理解很多东西吧?”不一定。阅读≠准确记忆,阅读≠在关键时刻正确运用读到的所有内容。

那么,长上下文是坏事吗?当然不是。长上下文极其有用——它减少了激进的文本切块需求,对处理大型文档和庞大代码库很有帮助,也让很多工作流变得更顺畅。问题不出在长上下文本身,而在于人们期待长上下文同时完成完美记忆、完美检索、完美推理和完美摘要。现实世界的AI系统不是这么运作的。一套好的AI系统通常组合了长上下文、检索、记忆、摘要、结构化上下文和评估机制。

目前长上下文模型有三个已知问题值得关注。第一是“遗忘”,也叫“中间丢失”现象。关于长上下文模型的研究发现一个很有意思的规律:模型很擅长记住一大段输入的开头和结尾部分,对中间位置的内容却差得让人意外。如果你把那80页文档里最关键的一段文字埋在第40页的正中间,模型可能根本没注意到——尽管它技术上“读”过了。

第二是“大海捞针”式的遗漏。把一句特定的信息——比如“密钥是4471”——藏在一大堆文字里,然后让它找出来。有时候它精准命中,有时候却给一个自信满满的错误答案。token越多,草垛就越大,针能藏的地方也就越多。

第三是多跳推理的断裂。多跳推理意味着模型需要把散布在不同位置的多个事实串联起来——比如要同时关联第3页的事实A、第250页的事实B和第800页的事实C才能回答问题。事实链条拉得越长、位置越分散,模型就越可能在某个环节掉链子。更麻烦的是,它往往不会说“我不知道”,而是凭空编造一个听起来很合理的关联——也就是幻觉。

那有没有实际可用的应对方法?有的,这反而是本文更实用的一半内容。解决方案说起来简单:别再盲目信任,开始系统评估。在把模型放进你的应用或业务流程之前,针对你的长上下文使用场景做充分评估。相关消息显示,业内实践者正在强调:与其追求“更大的上下文窗口”这种听起来光鲜的方案,不如踏踏实实建立一套适合自己业务场景的评估体系。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
月薪2万吃不起的称重快餐,大规模倒闭!

月薪2万吃不起的称重快餐,大规模倒闭!

奇思妙想生活家
2026-06-28 19:01:28
广东本科志愿填报:490~550分省内公办,同位次今年要多考多少分

广东本科志愿填报:490~550分省内公办,同位次今年要多考多少分

音乐时光的娱乐
2026-06-28 19:27:14
美国大满贯疯狂一夜!国乒第一场失利,林诗栋温瑞博蒯曼强势全胜

美国大满贯疯狂一夜!国乒第一场失利,林诗栋温瑞博蒯曼强势全胜

小哆说体育
2026-06-29 11:37:34
不再嘴软!波兰外长当众宣判战局:俄军主动权彻底没了

不再嘴软!波兰外长当众宣判战局:俄军主动权彻底没了

老马拉车莫少装
2026-06-27 22:58:00
你的面子走不了

你的面子走不了

求实处
2026-06-27 22:10:03
李咏遗孀哈文母女吐槽欧洲热 反讽“什么是空调”

李咏遗孀哈文母女吐槽欧洲热 反讽“什么是空调”

TVB的四小花
2026-06-28 17:35:07
有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

健康科普365
2026-05-30 16:30:29
小卡交易谈判进展:快船已回绝所有报价 只有两种前提会放他离开

小卡交易谈判进展:快船已回绝所有报价 只有两种前提会放他离开

罗说NBA
2026-06-29 09:45:39
又一项新规落地,7月1日正式实施,70岁以上老人将面临4件事

又一项新规落地,7月1日正式实施,70岁以上老人将面临4件事

历史的游荡者
2026-06-28 17:48:38
1夜8大转会!扎卡加盟切尔西,热刺狂追托纳利,拜仁清洗努贝尔!

1夜8大转会!扎卡加盟切尔西,热刺狂追托纳利,拜仁清洗努贝尔!

田先生篮球
2026-06-29 07:38:13
疯狂梭哈!开拓者为杰伦布朗准备史诗报价,3大核心+4首轮全送

疯狂梭哈!开拓者为杰伦布朗准备史诗报价,3大核心+4首轮全送

布斯基
2026-06-28 21:32:35
白玉兰典礼最失落的莫过于杨幂,全身高定加珠宝,结果只是陪跑

白玉兰典礼最失落的莫过于杨幂,全身高定加珠宝,结果只是陪跑

浪子阿邴聊体育
2026-06-28 10:19:01
谁会成为党主席保卫战中郑丽文的最强护卫?出现了!非蒋亦非韩!

谁会成为党主席保卫战中郑丽文的最强护卫?出现了!非蒋亦非韩!

娱乐圈的笔娱君
2026-06-29 03:09:59
彻底堵死投机客,广州打响了第一枪!

彻底堵死投机客,广州打响了第一枪!

米宅
2026-06-29 07:23:34
62分惨败!男篮世青赛最惨一败:日本66比128惨遭美国队血洗?

62分惨败!男篮世青赛最惨一败:日本66比128惨遭美国队血洗?

篮球快餐车
2026-06-29 01:20:12
广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

听心堂
2026-06-28 16:28:35
中国用在南海造岛的手段,用在藏南,中印边境,攻守态势要逆转了

中国用在南海造岛的手段,用在藏南,中印边境,攻守态势要逆转了

让生活充满温暖
2026-06-29 01:25:01
伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

春夫杂谈
2026-06-26 19:28:20
女人最难戒的4种瘾:尤其是第3个,一旦尝过就忘不掉

女人最难戒的4种瘾:尤其是第3个,一旦尝过就忘不掉

王二哥老搞笑
2026-06-29 01:34:28
王楚钦3-0横扫,国乒6人晋级!王曼昱将迎战日本名将,石洵瑶3-2

王楚钦3-0横扫,国乒6人晋级!王曼昱将迎战日本名将,石洵瑶3-2

体育就你秀
2026-06-29 11:30:03
2026-06-29 13:24:49
固件更新中
固件更新中
有态度网友ytd
260文章数 50关注度
往期回顾 全部

科技要闻

OpenAI推迟上市,那“Kimi们”呢?

头条要闻

在德网友吐槽欧洲高温:赶紧结束吧 别逼我回武汉避暑

头条要闻

在德网友吐槽欧洲高温:赶紧结束吧 别逼我回武汉避暑

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

萧蔷宣布捐出参加“浪姐”所有收入

财经要闻

35岁职场人,又好找工作了?

汽车要闻

精致大气 尊界V800诠释顶级体验的新旗舰MPV

态度原创

亲子
本地
房产
数码
公开课

亲子要闻

老叶较真丨47天女婴从月嫂臂弯滚落摔伤致颅内出血,孩子远期后遗症风险如何兜底?

本地新闻

贵州小城的新目标:举办“村超”世界杯!

房产要闻

你敢想?海口房地产投资,暴跌5成!

数码要闻

1TB移动硬盘哪个好?相差近600元性能到底差多少?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版