网易首页 > 网易号 > 正文 申请入驻

百万 Token 治不好 AI 的失忆症:大模...

0
分享至

来源:市场资讯

(来源:CloudAI Sphere)

最近这段时间,大家肯定没少被各种“大模型支持 100 万甚至 200 万 Token 上下文”的新闻刷屏。扔一整本财报进去,扔几万行代码进去,模型几秒钟就能给你总结得头头是道。

很多人开始惊呼:既然上下文都这么长了,是不是大模型马上就要有真正的记忆了?以后是不是就不需要折腾什么外挂知识库了?

作为经常在业务一线和各种数据架构、AI Agent 打交道的人,我想泼点冷水。今天我们就来盘一盘,剥开百万上下文的狂欢外衣,大模型的“记忆”到底发展到了哪一步。

1. 1M Token 的本质是“内存”,它变不出长期记忆

大模型进入百万上下文时代,未来的趋势是什么?趋势就是单次任务的信息差会被彻底抹平。

但这里有一个极其核心的误区:上下文长度(Context Window)等于工作内存(RAM),不等于长期记忆(Hard Drive)。

你给模型一个 1M 的上下文,就像给它一块无比巨大的白板。它可以在上面推演极度复杂的逻辑,查阅海量的资料。但是,只要你点下“新建对话”(或者 API 会话结束),这块白板就会被瞬间清空。它不会记住你昨天跟它探讨过的系统架构,也不会记得你写代码时偏好的缩进风格。

因此,单靠扩大上下文,永远无法自然进化出真正的长期记忆能力。长期记忆需要的是跨会话(Cross-session)的状态保持和持续学习机制,这在底层的 Transformer 架构思路上就是两码事。

2. 百万上下文对“记忆系统”的真实冲击

如果说 1M 上下文没有创造记忆,那它改变了什么?它降维打击了那些“粗制滥造的短期记忆方案”。

在上下文只有 4K、8K 的时代,我们被迫把长文档切成无数个碎片,用 RAG(检索增强生成)的方式,每次小心翼翼地捞一点点相关信息喂给模型。这种体验其实很糟糕,容易丢失全局语境。

现在有了百万上下文,对于单次、封闭的文档问答场景,你真的可以“大力出奇迹”,全篇塞进去。这意味着,纯粹为了弥补上下文不足而做的“文本切片+粗糙检索”不再具有商业价值。它逼着记忆系统向更深、更复杂的方向演进。

3. 当前大模型的外挂记忆有哪些形态?

既然原生模型记不住,我们就得给它接“外脑”。目前市面上的形态基本可以分为三类:

  • 轻量级本地/内存存储(JSON/SQLite 等): 适合个人桌面端的工具。比如一个运行在你电脑上的 DataAgent,它可以用轻量级数据库默默记录你的个人偏好、高频词汇和日常操作习惯。

  • 向量数据库(Vector DB): 目前最主流的形态。把文本变成一堆多维向量数字,算相似度。优点是快,缺点是“瞎”。它只能做语义的模糊匹配,一旦遇到需要严格逻辑推理的业务问题,很容易张冠李戴。

  • 语义层与本体模型(Ontology): 这是未来企业级记忆的终极形态。不再是简单粗暴地存文本块,而是把知识沉淀为“以对象为中心(Object-centric)”的图谱结构。比如定义清楚什么是“订单”、什么是“客户”,它们之间是什么关联。当大模型调用这种记忆时,它拿到的是结构化的、绝对准确的业务逻辑,而不是一段模棱两可的文字。

4. 什么时候 1M 上下文也会捉襟见肘?

百万听起来很多,但在真实复杂的业务场景里,根本不够看。

  • 持续演进的 Agentic Workflow(智能体工作流): 想象你在推动一个为期三个月的复杂项目。一个称职的 AI 助手,需要记住第一周的会议纪要、第二周你推翻的架构方案,以及第三周客户发来的临时确认邮件。这些跨越时间周期的隐性上下文,你不可能每次对话都手动把前三个月的历史全喂给它一遍。

  • 动态更新的企业级数据底座: 企业的知识不是静止的一本书,而是每天都在疯狂变化的数据湖仓。几十万份文档、实时的流水流向,把这些全塞进上下文不仅成本高得离谱(Token 可是按量计费的),更可怕的是它会导致模型“信息过载”,无法区分信息的优先级和时效性。

5. 记忆系统的核心门槛到底在哪?

做记忆系统,“存进去”从来不是门槛,“拿出来”并且“拿得准”才是。

技术和产品的真正壁垒在于:

  • 抗幻觉与逻辑自洽: 你不能仅仅丢给用户一个答案。在严谨的商业环境里,记忆系统必须能做到 Show Your Work(展示逻辑链)。大模型是基于哪几条记忆碎片、经过怎样的推理得出结论的?这个溯源能力是核心门槛。

  • 记忆的“遗忘”与版本控制: 业务规则是会变的。上个月的策略,这个月可能就作废了。当系统里存在相互矛盾的新旧知识时,如何让 AI 精准地“覆写”旧记忆,而不是让两套规则在脑子里打架?这种精细化的数据治理能力,才是拉开差距的地方。

6. 云厂商下场做“记忆服务”,有戏吗?

肯定有戏,而且他们已经在做了。各种云上的托管向量数据库、开箱即用的 Memory API 层出不穷。

但云厂商提供的,往往是最底层的“水电煤”。他们能提供极低延迟的存储和检索接口,但他们不懂具体的行业 Know-how。

对于一个成熟的业务团队来说,记忆系统是要和现有的业务系统深度绑定的。云厂商能解决“如何存取向量”的问题,但无法解决“如何构建属于你们公司的业务本体框架”的问题。因此,在云厂商的基建之上,能够帮企业把杂乱的数据转化为 AI 能理解的结构化业务资产的中间层产品,依然有着巨大的蓝海。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昆明酒店劫持案中,为解救人质,反恐队员左胸防弹衣连中两枪,央视披露细节:距离3米左右被歹徒连续射击

昆明酒店劫持案中,为解救人质,反恐队员左胸防弹衣连中两枪,央视披露细节:距离3米左右被歹徒连续射击

大象新闻
2026-05-03 19:46:11
5月1日起全国高速不用ETC 凭车牌就可免卡上高速?官方回应:先别拆ETC 只是试点

5月1日起全国高速不用ETC 凭车牌就可免卡上高速?官方回应:先别拆ETC 只是试点

闪电新闻
2026-05-03 14:20:31
大外交|一周内高层通话、各界代表来华,中美互动进入“密集期”

大外交|一周内高层通话、各界代表来华,中美互动进入“密集期”

澎湃新闻
2026-05-03 16:12:28
场均20+5+6!又成骑士第一,猛龙主帅谈哈登很无奈,巴恩斯尽力了

场均20+5+6!又成骑士第一,猛龙主帅谈哈登很无奈,巴恩斯尽力了

巴叔体育
2026-05-04 11:47:07
5年3次降级!记者:伯恩利就是故意降级拿补贴的,应禁止他们升级

5年3次降级!记者:伯恩利就是故意降级拿补贴的,应禁止他们升级

天光破云来
2026-05-04 09:48:12
1-3!利雅得胜利遭爆冷16连胜终结 争冠悬念再起 C罗中框+4次吐饼

1-3!利雅得胜利遭爆冷16连胜终结 争冠悬念再起 C罗中框+4次吐饼

我爱英超
2026-05-04 06:07:28
我和一位“官二代”女镇长搭班子,才明白什么叫认知的碾压

我和一位“官二代”女镇长搭班子,才明白什么叫认知的碾压

千秋文化
2026-04-25 20:37:53
“一艘油轮在阿联酋附近被击中”

“一艘油轮在阿联酋附近被击中”

鲁中晨报
2026-05-04 10:05:02
90后女生在杭州做收纳师,月入1.5万!“团队每人每小时收费150元,第一步是教客户扔扔扔”

90后女生在杭州做收纳师,月入1.5万!“团队每人每小时收费150元,第一步是教客户扔扔扔”

都市快报橙柿互动
2026-05-04 11:18:48
宴会上,毛主席问溥仪:传国玉玺去哪了?溥仪的回答引起一片哗然

宴会上,毛主席问溥仪:传国玉玺去哪了?溥仪的回答引起一片哗然

浩渺青史
2026-05-01 01:14:21
西红柿5片叶和6片叶差别这么大!老菜农私藏技巧,再也不买错

西红柿5片叶和6片叶差别这么大!老菜农私藏技巧,再也不买错

开心美食白科
2026-05-02 05:04:18
NBA夺冠赔率更新:湖人骑士并列第五 雷霆领跑森林狼垫底

NBA夺冠赔率更新:湖人骑士并列第五 雷霆领跑森林狼垫底

罗说NBA
2026-05-04 11:57:00
曼联下任主帅即将水落石出!卡里克已参与计划未来,夏窗预算激增

曼联下任主帅即将水落石出!卡里克已参与计划未来,夏窗预算激增

罗米的曼联博客
2026-05-04 11:46:28
笑不活了!郭晶晶霍启刚贵州逛吃被拍,全网炸了这才是豪门天花板

笑不活了!郭晶晶霍启刚贵州逛吃被拍,全网炸了这才是豪门天花板

草莓解说体育
2026-05-04 05:54:18
菲政坛风云突变!关键五票倒戈,马科斯弹劾莎拉失败

菲政坛风云突变!关键五票倒戈,马科斯弹劾莎拉失败

兰妮搞笑分享
2026-05-04 09:15:58
太疯狂!五一捅了人窝了,无锡被“一亿人”攻陷,惠山古镇、南长街一片红!此刻,你挤在哪里?

太疯狂!五一捅了人窝了,无锡被“一亿人”攻陷,惠山古镇、南长街一片红!此刻,你挤在哪里?

锡望
2026-05-03 17:37:10
哈登18+6+3+3,骑士4-3淘汰猛龙!NBA季后赛8强出炉,4强预测如下

哈登18+6+3+3,骑士4-3淘汰猛龙!NBA季后赛8强出炉,4强预测如下

小火箭爱体育
2026-05-04 10:32:02
申花官方:蒋圣龙顺利完成肾脏穿刺引流手术

申花官方:蒋圣龙顺利完成肾脏穿刺引流手术

五星体育
2026-05-03 22:59:43
SK海力士股价上涨超10%,创盘中新高

SK海力士股价上涨超10%,创盘中新高

每日经济新闻
2026-05-04 10:47:04
汪小菲眼睛大变样!麦粒肿还没好?网友:别装了,就是割双眼皮了

汪小菲眼睛大变样!麦粒肿还没好?网友:别装了,就是割双眼皮了

小椰的奶奶
2026-05-04 07:47:59
2026-05-04 13:16:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3099509文章数 7115关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

大型邮轮暴发病毒致3死 曾有好莱坞明星夫妇染病死亡

头条要闻

大型邮轮暴发病毒致3死 曾有好莱坞明星夫妇染病死亡

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

严浩翔新歌,父母离婚17年矛盾升级

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

房产
亲子
家居
时尚
手机

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

亲子要闻

辛者库幼儿园反转!孩子沦为免费劳力,被奴役干活,宝妈怒退园?

家居要闻

灵动实用 生活艺术场

快看!!这个女演员近日暴瘦!!哦,知道了……

手机要闻

苹果首款曲面屏手机!iPhone 20 Pro系列来了:史上最大改款

无障碍浏览 进入关怀版