网易首页 > 网易号 > 正文 申请入驻

大模型的“健忘症”有药了

0
分享至


天才得了“健忘症”

过去的一年,大模型行业陷入了一场关于数字的军备竞赛。

从最初的8k Token上下文窗口,到随后的32k、128k,乃至近期已经有人喊出百万乃至千万级窗口。业界一度相信,只要窗口足够长,模型就能记住一切。企业主们试图将整座公司的知识库,倒入深不见底的输入框,以此炼就一位全知全能的数字员工。

然而,愿望很美好,现实很骨感。

在电商客服场景中,即便接入了顶流模型,支持超长文本,一旦对话超过十几轮,博学的AI依然会展现出“健忘”的一面:用户开门见山提到海鲜过敏,第五轮咨询商品时,AI依然热情推荐了含有海鲜的商品。而用户试图追溯之前的对话细节,提醒“基于我一开始说的预算”,模型却开始顾左右而言他。

大模型落地商业场景,常常遭遇隐形的高墙:输入越长,长程记忆越模糊;轮次越多,旧信息越快消散。

技术原理决定了这种局限。Transformer架构再先进,面对超长序列时,注意力机制也容易严重衰减。在人身上,这叫做“近因效应”,即对新发生的事情印象深刻,但久远的信息则被遗忘。在大模型身上,这意味着早期的精心指令会被后续的对话稀释,直到消失。

为了维持“记忆”,开发者不得不采取笨拙且烧钱的策略:把历史对话一次次打包,再次喂给模型。这就像为了让对方记住名字,你得在每句话开头都重新自我介绍一遍。Token消耗快速增长,每一次的简单问答,都是在烧钱。

多智能体的复杂任务中,缺失记忆共享机制,AI还会出现混乱。

企业通常将销售、客服、推荐、售后拆分给不同AI智能体。用户已向咨询智能体说明送货地址,但到售后智能体时仍需重新回答;用户刚向投诉智能体抱怨产品质量,推荐智能体转头继续推送产品升级版。这些场景本质上指向同一个问题:没有共享的长期记忆,AI之间无法协同,更谈不上理解。

现有的技术框架下,智能体往往各自维护独立的上下文窗口,这种割裂感导致了严重的决策冲突。

成本高昂、容易遗忘、协作割裂。企业花了大价钱引入大模型,得到的往往不是经验老到的资深员工,而是一群如果不反复重申指令就容易搞砸事情的“实习生”。

一个更接近人类记忆的方案,势在必行。

像人类一样记忆

“健忘”已成为制约大模型进一步提升的关键瓶颈。

过去一年,OpenAI、Anthropic、Google都在给大模型加“记忆层”,只是大多停留在产品功能层面,比如保留用户偏好、常见设定、近期对话线索,他们不知道什么该记,什么不该记。

而人工智能公司“红熊AI”尝试把“记忆”做成一套可管理、可共享、可追溯的基础设施,用来支撑多智能体、企业级应用和长期任务。这家从2024年11月份开始研发,内部商业化,到2025年11月经历过1年的时间,正式对外发布“记忆熊”,试图用反直觉地解决问题:跳出上下文窗口的参数竞赛,转向记忆科学。

底层逻辑并非“记住更多”,而是“记住更有价值的信息”。

记忆发端于数据。数据是未经加工的事实,例如37.5是个数字;当被处理并赋予意义,它便成了信息,如体温37.5摄氏度;信息进一步结构化,结合专业推论,形成“体温37.5度属于低烧”的判断,这便是知识;最后,知识转化为指导行为的能力,经过长期沉淀及验证,形成记忆,就可以给医生进行治疗决策。

在人类的认知视角下,存储不等于记忆。硬盘是容器,而记忆是动态的生命过程。红熊AI试图将人类大脑的记忆机制映射到AI架构中:


短期工作记忆,用于保持任务连接。这种模拟人类“感官缓存”的记忆,利用情感倾向加权算法,识别带有强烈情绪或关键指令的数据(如愤怒的投诉、明确的截止日期),将其标记为高优先级。

长期显性记忆,对应知识库和模型参数,用于沉淀经验;以及隐性记忆,对应用户偏好、企业“暗知识”,用于形成习惯和判断。

隐形记忆存储了用户的偏好模型、任务的隐式规则以及企业的“暗知识”,这是传统数据库最难处理的部分。比如,用户提到“加班”,AI应自动联想到“咖啡”或“打车”。同时将标准工作流程内化为“程序性记忆”,使AI在面对愤怒客户时,本能地执行安抚流程。

这部分记忆不会固化在大模型参数中,而由独立的“记忆模块”来存储和管理。系统的记忆萃取引擎可以决定:哪些应该保留?哪些应该遗忘?哪些应该在下一次用户提问时主动调用?

通过这种分层映射,记忆熊在硅基芯片之上重建了一套数字化记忆系统:“数字海马体”负责将信息加工、编码,“数字皮层”则作为仓库,长期存储知识和过往经历,而“数字杏仁核”则负责绑定情绪。

事实上,大模型深度赋能垂直行业的前提,正是拥有如人类般出色的记忆机制。

没有记忆,AI只能永远停留在“即时生成”的阶段,它能回答每一次问题,却无法从交互中成长。解决了记忆问题,AI才能进化为兼具理解与推理能力的智能体。

硅脑加装记忆外挂

精妙的记忆机制对技术能力提出了更高要求。

记忆熊的做法是构建记忆图谱,将各类记忆内容用结构化方式表达出来,挖掘分析这些记忆及相互关系,进而匹配出不同业务场景下需要的记忆和结构。这种结构化能力也赋予了AI一定的联想与多跳推理的能力,使得信息更连贯、推理更准确的同时,也能联动相关场景和背景知识。

如此一来,类似于人们听到“早晨”一词联想起“旭日东升”、“豆浆油条”、“公园遛鸟”或“交通拥堵”的使用场景也就不难实现了。

同时,记忆熊打通了平台,让智能体共用同一套用户记忆,不再各自为政,确保用户意图、情绪、历史问题等多样化标签无缝传递。用户一次提供信息,智能体同步获取,智能体群控记忆共享率达到了99.99%,基本能够消除因记忆不同步导致的服务问题。

这种针对“大模型健忘症”核心症结的深层次优化,使得记忆熊做到了“省、准、快”,为大模型在垂直领域的商业落地奠定了基础。

首先,是成本断崖式下降。通过引入独特的记忆分层存储机制,不需要每一轮对话中都回传所有的历史信息,压缩短期记忆为长期记忆摘要。这一机制让多轮对话累计的Token消耗直接降低了90%,对于那些每分钟都在烧钱的大模型应用来说,无异于神助。

其次,是精准度数量级提升。使用动态语境校准和智能语义剪枝技术,记忆熊将垂直场景的幻觉率压低到了0.2%以下,端到端的回应准确率达到了99.6%,大模型不再一本正经地胡说八道。特别在代表复杂逻辑能力的多跳推理和时序记忆上,记忆熊的表现领先诸多主流框架,证明它具备了区分过去与现在的时间感。

最后,是响应时间进一步缩短。人机交互中,延迟关乎体验。记忆熊基于向量的非图谱版本,成功将搜索请求的中位响应时间(Search Latency P50),即普通用户最常见的速度体验控制在0.137秒;语音交互场景下应答延迟仅0.8秒。当你话音刚落,AI的回答已经到达耳边,对话流畅自然。

“记忆即资产”

“记忆”的突破,终将重塑商业的形态。

在商业世界里,大模型有没有记忆,差异尤为明显。

客服AI若记不得用户投诉过的细节,就只能重复问题,无法取代真人;企业知识若不能不能转化为经验沉淀在系统里,AI就只能永远充当知识库;在教育、医疗及投顾等行业,若AI无法与客户建立持续深入的联系,它就无法进入高信任度的场景。

记忆不仅仅是一个功能,更是一种身份。

当AI有了持续的记忆,它就第一次具备了回答“我是谁?”、“我在与谁沟通?”、以及“我们之前达成过什么共识”的能力。

为充分利用记忆资产,红熊AI记忆熊产品明确了三条产品主线,分别是隐性记忆的显性化、记忆的结构化处理,以及记忆的场景化应用。简而言之,就是要将把AI与用户的交互沉淀为记忆,并在不同的业务场景下发挥作用。

模型参数里只有可复述的显性知识,但要企业的护城河往往在于隐性经验:金牌销售如何破冰?资深技工如何听音辨位?这些过去依赖个人经验的“暗知识”,现在可以通过记忆熊被结构化地沉淀下来,成为组织记忆,而非单个员工的独家记忆。

大模型没法记住一切,因为内容越多、参数越大、会话越长,则成本越高、遗忘越快、幻觉越多。记忆熊能帮助大模型构建一个“语义剪枝+记忆锚定+情境校准”的机制,结构化处理记忆,只保留与用户身份、历史行为及任务目标有关的核心记忆。

在企业的真实业务场景中,往往是多个智能体协同工作。记忆熊能记忆变为组织资产,而不是单个智能体的独家记忆,提升记忆共享率,则是模型协同的关键。

这三件事,推动记忆从技术功能拓展为商业基础设施。当企业开始关注“AI是否能复用经验、是否能像老员工一样理解上下文、是否能形成组织记忆”时,AI正式从工具进入体系阶段。

结尾

参数规模的战争终将结束,但智能体的进化才刚刚开始。

参数规模不是终局,记忆才可能成为真正的操作系统级入口。AI的下一场战役,不是“谁回答得更好”,而是“谁更记得住”,这仍然是一场初创公司可以参与的竞争。

跳出具体的商业场景,记忆实际上是通往通用人工智能(AGI)的必由之路。

没有记忆,就没有推理;没有记忆,也就没有智能。人类之所以成为万物之灵,是因为我们拥有强大的记忆系统,能够跨越时空积累经验,从历史中预判未来。

当前大模型虽然在语言生成上表现惊艳,但在逻辑推理、长期规划和自我进化上,依然有着巨大的进步空间。这归根结底,是因为它们缺乏一个稳定、连续且可塑的记忆系统。


红熊AI的探索,实际上是在补全AGI拼图中最关键的一块。它不仅让AI感知到数据的模式,还能理解并记住世界的规则。

红熊AI于2025年11月30日正式将记忆熊产品完全开源,邀请全球的开发者共同参与这场关于AI记忆的重构。

也许就在不久的将来,大模型的健忘症很快被治愈,一个拥有“累积性智慧”的时代就此徐徐拉开序幕。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4811016.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
恩比德赛后警告马克西:别再故意罚丢!76人险胜背后的惊险决策

恩比德赛后警告马克西:别再故意罚丢!76人险胜背后的惊险决策

大眼瞄世界
2026-01-30 12:11:09
浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

不写散文诗
2026-01-30 12:16:42
A股:今天跳水到4064后回升,种种迹象表明,A股或开启更大级别变盘

A股:今天跳水到4064后回升,种种迹象表明,A股或开启更大级别变盘

股市皆大事
2026-01-30 11:57:15
央视揭秘“夺命红薯”!商家故意投毒,已蔓延全国多地,赶紧扔掉

央视揭秘“夺命红薯”!商家故意投毒,已蔓延全国多地,赶紧扔掉

阿纂看事
2026-01-30 10:31:58
两性关系:不管你信不信,男性过了68岁,基本都有这七个常见状态

两性关系:不管你信不信,男性过了68岁,基本都有这七个常见状态

健康科普365
2026-01-28 11:04:57
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
特朗普始料未及!中国换了种方式抛售美债,美专家承认:完全没招

特朗普始料未及!中国换了种方式抛售美债,美专家承认:完全没招

晓焎科普
2026-01-29 21:11:42
四川女大学生到东北游玩晕倒雪地冻伤,左手三根手指或面临截肢!2300余名爱心人士伸援手

四川女大学生到东北游玩晕倒雪地冻伤,左手三根手指或面临截肢!2300余名爱心人士伸援手

红星新闻
2026-01-29 16:07:17
大S雕像揭幕官宣!出席名单曝光,汪小菲带娃登金宝山成最大看点

大S雕像揭幕官宣!出席名单曝光,汪小菲带娃登金宝山成最大看点

八卦王者
2026-01-30 11:12:18
阿富汗禁止女性接受教育?孙玉良:这样的塔利班政权必须被唾弃

阿富汗禁止女性接受教育?孙玉良:这样的塔利班政权必须被唾弃

孙玉良
2026-01-29 09:55:03
中美舰艇激烈对峙,美舰猛冲向052D,当场过招,我军笑到最后

中美舰艇激烈对峙,美舰猛冲向052D,当场过招,我军笑到最后

泠泠说史
2026-01-29 12:02:44
人能狠到什么地步?

人能狠到什么地步?

汉周读书
2026-01-30 12:00:08
预制菜已经发展到什么程度了?网友:在江西,预制菜可能不大好卖

预制菜已经发展到什么程度了?网友:在江西,预制菜可能不大好卖

解读热点事件
2026-01-29 04:57:21
50亿打造的古镇变“空城”!2014年,湖南常德桃花源古镇开工建设

50亿打造的古镇变“空城”!2014年,湖南常德桃花源古镇开工建设

有书
2026-01-29 14:29:14
1923年,戴笠在表弟家睡地铺,飞黄腾达后的处置方式让人大跌眼镜

1923年,戴笠在表弟家睡地铺,飞黄腾达后的处置方式让人大跌眼镜

磊子讲史
2026-01-23 15:21:12
廖锡龙将军去世!他曾怒骂谷俊山:我死都不怕,还怕一个贪官?

廖锡龙将军去世!他曾怒骂谷俊山:我死都不怕,还怕一个贪官?

帝哥说史
2026-01-29 22:15:39
李世民霸占杨妃后,当晚逼她做一件事,门外的史官记录得面红耳赤

李世民霸占杨妃后,当晚逼她做一件事,门外的史官记录得面红耳赤

铭记历史呀
2026-01-27 15:16:33
美媒:确认中国霹雳-17导弹真实存在,该导弹性能让美国十分担忧

美媒:确认中国霹雳-17导弹真实存在,该导弹性能让美国十分担忧

阿龙聊军事
2026-01-29 11:31:57
擦一次就五六百,就问擦不擦呢?

擦一次就五六百,就问擦不擦呢?

红中本人
2026-01-25 15:25:03
A股:今天,股市突然跳水,意味着什么?做好准备,很可能这样走

A股:今天,股市突然跳水,意味着什么?做好准备,很可能这样走

史行途
2026-01-30 12:21:07
2026-01-30 16:16:49
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25672文章数 687411关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

水贝黄金平台杰我睿暴雷无法兑付:有人超5000万元入局

头条要闻

水贝黄金平台杰我睿暴雷无法兑付:有人超5000万元入局

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

金晨出事前 曾灵魂发问未收到春晚邀请

财经要闻

血铅超标工人,挡在“劳动关系”门槛外

汽车要闻

售7.999万元起 2026款大众朗逸新锐上市

态度原创

数码
游戏
健康
时尚
公开课

数码要闻

华硕AM5主板更新Beta BIOS,升级AGESA 1.3.0.0并新增内存功能

叩问人性的生存挑战 生存模拟游戏《斩杀线》Steam 商店页面公开

耳石症分类型,症状大不同

推广|| 冬天利用率超高的裙子,怎么搭都对!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版