网易首页 > 网易号 > 正文 申请入驻

Agent 真正的护城河,正在从工具转向记忆资产

0
分享至

2026 刚开年,Anthropic 就用 Claude Cowork 开启了 AI 行业新的创业热点。

在 Claude Code 的能力基础上加上 GUI 界面、对普通用户更友好,Cowork 的火热证明了,在主动进入用户的工作环境后,桌面 Agent 大有可为。

而 Cowork 计划引入知识库(Knowledge Bases)获得「永久记忆」能力的爆料,则把 Agent Memory 这个业界还没有落地共识,但 infra 层已经「混战」许久的各种框架的探索,推到了 AI 创业的最前线。

从最早的 RAG、Agent Context 到如今大家都在讨论的 Agent Memory,「记忆」现在已经是影响 AI Agent 的关键因素之一。用户画像的维护和更新、跨对话跨任务的记忆维护,以及更主动、更懂用户的 Agent,都对 AI 产品的 Memory 能力提出了更高的要求。

很明显,这不是靠继续提高模型上下文长度、更复杂的 RAG、N 个外挂的知识库就可以轻易解决的问题。

今天我们想探讨的,是为什么独立的 Memory 层正在成为必需品,而一套工程化的记忆系统,又需要有哪些能力。

以及,为什么我们不建议开发者自己上手做记忆系统。

⬆️关注 Founder Park,最及时最干货的创业分享

YouWare 推出快一年了,Coding 赛道在 2025 年有了不少新的变化。

Coding 赛道在 2026 年会有什么样的变化?Vibe Coding 还会继续火热吗?

本周三(1 月 28 日),Founder Park 直播间,张鹏对话 YouWare CEO 兼创始人明超平,深度复盘创业这一年。

01「放弃」RAG 和长上下文吧,行业需要独立的 Memory 层

模型能力在过去两年持续变强,尤其是 coding 和工具使用能力上,推理越来越像样,工具调用越来越熟练,Agent 产品的能力越来越让人惊喜。

卡住工作流和交付的地方,反倒是连续性,上一轮沟通谈过什么,这一轮还能不能接上。偏好和边界有没有被正确继承。任务推进到哪一步,能不能稳定复盘。也因此,有了 Context Engineering,重点解决工作流过程中上下文的高效传递、Agent 之间的协同。

但更广泛的记忆问题始终没有很好得到解决,那些事关人类的知识、记忆与情感,历史沉淀与持续协作的部分。

行业过去做记忆,最常见的两条路:上下文变长,以及 RAG。

更上的上下文能解决一部分问题,但解决不了根本问题。

真实业务的记忆是持续增长的数据流,信息不断写入,不断修正,不断过期。把它们一股脑塞进上下文,推理成本会跟着增长,噪声也会跟着增长。信息越多越像垃圾堆,模型越难稳定抓住关键点。窗口再大,选择、组织、版本管理也不会自动发生。ChatGPT、Gemini 等通用型 Chatbot 在现阶段已经在一定程度上缓解了域内用户记忆的问题,但在实际使用过程中,用户仍普遍感到「不够用」。究其原因,一方面是其记忆能力主要局限于单一产品,难以实现跨域的统一管理;另一方面,其 API 服务本身并不具备持久化记忆能力,使得连续、长期的用户体验仍需要由业务侧自行补足。


还有一个问题是,长上下文带来的任务复杂度的增加,以及模型性能的折损,都让行业开始更高效地管理上下文,而不是无限制地增加模型自身的上下文。

RAG 同样有边界。早年流行 RAG,是因为通过给模型增加一个可以实时查阅的外部数据库,RAG 架构可以突破模型训练数据的时效限制,让模型掌握各种训练中未曾接触的新信息、新知识以及各种企业内部数据。

但很明显,RAG 属于偏被动的补给方式,致命短板的是:被动与割裂。

从工程角度来看,向量数据库的操作门槛极高,相关的数据更新与导入通常以周为单位,跟不上实时协作的节奏。

其次,传统 RAG 检索触发完全依赖用户提问,信息存储无权重区分,随着知识库规模扩大,无效召回率会持续上升,甚至影响最终的回答准确率。

最重要一点则在于,RAG 只能完成单次的检索召回,但无法支撑长期协作场景下的经验沉淀、偏差校正与业务规则对齐,执行一些长期任务,就需要用户反复手动检索拼装、投喂大模型,低效且不可控。这类问题的根源,并不在检索本身,而在于「记忆」一直被当作一次性数据,而不是可持续演化的系统状态来对待。

有一类 AI 记忆产品,已经不再把记忆当作检索结果,而是当作可调度的单独记忆层进行尝试和探索。


从成本和模型能力上来看,上下文和 RAG 背后有三类硬约束。

第一是成本与性能。注意力计算对无差别吞下历史不友好,系统需要控制「该用的记忆在该用的时刻以可控的量注入」。

第二是复用与迁移。真实的工作流跨系统、跨端,多模型并用又进一步放大了迁移需求。记忆绑定某个模型或某个应用,迁移摩擦会变成锁定成本,组织试错会变贵,迭代会变慢。

第三是治理与合规。企业需要能改、能删、能追责。记忆放在参数里更新慢且难审计,写在提示词里来源乱且难治理,堆在日志里调用与融合缺少机制。治理要求会把记忆从「模型附属」推向「独立层」。

当成本、迁移与治理同时成为硬约束时,记忆继续依附在模型或应用之上,已经难以成立。记忆不再是某个功能模块,而是和计算、存储一样,需要被统一调度与管理的系统资源。记忆张量作为行业内最早一批的探索者,推出的 AI 记忆产品 MemOS 将记忆作为一等系统资源独立出来,通过精细调度精确控制记忆注入,避免计算负担;将记忆抽离于单一模型或应用,实现跨模型、跨端复用,降低迁移摩擦;同时提供分层、可编辑、可审计的管理,让企业能够修改、删除或追责,确保记忆资产既安全可控,又可治理与长期演化。

独立的 Memory 层是必然的结果,进一步则还需要对 Memory 也进行分层,解决不同信息的归属。需要调度,解决写入与唤醒的全局最优。也需要治理,把记忆做成可控资产。通过将历史对话、用户资料、用户偏好长期存储、主动调用,模型的智能就从当下正确升级为⻓期⼀致、可积累、可演化。

通俗点说,就是有了主动的记忆,模型就能够从人类的助手,变身成为人类的伙伴与搭档。

在 B 端:对程序员,AI 需要记住其代码风格、协作规范与历史项目,才能产出生产级代码;对产品经理,AI 要厘清现有功能架构、技术依赖与业务目标,让新需求落地更顺畅。

而 C 端场景中,主动记忆是情感连接的基础。当代人越来越习惯于大模型交流各种情绪困扰,而 AI 需要精准关联过往人物关系与矛盾点,提供针对性回应,才能实现从机械应答到持续陪伴乃至数字分身的升级。

也是因此,AI 记忆类产品、单独的 Memory 层正逐渐成为大模型、乃至所有 agent 的关键基础设施。

02一个好用的记忆系统,需要什么?

当我们提起记忆时,它的本质是历史事实、客观知识、感受、情感的集合。这也意味着,记忆系统本身就不可能是单一结构或单一策略,而需要像操作系统一样,对不同形态的记忆进行统一抽象与管理。

因此,构建主动记忆需要一套复杂的系统工程。过程中,既要攻克技术架构的难题,又要平衡成本与效率的天平。技术架构的合理性与成本效率的平衡,直接决定落地可行性。技术架构需解决存储、算力与调度的协同问题,成本控制则关系到商业化落地的可持续性。

成本压力主要来自存储与算力两方面。

存储端,内存、磁盘与 S3 对象存储的单位成本差异可达数十倍。海量的用户记忆、历史行为数据不能一概而论,以同样的成本存储,这就需要根据访问频率动态分层存储,对工程化调度能力提出极高要求。

算力端,Transformer 的 attention 机制天然不适合「⽆差别吞下全部历史」,当前架构下,⾯向应⽤场景的⽆限⻓下⽂是⼀个伪命题。⼀旦把记忆不加筛选地塞回上下⽂,序列⻓度增⻓会显著推⾼推理时延、吞吐压⼒与显存占⽤,所谓无限长上下文与记忆在实际应用中难以落地。

这也引申出了第二个问题,记忆需要差异化管理,并为其赋予不同的权重并统一调度

就像人类大脑会将情感、事实、逻辑存储在大脑不同区域,按需唤醒。AI 记忆也需遵循此逻辑,给记忆配备一个类似 skill 的分层,并说明合适唤起什么记忆,相关记忆的重要性,以及记忆应该如何使用。

在这⼀领域,关键是对于记忆进行分层管理,从而把「记忆」从⼀个外挂数据库,升级为可调度、可治理、可演化的系统能⼒。

这一思路,已经开始在部分 AI 记忆产品中以更工程化的方式落地,例如 MemOS 所提出的多层记忆架构。它并不把记忆视为简单的外挂存储或一次性检索结果,而是将记忆抽象为具备生命周期与调度属性的系统资源:不同类型的记忆被生产、激活、合并、衰减与归档,并在推理前根据任务目标与上下文状态被精确唤起。通过对存储层级、算力消耗与记忆使用方式的统一编排,MemOS 试图在工程可行性、推理效率与长期一致性之间,建立一套可落地、可扩展的记忆管理范式。

其三层记忆可以拆解为:

参数化记忆:主打沉淀低频更新、高复用的通用能力与稳定知识,比如编程语法、行业通识;承载稳定能力与长期泛化知识。

激活记忆:主要承载推理过程中的短期/中期状态(如 KV 工作记忆),决定即时交互效率;承载短期到中期的工作状态,例如任务目标、关键变量、正在推进的上下文,它需要快写快用,用完衰减。

明文记忆:更偏向于存储可解释、可治理的外显信息,比如业务事实、用户偏好与合规元数据。需要可检索、可编辑、可审计。


全局调度系统,则是三层架构的核心枢纽,负责统筹记忆的写入、存储、唤醒、更新与淘汰全流程,避免无效信息占用资源。全局调度要让记忆变成一个可优化的读写体系。

统一抽象、统一调度、统一治理,记忆从某个产品的附属能力,走向上层智能体与应用的共同依赖。

尤其是多模态模型正成为主流范式,用户的记忆资产也开始多模态化,单纯的补丁或者资产,还是停留在将记忆当成内容存起来的思路,我们需要的是可治理、可迁移的记忆系统。

03模型厂商会把记忆层吃掉吗?两种路线会长期共存

2025 年在跟知名科技记者 Ben Thompson 对谈时,Sam Altman 明确表示:希望 OpenAI 成为一个平台和入口,「你可以用你的 OpenAI 账号登录任何想要集成我们 API 的平台,你可以带着你的信用额度套餐、定制模型以及其他所有东西去任何你想去的地方。」用户的所有行为、身份、偏好和数据,ChatGPT 都记得。

OpenAI 最近在官⽅⽂档中持续强调「已保存记忆」的管理与控制(可关闭、可删除、也可⽤临时对话避免引⽤忆);Google 在 2026 年 1 ⽉把 Personal Intelligence 扩展到 Search 的 AI Mode,允许⽤户选择加⼊,将 GmailPhotos 等个⼈数据接⼊以⽣成更贴合个⼈偏好的答案与建议;Anthropic 则是持续在 Corwok 上发力。

逻辑很清晰。模型厂商也在把「更懂你」推进到更深的个⼈上下⽂,把记忆内生进模型与入口,通过默认工作流与端到端优化,把体验做成闭环。让单个助⼿更连贯、更像⼀个⻓期使⽤的产品⼊⼝。

从体验上来说对用户是绝对的加分项,但从记忆管理的角度来看,问题也很明显:维护成本高、切换成本高、以及体验割裂化。

ChatGPT 和 Claude 的月费已经在朝着 200 美元的门槛迈进,未来可能基础的包月费用(20 美元/月)会继续涨价,为了维持和管理个人的记忆,用户需要支付的成本越来越高。

换模型的成本也越来越高,数据显示,全球范围内,SOTA 模型的平均保质期仅 35 天,半年后,曾经的 SOTA 模型大概率跌出行业前十,也是因此,用户本身对模型的忠诚度,并未如互联网时代一样形成所谓的生态效应。将记忆绑定单一模型,就会导致用户切换模型时,需重新投喂历史信息,迁移成本极高。

即使不考虑模型的迁移,用户往往会选择多个模型、agent 并用,这也就导致数据与记忆分散在不同平台,形成割裂孤岛。

另外,从产品策略上来看,模型厂商在强调的,始终是产品入口侧的记忆,强调个性化和更懂用户。

但独⽴ Memory 层要回答的是另⼀类问题:把记忆当作可治理、可迁移、可复⽤的资产。⽀持在不同模型与⼯作流之间保持连续性,⽽不是被锁死在某⼀个⼊⼝⾥。

在这一方向上,记忆张量则尝试以「操作系统」的视角来重构 AI 记忆体系,并首创性地提出以 Memory Operating System 的形式承载个人与组织记忆,使其不依附于单一模型或入口,而是作为可迁移、可复用的独立基础设施存在。


⼀个很有代表性的「资产层信号」,是市场上已经出现了「记忆共享」式的交互形态:例如,在浏览器侧提供⼀个独⽴⾯板,把⽤户在多个助⼿平台(如 ChatGPT、Gemini、DeepSeek、通义等)的历史对话、偏好与⼈物设定做⼀键迁移与⾃动同步,再把这些信息清洗结构化成统⼀的个⼈记忆档案;当⽤户切换到任意模型/应⽤时,系统会在后台静默注⼊必要上下⽂,并⽀持把⽂档沉淀为可复⽤的个⼈知识库,同时提供「查看/编辑/删除」的可控⼊⼝——强调「记忆跟⼈⾛/跟组织⾛」,⽽不是「记忆跟某个平台⾛」。

记忆张量近期推出的 MemOS-MindDock 本质上是一个以「个人记忆主权」为核心的个人跨模型记忆助手,能够将分散在不同 AI 助手中的历史对话、偏好与人物设定统一沉淀为可控、可迁移的个人记忆档案。这也从产品与交互层面进一步佐证了这一趋势:用户开始要求记忆的归属权回到个人本身,而非被平台长期占有。

在组织协作场景中,这种独立记忆管理的优势更为突出。

个体通常在组织中运转、工作,组织信息构成个体实际工作的真实上下文。而组织的记忆管理,则是一个典型的多 Agent/多部门/多用户场景,需要记忆隔离、权限管控、可观测性等工程能力。MemOS 推出的 MemCube 概念,可以将每个记忆单元封装为独立模块,设定访问权限与生命周期,承载多种形态的记忆条目,既保障企业数据的安全隔离,又支持团队内部的记忆共享,适配多个体、多 Agent 等形式的协作需求。

两条路线对应着不同的产业逻辑:模型派试图通过记忆强化入口优势,借助数据壁垒,换来用户忠诚度;第三方中立派则想做 AI 时代的独立记忆基础设施,让所有模型、所有 agent 都具备记忆能力,让记忆成为各个场景中的通用基础设施。

04把记忆做成资产层,是行业发展的必然趋势

AI 陪伴,尤其是主打陪伴的 AI 硬件玩具成为 25 年下半年的热门赛道,比如热销的芙崽(Fuzozo)。越来越多的玩家也在进入这个赛道,硬件的竞争、Agent 能力的竞争、如何在陪伴上做出自己的「Aha moment」,很卷,也都很难。

在与一位从业者交流后,发现他们的一个核心技术难题是,如何做好玩具的记忆管理。哪些对话要长期管理、哪些对话要短期管理、什么时候调用哪种记忆、交给模型自己判断还是人为记上很多规则,以及更重要的,有了这些记忆后,怎么样让陪伴成为一件主动的事情。

很难,而且很明显不是一个团队自己手搓一个系统就能很好解决的问题。

靠提示词,能让单次的对话变得很聪明,但长期互动需要的高情商和惊喜,需要一套系统化的管理方案。

记忆的管理、更新、增删和调用,参数化记忆、激活记忆、明⽂记忆的联合动态管理,同时还要有基础模型的训练能⼒,不然基于 Prompt⼯程简单构建的记忆系统很快也会模型上下文的问题:成本、幻觉和优化的边际效应递减。


既能服务上层多种 Agent/应⽤,也能适配下层模型的快速迭代,⽽不是被锁死在某个⼊⼝体验⾥。

一个专业的 Memory 层系统,比如 MemOS、比如 Mem0,才是一个更好的选择。而 MemOS 的代表性,恰恰在于它抓住了当前 AI 产业最确定的趋势之一:模型会快速迭代,入口会不断更换,但长期价值只能沉淀在独立于模型与入口之外、可迁移、可治理的记忆系统之上。

而在记忆工程化之后,专业场景也会是最先受益的场景之一。

专业工作天然依赖上下文积累、版本演进与流程协作。Agent 能不能接力,能不能复盘,能不能稳定执行标准,记忆决定了交付上限。

今天流行的 Skill 技能,其实就是方法论和流程的记忆具象化,包括但不限于投研框架、尽调清单、评审标准、写作风格、论证结构等等。如果没有可控记忆,Skill 往往停留在模板与提示词,复用与迭代都很脆弱。

组织侧的变化更直接。多部门、多用户、多 agent 场景需要隔离、权限、可观测性。记忆系统若能把共享与隔离同时做好,就能尽可能减少协作的摩擦,真正成为可以协作的 AI 同事。

于专业场景的 agent 而言,它是高效协作,完成具体任务的加速器;于 AI 陪伴赛道而言,随着当代人越来越孤独,越来与需要情绪价值,持久的记忆会成为模型从聪明到理解再到高情商陪伴数字分身的灵魂进化源头。

换句话说,模型可以更替,⼊⼝可以变化,但记忆资产需要可迁移、可复⽤、可治理——这也是记忆管理系统能够成为资产层、成为基础设施的叙事成立的核心关键。

当前阶段,基于记忆基础设施层的构建,以及在此基础上的应用创新,已然成为创业的热点。


转载原创文章请添加微信:founderparker

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日韩股市集体收涨 韩国综指涨2.73%

日韩股市集体收涨 韩国综指涨2.73%

财联社
2026-01-27 14:33:08
中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

黑翼天使
2026-01-10 03:28:16
与富商海外产子真相大白8个月,江疏影官宣喜讯,王传君没说错

与富商海外产子真相大白8个月,江疏影官宣喜讯,王传君没说错

阿纂看事
2026-01-27 16:11:35
岳父大人的狠毒用心,他是一点看不懂啊!

岳父大人的狠毒用心,他是一点看不懂啊!

BenSir本色说
2026-01-26 22:03:54
世界大学排名前10名大学中有8所来自中国,浙大超哈佛荣登榜首,哈佛滑至第三

世界大学排名前10名大学中有8所来自中国,浙大超哈佛荣登榜首,哈佛滑至第三

观威海
2026-01-27 09:30:11
达沃斯爆猛料!布达诺夫证实大国未向俄罗斯供武器

达沃斯爆猛料!布达诺夫证实大国未向俄罗斯供武器

老马拉车莫少装
2026-01-23 00:05:42
国家出手,张雨绮恐彻底凉凉!私生活再添实锤,不止代孕这么简单

国家出手,张雨绮恐彻底凉凉!私生活再添实锤,不止代孕这么简单

白日追梦人
2026-01-27 23:02:35
后悔也晚了!大批F35逼到家门口,伊朗却发现红旗9和歼10还未到位

后悔也晚了!大批F35逼到家门口,伊朗却发现红旗9和歼10还未到位

介知
2026-01-26 20:34:56
英国政府承认:特朗普有“一票否决权”

英国政府承认:特朗普有“一票否决权”

环球时报国际
2026-01-27 00:18:07
福建省启动2026年独生子女奖励申报!发放标准、条件、材料,看看

福建省启动2026年独生子女奖励申报!发放标准、条件、材料,看看

云鹏叙事
2026-01-27 08:53:13
军委副主席,过去四十年来人数上的变化

军委副主席,过去四十年来人数上的变化

深度财线
2025-10-21 13:06:54
央视最新曝光:中美疑似爆发激烈海上交锋,外舰挑衅被我052D锁定

央视最新曝光:中美疑似爆发激烈海上交锋,外舰挑衅被我052D锁定

音乐时光的娱乐
2026-01-27 04:08:46
太牛了!山东强势逆转黑马,高诗岩苏醒,小将3分钟砍11分真猛啊

太牛了!山东强势逆转黑马,高诗岩苏醒,小将3分钟砍11分真猛啊

萌兰聊个球
2026-01-27 21:55:37
西班牙足协主席确认,2030年世界杯决赛将在西班牙举行

西班牙足协主席确认,2030年世界杯决赛将在西班牙举行

懂球帝
2026-01-27 12:37:15
伊朗神权崩塌前夜:9000万高知青年与内战危机

伊朗神权崩塌前夜:9000万高知青年与内战危机

夏至陌离殇
2026-01-14 15:34:27
看到陈晓旭1987年香港宴会照,才知林黛玉的妆造,限制了她的美貌

看到陈晓旭1987年香港宴会照,才知林黛玉的妆造,限制了她的美貌

小椰的奶奶
2026-01-27 11:18:51
华为突然官宣:1月26日,全系降价!

华为突然官宣:1月26日,全系降价!

科技堡垒
2026-01-26 11:40:24
50岁张智霖自曝无性生活:结婚十年,就是睡一张床的兄弟

50岁张智霖自曝无性生活:结婚十年,就是睡一张床的兄弟

素衣读史
2026-01-27 18:11:39
《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

诗词中国
2026-01-23 18:47:36
豪豪去世!昏睡多日妈妈含泪告别,发布死讯照片选是 “瘦豪豪”

豪豪去世!昏睡多日妈妈含泪告别,发布死讯照片选是 “瘦豪豪”

社会日日鲜
2026-01-27 13:28:14
2026-01-28 00:00:49
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1120文章数 150关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

因楼下邻居关闭水阀女子家中断水400天 起诉索赔被驳

头条要闻

因楼下邻居关闭水阀女子家中断水400天 起诉索赔被驳

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

时尚
艺术
游戏
教育
数码

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

艺术要闻

日本东京国立博物馆中的100幅宋画

《生化危机9》注定能成功!避开了开放世界的坑

教育要闻

评论丨教师期末“负担”与总结活动“初衷”,如何不再错位?

数码要闻

这事你怎么看 索尼与TCL签署意向备忘录 网友:Sony变Tony了

无障碍浏览 进入关怀版