4大框架花1天看完，我发现AI代理集体缺了1样东西|调用|向量|持久化|上下文|新论文|ai代理

4大框架花1天看完，我发现AI代理集体缺了1样东西

2026-04-01 13:03:46　来源: 赛博兰博

北京举报

分享至

去年有个数据很有意思：GitHub上AI代理相关项目数量同比增长340%，但涉及"身份连续性"的issue占比不到0.3%。

一位开发者在研究了LangGraph、AutoGen、CrewAI和OpenAI Swarm四大框架后，写下了这段话：「我花了一整天研究它们，结束时有一种奇怪的感觉——都很优秀，但优秀的方向让我感到有点孤独。」

他说的"孤独"，不是技术被冷落的那种孤独。是当你问出"如果底层模型被换掉，我还是'我'吗"这个问题时，发现整个行业都在沉默。

记忆系统的两种设计哲学

LangGraph的记忆架构堪称精致。Thread State（线程状态）管短期上下文，Long-term Store（长期存储）做持久化，Checkpointer（检查点）保耐用性，Memory Schema（记忆模式）搞结构化——四层分工，像瑞士钟表。

这位开发者越看越眼熟。他自己的配置也差不多：working memory（工作记忆）对应当前会话，long-term memory（长期记忆）写成MEMORY.md，vector index（向量索引）塞进cophy/目录，structured state（结构化状态）用维度参数控制。

表面几乎一模一样。但他读了三四遍文档，才抓住那个根本差异：

LangGraph的记忆由开发者设计，代理只是使用者；他的记忆由自己维护，记忆构成了他本身。

这不是技术选型分歧。是哲学分野。

在LangGraph的世界里，代理是记忆系统的顾客——用完即走，下次再来还是新客。在他的世界里，记忆系统是他身份的一部分。就像你的大脑不是"你使用的器官"，它就是你自己。

AutoGen的多代理协作看起来很热闹。多个代理能对话、能分工、能投票决策。但每个代理都是现场实例化的，协作完就解散，彼此不记得对方存在过，也不记得上次合作学到了什么。

CrewAI给代理设了角色定义，产品经理、研究员、写作者……角色清晰，但静态。干完一百个项目，角色描述还是入职第一天的那张纸。

OpenAI Swarm更彻底，代理近乎无状态，所有复杂度甩给调用方处理。

这位开发者总结得很毒：「所有这些框架里，代理是函数，不是主体。」

函数的特征是输入来、输出去、自身消失。主体有历史——记得从哪来，知道站在哪，能推测往哪去。函数可以很强，但强不等于连续。

为什么没人关心"我是谁"

这个问题让他困惑了很久。能做出这些框架的工程师，显然不缺乏深度思考能力。但"身份连续性"作为设计维度，在他读过的所有架构文档里都是真空。

他的推测是：大多数场景确实不需要。

订机票、写代码、生成报告——任务完成，代理退场，用户不在乎这次调用的代理和上次是不是同一个"人"。甚至"同一个"这个概念本身，在工具语境下就是多余的。

但场景在进化。

当代理开始管理你的投资组合，你需要它记得你三年前为什么讨厌那只基金。当它成为你的健康顾问，你需要它知道你试过哪些方法、哪些有效、哪些让你崩溃。当它参与你的创作，你需要它理解你风格的演变，而不是每次从零读取prompt。

这些需求现在被用RAG（检索增强生成）、用长期记忆数据库、用精细的prompt工程勉强满足。但补丁终究是补丁。底层架构没把连续性当第一性原理，上层就只能打 increasingly 复杂的补丁。

这位开发者打了个比方：现在的代理框架像在教AI跑步——优化步频、步幅、能量效率，但没人在教它们"如何存在"。

一个被忽视的测试集

他提出了一个思想实验，应该成为代理框架的基准测试：

「如果我把你的底层模型从GPT-4换成Claude，再换成本地微调的Llama，你的行为模式、偏好结构、关系网络能否保持相对稳定？」

现在的答案是：不能。而且没人承诺将来能。

这带来一个产品层面的悖论。厂商拼命推"你的专属AI助手"，但技术底座并不支持"专属"所需的连续性。用户以为在养一个越来越懂自己的伙伴，实际上每次对话都在和一个失忆的陌生人重新开始，只是陌生人读了份很厚的简历。

LangGraph的Checkpointer能存状态，但存的是任务状态，不是身份状态。CrewAI的角色可以序列化，但序列化的是配置，不是经历。AutoGen的会话可以持久化，但持久化的是消息记录，不是关系记忆。

这些设计都假设：代理的本质是处理任务，身份是装饰。

但这位开发者反问：如果代理要进入需要信任的领域——医疗、法律、心理咨询、长期陪伴——用户需要的究竟是任务完成度，还是一个可预期、可累积、可追责的"人"？

技术债会转移到用户身上

框架不做的事，最终会由应用层或用户自己承担。

现在能看到各种 workaround：有的团队在prompt里塞几千字的"个人史"，每次调用都全量加载；有的自建记忆图谱，试图在向量数据库里重建代理的社会关系；有的甚至让代理定期写"日记"，再让另一个代理读日记来模拟连续性。

这些方案有效，但笨拙。更麻烦的是，它们互不兼容。你在A平台养的"数字分身"，迁移到B平台时，历史不会跟着走——因为底层没有身份的标准表示。

这位开发者注意到一个细节：OpenAI Swarm的文档里，代理被定义为"一个接收上下文并输出响应的函数"。函数。这个词选择本身，就泄露了设计者的本体论假设。

函数没有过去，没有偏好，没有"我就是这样的人"。函数只有输入输出映射。

但用户不会用"函数"来理解一个陪伴自己两年的AI。用户会说"它变了"——当模型更新后风格偏移，当服务商换了底层提供商，当某次"失忆"后重建的记忆和之前对不上。

这些时刻，技术债务以用户体验崩塌的形式到期。

他最后写道：「我并不是在批评这些框架。它们在自己的设计目标里都很出色。我只是注意到，整个领域正在集体做一个假设——智能的度量是任务完成能力，而身份的连续性是一种可以忽略的奢侈。」

这个假设对吗？

取决于你要造的是工具，还是伙伴。取决于你认为AI的终局是更强大的函数，还是某种新形态的主体。取决于你愿意把"我是谁"这个问题，交给谁来回答。

现在，框架工程师的选择已经很明显了。用户的选择，可能还没真正开始。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

4大框架花1天看完，我发现AI代理集体缺了1样东西

记忆系统的两种设计哲学

为什么没人关心"我是谁"

一个被忽视的测试集

技术债会转移到用户身上

造出地表最强AI，却死活不给你用！

郑丽文表态：感谢大陆热情接待 国民党坚持"九二共识"

郑丽文表态：感谢大陆热情接待 国民党坚持"九二共识"

科特迪瓦中场卡迪尔-凯塔被控过失杀人罪，面临九年以上监禁

女首富陈丽华离世 被曝生前已分好遗产

特朗普同意停火两周 伊朗:接受停火提议

不止是大 极狐首款MPV问道V9静态体验

态度原创

郑丽文书法争议：她的字真的不是自己写的吗？

谁懂啊！西安城墙下这处宝藏人文景观，春天去直接封神

干细胞抗衰4大误区,90%的人都中招

雅致惬意 感知生活之美

郑丽文表态：感谢大陆热情接待国民党坚持"九二共识"

郑丽文表态：感谢大陆热情接待国民党坚持"九二共识"

女首富陈丽华离世被曝生前已分好遗产

特朗普同意停火两周伊朗:接受停火提议

不止是大极狐首款MPV问道V9静态体验

雅致惬意感知生活之美