网易首页 > 网易号 > 正文 申请入驻

大模型「记忆断片」成历史!AI初创全新Zep系统,知识图谱破解上下文诅咒

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】Zep,一个为大模型智能体提供长期记忆的插件,能将智能体的记忆组织成情节,从这些情节中提取实体及其关系,并将它们存储在知识图谱中,从而让用户以低代码的方式为智能力构建长期记忆。

无论是ChatGPT还是Deepseek,随着大模型性能的提升,其能够处理的上下文也越来越长。但是,一旦超出上下文窗口的限制,大模型就需要重新开一个对话,如同「失忆」一般忘记之前交流的内容。

然而,站在用户的角度,智能体应该能够记住之前的所有对话,因此如何有效地管理和利用对话历史,就成为了提升AI智能体用户体验的关键。拥有长期记忆后,智能体能够回忆过去的对话,减少幻觉、延迟和成本。

将聊天记录作为文本导入,然后使用RAG来「恢复记忆」,是一种让大模型具有长期记忆的常用方式,但这往往需要额外的工程,构建RAG也存在无法忽视的时间差。

最近,一家名为Zep AI的初创公司推出了为智能体打造的记忆层,通过回忆聊天历史,可以自动生成摘要和其他相关信息,使AI助手能够在不影响用户聊天体验的情况下,异步地从过去的对话中提取相关上下文。

传送门:https://www.getzep.com/

Zep AI成立于2023年,是一家位于湾区的YC系初创,主要愿景就是为AI构筑长期记忆。他们开发的核心插件已经在GitHub上开源,获得了3k+标星,同时也发表了详解技术原理的预印版论文。

仓库地址:https://github.com/getzep/zep

Zep:更适合工业界的MemGPT

论文链接:https://arxiv.org/pdf/2501.13956

当前使用RAG的方法主要集中在领域知识和静态语料库上,即添加到语料库的文档很少发生变化。

要使智能体的落地场景更加普遍,解决各种各样琐碎或高度复杂的问题,就需要访问大量的动态数据,比如与用户的交互、相关的业务数据以及世界知识。

Zep的开发者们认为,当前的RAG方法并不适合实现这一愿景;要想赋予智能体以动态、广泛的「记忆力」,需要让LLM驱动的智能体真正拥有存储部件。

事实上,这个想法并非Zep AI团队的原创。2023年,UC伯克利的研究者们发表的MemGPT就提出了这一点。

论文链接:https://arxiv.org/pdf/2310.08560

具体来看,Zep可视为AI智能体的基本内存,由具有时间感知能力的知识图谱引擎Graphiti所驱动,可以摄入并综合结构化业务数据和非结构化的消息数据,并动态更新知识图,从而表征一个复杂、不断发展的世界。

与其他知识图引擎相比,Graphiti的一个关键不同是具有时间提取和边失效过程,从而具备了管理动态信息更新的能力。

相比MemGPT,Zep更适用于工业界的生产场景,在内存检索机制的各方面性能上都有所提升,包括准确性、延迟和可扩展性。

构建知识图谱

Zep的「记忆」由一个具有时间感知能力的动态知识图谱(temporally-aware dynamic knowledge graph)所驱动,可以表示为=(,ℰ,ϕ),其中为节点,ℰ表示边,而ϕ则是一个形式关联函数(formal incidence function),可表示为ℰ→×。

整个知识图谱共包含3层子图,从底层到顶层分别为:情节(episode)子图e,语义(semantic)子图s以及社区(community)子图c。

  • 情节子图:以消息、文本或JSON的形式保留原始输入数据,其中的每个边将情节链接至下一层的相应语义实体

  • 语义子图:基于情节子图提取实体及其关系

  • 社区子图:每个节点表示一簇具有较强关联的实体,每个边将上一层的语义实体和社区相连接

这种分层表示与之前的AirGraph和GraphRAG有相近之处,更接近人类心智中的记忆模式,从而让使用Zep的LLM智能体发展出更加复杂和细微的存储结构。

内存检索

Zep的一大亮点就是功能强大、高效且高度可配置的的内存检索系统,包括3个核心步骤:

  • 搜索(φ):根据输入文本S,识别出可能包含相关信息的候选节点和边,可以表示为φ:S→ℰsn×sn×cn

  • 重排(ρ):对上一步的搜索结果重新排序,即ρ:φ⁢(α),…→ℰsn×sn×cn

  • 构造器(constructor χ):将相关的节点和边转换为文本形式的上下文,即χ:ℰsn×sn×⁢cn→S

第一步骤的搜索中,除了RAG常用的余弦相似度搜索和全文搜索,Zep还加入了广度优先搜索,分别针对相似性的不同方面:全文搜索识别词语相似性,余弦搜索捕获语义相似性,而广度优先搜索揭示了上下文相似性,从而最大程度地从图谱中挖掘最佳语境。

实验评估

论文采用了两种针对LLM内存的基准测试,分别是DMR任务(Deep Memory Retrieval)和LongMemEval基准,相关的实验代码已经公布在GitHub仓库中。

DMR的基线除了MemGPT外,还有两种常见的LLM内存方法:完整对话上下文(full-conversation context)和会话摘要(session summary)。

从下图和表格中可以看出,无论使用GPT-4-Turbo还是GPT-4o-mini模型,Zep都可以超过基线方法,但DMR基准的设计存在一个显著缺陷:无法评估对复杂记忆内容的理解,完整上下文搜索所得到的高分就能从侧面证明这一点。

LongMemEval基准的弥补了DMR的这一缺陷,加入了更长、更连贯的对话内容以及更多样化的评估问题,从而更好地反映真实场景的需求,实验结果如下表所示。

可以看到,相比基线方法,Zep不仅提升了结果的精度,而且将响应时间减少了约90%,相比其他LLM供应商也有约80%的提升。

参考资料:

https://arxiv.org/pdf/2501.13956

https://blog.getzep.com/state-of-the-art-agent-memory/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

小虎新车推荐员
2026-03-26 14:02:10
东北两省书记省长会见刘强东

东北两省书记省长会见刘强东

观察者网
2026-03-25 21:43:37
画面来了!伊朗称精准击落美军F-18战机

画面来了!伊朗称精准击落美军F-18战机

新华社
2026-03-26 10:30:58
不法之徒村田晃大,正面照曝光

不法之徒村田晃大,正面照曝光

新京报
2026-03-26 11:18:17
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
英超2强争冠前景!阿森纳7场2败或丢冠,曼城拿满24分有望翻盘

英超2强争冠前景!阿森纳7场2败或丢冠,曼城拿满24分有望翻盘

体育知多少
2026-03-26 09:54:16
重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

萌兰聊个球
2026-03-26 13:02:53
流量退去之后|南京“10元手冲咖啡”阿姨:火过,就很满足

流量退去之后|南京“10元手冲咖啡”阿姨:火过,就很满足

澎湃新闻
2026-03-26 07:06:31
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

老马拉车莫少装
2026-03-26 10:24:28
心脏决定寿命!建议:别太节俭,多吃这3种食物,让心脏变年轻

心脏决定寿命!建议:别太节俭,多吃这3种食物,让心脏变年轻

阿龙美食记
2026-03-23 20:16:13
心眼坏的人,最爱问这3件事,别傻乎乎全说!

心眼坏的人,最爱问这3件事,别傻乎乎全说!

唯晨说
2026-03-25 13:12:14
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
2026年起,党龄50年以上老党员,可领两金,赶紧转告

2026年起,党龄50年以上老党员,可领两金,赶紧转告

荷兰豆爱健康
2026-03-24 17:05:24
联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

扬子晚报
2026-03-26 07:27:54
一碗米饭六碗菜,张雪峰这顿饭,藏着他透支身体的真相

一碗米饭六碗菜,张雪峰这顿饭,藏着他透支身体的真相

王二哥老搞笑
2026-03-25 20:09:31
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
多个省级党委组织部部长调整

多个省级党委组织部部长调整

上观新闻
2026-03-26 12:48:05
好莱坞的AI招魂术:死亡不再是劳动的终点

好莱坞的AI招魂术:死亡不再是劳动的终点

动察Beating
2026-03-26 11:06:56
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
2026-03-26 16:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14819文章数 66720关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
数码
健康
旅游
公开课

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

数码要闻

三星更新870 EVO系列SATA SSD:最高8TB 定价超1万元

转头就晕的耳石症,能开车上班吗?

旅游要闻

济南动物园“花朝荟”系列活动浪漫上演

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版