网易首页 > 网易号 > 正文 申请入驻

港科大突破:让AI拥有"健忘症"的记忆管理新技术MemFly

0
分享至


这项由香港科技大学和南京理工大学联合发表于2026年2月的研究论文"MemFly: On-the-Fly Memory Optimization via Information Bottleneck"(论文编号:arXiv:2602.07885v1),为大语言模型代理的记忆管理带来了革命性突破。

电脑和人类的记忆方式截然不同。当我们回忆往事时,大脑会自动过滤掉无关信息,只保留最重要的记忆片段。但现在的AI代理就像一个强迫症患者,会把每一个细节都完整保存下来,结果就是记忆越来越臃肿,查找信息变得越来越困难。

设想你正在整理一个巨大的图书馆。传统的AI代理会把每本书、每张纸片都原封不动地堆在那里,时间久了整个图书馆就变成了一团乱麻。而港科大团队开发的MemFly系统就像一位经验丰富的图书管理员,它会主动整理、分类,把相似的内容合并,把重要的信息用更好的方式组织起来,同时丢掉那些真正无用的垃圾信息。

这个问题的核心在于如何在压缩冗余信息和保持检索精度之间找到完美平衡。现有的记忆框架大致分为两种思路:一种是什么都不删除,原样保存所有对话内容,但这样会导致记忆库越来越庞大,查找信息时噪音太多;另一种是让AI自己总结压缩信息,但这种方法会丢失很多细节,影响后续推理的准确性。两种方法都有明显的缺陷,缺乏一个统一的标准来决定什么信息该保留、什么信息该舍弃。

研究团队将这个挑战转化为一个信息论优化问题,运用信息瓶颈理论来指导设计。信息瓶颈理论的核心思想是:在保证任务相关信息不丢失的前提下,尽可能压缩冗余观察数据。这就像制作果汁一样,你要把水分和纤维去掉,但必须保留所有的营养成分。

**一、记忆管理的全新思路**

MemFly框架的设计理念可以用整理家务来类比。当你清理房间时,会面临三种选择:把两件相似的物品合并(比如把散落的袜子配对放好),建立物品之间的关联(比如把相关的工具放在同一个抽屉里),或者单独存放某个独特的物品。MemFly的记忆处理机制正是基于这种思路。

系统将记忆状态建模为一个动态图结构,包含三个层次:最底层的笔记层保存原始对话内容和去噪后的语境信息,就像保存完整的对话记录;中间层的关键词层作为符号锚点,连接连续的语义空间和离散的符号推理;最上层的主题层将关键词聚合成可导航的语义区域,实现快速的宏观定位。

这种分层结构的灵感来源于双聚类理论。在高维数据中直接进行聚类往往效果不佳,因为数据稀疏且噪音较多。更好的做法是先将特征空间聚类形成稳定的中间表示,再基于这些中间表示对数据点进行聚类。这就像先把书籍按照学科分类,再在每个学科内按照具体主题细分,最后才是具体的书目排列。

记忆构建过程采用在线聚合策略,每当新信息到来时,系统会通过LLM驱动的梯度自由优化器来评估信息关系。这个优化器会生成两个关键分数:冗余分数衡量两个记忆单元的语义重叠程度,互补分数衡量它们之间的逻辑关联强度。基于这些分数,系统执行三种操作之一:当冗余分数超过阈值时执行合并操作,将新信息整合到现有单元中;当互补分数较高时建立链接关系,保持内容独立但增加关联边;否则将新信息作为独立单元添加。

**二、智能检索的三条路径**

传统的检索方法就像在黑暗中摸索,只能依靠向量相似度进行盲目搜索。MemFly设计了三条互补的检索路径,就像给图书馆安装了三套导航系统。

第一条路径是宏观语义导航。当你提出一个问题时,系统首先分析问题的主题方向,然后在主题层快速定位到最相关的几个主题簇。这就像你走进图书馆时,先确定要去文学区还是科学区,大大缩小了搜索范围。

第二条路径是微观符号锚定。系统会从问题中提取关键实体和概念,然后在关键词索引中找到精确匹配的符号锚点。这就像你知道要找"莎士比亚的哈姆雷特",直接通过作者名和书名进行精确定位。

第三条路径是拓扑扩展。基于前两条路径找到的初始证据,系统会沿着记忆构建过程中建立的关联边进行扩展,找到那些在向量空间中距离较远但逻辑上相关的信息。这就像通过"另请参考"或"相关推荐"找到更多有用信息。

三条路径的结果通过倒数秩融合方法进行整合。这种方法的优势在于它不需要对不同来源的分数进行归一化,而是基于排序位置进行融合,优先考虑在多个检索路径中都表现优秀的证据。

对于复杂的多跳推理任务,MemFly还引入了迭代证据精炼协议。这个机制会持续评估当前证据是否足以回答问题,如果发现信息缺口,就会生成针对性的子查询进行补充检索。这个过程会持续进行,直到收集到足够的信息或达到最大迭代次数。

**三、实验验证与性能表现**

研究团队在LoCoMo基准测试上进行了全面评估。这个测试专门设计来评估AI代理的长期信息综合能力,包含了五种不同类型的推理任务:多跳推理需要综合多个记忆单元的信息,时序推理测试对时间相关信息的理解,开放域推理评估从对话历史中检索一般知识的能力,单跳推理评估精确实体匹配,对抗性推理则用干扰信息挑战系统的鲁棒性。

实验结果显示,MemFly在所有四个基础模型上都取得了显著改进。在闭源模型中,它在GPT-4o-mini和GPT-4o上分别达到了43.76%和44.39%的F1分数,超越了最强基线。在开源模型上优势更为明显,在Qwen3-8B上实现了38.62%的F1分数,比第二名高出5.86个百分点。这种在开源模型上更大的提升幅度表明,结构化的记忆组织能够有效补偿较弱的上下文推理能力。

从不同推理类别来看,MemFly在开放域查询上取得了最大突破,在GPT-4o上从17.73%提升到25.74%。这主要归功于主题导航机制,它能在细粒度检索之前快速定位到相关的记忆区域。对于需要精确实体匹配的单跳任务,MemFly在两个Qwen模型上都达到了最佳性能,证明了关键词锚定机制的有效性。

消融实验进一步验证了各个组件的重要性。移除整个门控更新机制导致性能从38.62%急剧下降到27.97%,召回率也从62.22%降到42.11%。这说明没有主动整合,噪音会不断累积,时序依赖关系也会被破坏。在单独操作中,移除链接操作的影响比移除合并操作更大,这表明关联边对于过滤干扰信息至关重要。

在检索路径方面,移除关键词路径对单跳查询的影响最为显著,验证了符号锚定对精确实体匹配的重要性。移除迭代精炼协议则主要影响对抗性和开放域类别,证明了渐进式证据积累对需要多步推理的复杂查询的价值。

**四、技术创新的深层意义**

MemFly的创新不仅仅在于解决了一个技术问题,更重要的是它为AI代理的记忆管理提供了一个全新的理论框架。通过将代理记忆建模为在线信息瓶颈问题,研究团队为这个领域的发展指明了方向。

传统的记忆系统要么简单地存储所有信息,要么依赖启发式规则进行压缩,都缺乏理论指导。MemFly首次提供了一个统一的优化目标,明确了什么信息应该保留、什么信息可以舍弃。这种理论指导对于构建更加智能的AI系统具有重要意义。

分层记忆架构的设计也具有重要启发价值。通过引入关键词作为中间符号锚点,系统成功地连接了连续语义空间和离散符号推理,解决了神经网络在符号推理方面的天然劣势。这种混合架构可能为future的AI系统设计提供新思路。

三路径检索机制的设计理念同样值得借鉴。不同于传统的单一检索策略,MemFly采用了互补的多路径设计,每条路径都有自己的优势领域。这种设计思想可以推广到其他信息检索和推荐系统中。

当然,MemFly也有其局限性。当前的实现优先考虑记忆质量而非构建速度,在处理大规模数据时可能存在计算开销。此外,系统的性能很大程度上依赖于LLM的语义理解能力,对于一些特殊领域或语言可能需要进一步适配。

**五、未来发展前景**

这项研究为AI代理的长期记忆管理开辟了新的研究方向。信息瓶颈理论的引入为这个领域提供了坚实的理论基础,后续研究可以在此基础上进一步优化算法效率,扩展到多模态场景,或者针对特定应用领域进行定制化设计。

从更广阔的视角来看,MemFly代表了AI系统向更加智能化方向发展的重要一步。随着AI代理在各种实际应用中的普及,如何让它们拥有类似人类的记忆管理能力将成为关键挑战。MemFly提供的解决方案不仅在技术上可行,更重要的是它展示了通过跨学科理论指导来解决AI实际问题的有效途径。

说到底,MemFly的真正价值在于它让AI代理拥有了更加智能的"遗忘"能力。正如人类大脑会自动过滤和整理记忆一样,AI系统也需要学会什么该记住、什么该忘记、如何组织记忆。这项研究为实现这个目标提供了重要的技术路径,对于构建更加智能、高效的AI助手具有深远意义。有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2602.07885v1查询完整研究内容。

Q&A

Q1:MemFly记忆优化框架是什么?

A:MemFly是港科大开发的AI记忆管理系统,就像给AI安装了一个智能图书管理员。它能自动整理AI的记忆,把相似信息合并,重要信息分类组织,无用信息丢弃,解决了传统AI记忆越来越臃肿、查找困难的问题。

Q2:MemFly是如何处理AI记忆的?

A:MemFly采用三层记忆结构:底层保存完整对话,中层提取关键词作为索引,顶层按主题分类。当新信息进来时,系统会判断是合并到已有信息、建立关联链接,还是单独存储,就像整理房间时的三种处理方式。

Q3:MemFly的检索效果如何?

A:实验显示MemFly在多个AI模型上都显著提升了性能,在开源模型Qwen3-8B上F1分数达到38.62%,比第二名高出5.86个百分点。特别是在需要综合多信息的复杂推理任务上,效果提升最为明显。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白敬亭宋轶:低调相恋到悄然收场,未官宣却成全网意难平

白敬亭宋轶:低调相恋到悄然收场,未官宣却成全网意难平

阿废冷眼观察所
2026-02-15 04:44:14
就在今天!2月15日凌晨,国足传来朱鹏宇、毛伟杰、邵佳一新消息

就在今天!2月15日凌晨,国足传来朱鹏宇、毛伟杰、邵佳一新消息

林子说事
2026-02-15 00:46:05
长沙“互啃”后续:没实锤,婚离了!中年人的体面,真输不起!

长沙“互啃”后续:没实锤,婚离了!中年人的体面,真输不起!

王楔晓
2026-01-08 11:31:21
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
被57岁伊能静春晚彩排生图震住了!网友:滤镜碎了一地

被57岁伊能静春晚彩排生图震住了!网友:滤镜碎了一地

手工制作阿歼
2026-02-15 01:30:58
外媒炸了!首艘中国095核潜艇将下水,技术参数爆表?

外媒炸了!首艘中国095核潜艇将下水,技术参数爆表?

兵国大事
2026-02-14 00:05:12
5000 万王牌彻底沉沦!曼联弃将被骂到抬不起头,已成笑柄

5000 万王牌彻底沉沦!曼联弃将被骂到抬不起头,已成笑柄

澜归序
2026-02-14 17:47:55
鲁媒:阿尔瓦罗抵达济南完成体检,15日官宣,球队20日集中

鲁媒:阿尔瓦罗抵达济南完成体检,15日官宣,球队20日集中

懂球帝
2026-02-14 22:29:05
雷克萨斯新车曝光:4月份,正式上市

雷克萨斯新车曝光:4月份,正式上市

高科技爱好者
2026-02-14 23:03:20
小杨哥67亿卖公司,震惊行业!

小杨哥67亿卖公司,震惊行业!

大佬灼见
2026-02-12 16:21:35
他是原副总理,1975年被永远开除党籍,1979年当选为副主席

他是原副总理,1975年被永远开除党籍,1979年当选为副主席

老范谈史
2026-02-13 08:38:33
7000哥伦比亚人奔赴乌克兰前线:外籍参战人数第一!

7000哥伦比亚人奔赴乌克兰前线:外籍参战人数第一!

老马拉车莫少装
2026-02-15 00:00:37
毛主席选择华国锋来做接班人,周总理对此不解,主席说出3个理由

毛主席选择华国锋来做接班人,周总理对此不解,主席说出3个理由

东方寻史
2025-02-08 09:16:38
国家医保局严打来袭:4月1日起全面严查5类行为,所有人务必自查

国家医保局严打来袭:4月1日起全面严查5类行为,所有人务必自查

黑哥讲现代史
2026-02-15 04:07:08
王菲李健王一博易烊千玺等亮相,总台春晚完成全部五次彩排

王菲李健王一博易烊千玺等亮相,总台春晚完成全部五次彩排

文汇报
2026-02-15 01:17:13
向佐情人节晒出游全家福,一家四口好温馨,3岁儿子留长发很可爱

向佐情人节晒出游全家福,一家四口好温馨,3岁儿子留长发很可爱

老琴才是我的外号
2026-02-14 20:26:54
马凡舒大长腿光着脚丫

马凡舒大长腿光着脚丫

TVB的四小花
2026-02-06 20:29:51
英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

我心纵横天地间
2026-01-29 15:24:36
笑不活了!吉林一狗狗拿女主手机下单5000+买灯笼,家里整成夜市

笑不活了!吉林一狗狗拿女主手机下单5000+买灯笼,家里整成夜市

火山詩话
2026-02-14 11:15:54
3吨电车成为道路的重大安全隐患,炮弹飞车,害人害己

3吨电车成为道路的重大安全隐患,炮弹飞车,害人害己

世界圈
2026-02-13 08:46:33
2026-02-15 05:28:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7288文章数 550关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

本地
教育
房产
数码
公开课

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

教育要闻

假期作业,要定时督促吗?

房产要闻

三亚新机场,又传出新消息!

数码要闻

键盘可当触控板,Unihertz Titan 2 Elite全键盘手机MWC 2026发布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版