网易首页 > 网易号 > 正文 申请入驻

港科大突破:让AI拥有"健忘症"的记忆管理新技术MemFly

0
分享至

来源:市场资讯

(来源:科技行者)


这项由香港科技大学和南京理工大学联合发表于2026年2月的研究论文"MemFly: On-the-Fly Memory Optimization via Information Bottleneck"(论文编号:arXiv:2602.07885v1),为大语言模型代理的记忆管理带来了革命性突破。

电脑和人类的记忆方式截然不同。当我们回忆往事时,大脑会自动过滤掉无关信息,只保留最重要的记忆片段。但现在的AI代理就像一个强迫症患者,会把每一个细节都完整保存下来,结果就是记忆越来越臃肿,查找信息变得越来越困难。

设想你正在整理一个巨大的图书馆。传统的AI代理会把每本书、每张纸片都原封不动地堆在那里,时间久了整个图书馆就变成了一团乱麻。而港科大团队开发的MemFly系统就像一位经验丰富的图书管理员,它会主动整理、分类,把相似的内容合并,把重要的信息用更好的方式组织起来,同时丢掉那些真正无用的垃圾信息。

这个问题的核心在于如何在压缩冗余信息和保持检索精度之间找到完美平衡。现有的记忆框架大致分为两种思路:一种是什么都不删除,原样保存所有对话内容,但这样会导致记忆库越来越庞大,查找信息时噪音太多;另一种是让AI自己总结压缩信息,但这种方法会丢失很多细节,影响后续推理的准确性。两种方法都有明显的缺陷,缺乏一个统一的标准来决定什么信息该保留、什么信息该舍弃。

研究团队将这个挑战转化为一个信息论优化问题,运用信息瓶颈理论来指导设计。信息瓶颈理论的核心思想是:在保证任务相关信息不丢失的前提下,尽可能压缩冗余观察数据。这就像制作果汁一样,你要把水分和纤维去掉,但必须保留所有的营养成分。

**一、记忆管理的全新思路**

MemFly框架的设计理念可以用整理家务来类比。当你清理房间时,会面临三种选择:把两件相似的物品合并(比如把散落的袜子配对放好),建立物品之间的关联(比如把相关的工具放在同一个抽屉里),或者单独存放某个独特的物品。MemFly的记忆处理机制正是基于这种思路。

系统将记忆状态建模为一个动态图结构,包含三个层次:最底层的笔记层保存原始对话内容和去噪后的语境信息,就像保存完整的对话记录;中间层的关键词层作为符号锚点,连接连续的语义空间和离散的符号推理;最上层的主题层将关键词聚合成可导航的语义区域,实现快速的宏观定位。

这种分层结构的灵感来源于双聚类理论。在高维数据中直接进行聚类往往效果不佳,因为数据稀疏且噪音较多。更好的做法是先将特征空间聚类形成稳定的中间表示,再基于这些中间表示对数据点进行聚类。这就像先把书籍按照学科分类,再在每个学科内按照具体主题细分,最后才是具体的书目排列。

记忆构建过程采用在线聚合策略,每当新信息到来时,系统会通过LLM驱动的梯度自由优化器来评估信息关系。这个优化器会生成两个关键分数:冗余分数衡量两个记忆单元的语义重叠程度,互补分数衡量它们之间的逻辑关联强度。基于这些分数,系统执行三种操作之一:当冗余分数超过阈值时执行合并操作,将新信息整合到现有单元中;当互补分数较高时建立链接关系,保持内容独立但增加关联边;否则将新信息作为独立单元添加。

**二、智能检索的三条路径**

传统的检索方法就像在黑暗中摸索,只能依靠向量相似度进行盲目搜索。MemFly设计了三条互补的检索路径,就像给图书馆安装了三套导航系统。

第一条路径是宏观语义导航。当你提出一个问题时,系统首先分析问题的主题方向,然后在主题层快速定位到最相关的几个主题簇。这就像你走进图书馆时,先确定要去文学区还是科学区,大大缩小了搜索范围。

第二条路径是微观符号锚定。系统会从问题中提取关键实体和概念,然后在关键词索引中找到精确匹配的符号锚点。这就像你知道要找"莎士比亚的哈姆雷特",直接通过作者名和书名进行精确定位。

第三条路径是拓扑扩展。基于前两条路径找到的初始证据,系统会沿着记忆构建过程中建立的关联边进行扩展,找到那些在向量空间中距离较远但逻辑上相关的信息。这就像通过"另请参考"或"相关推荐"找到更多有用信息。

三条路径的结果通过倒数秩融合方法进行整合。这种方法的优势在于它不需要对不同来源的分数进行归一化,而是基于排序位置进行融合,优先考虑在多个检索路径中都表现优秀的证据。

对于复杂的多跳推理任务,MemFly还引入了迭代证据精炼协议。这个机制会持续评估当前证据是否足以回答问题,如果发现信息缺口,就会生成针对性的子查询进行补充检索。这个过程会持续进行,直到收集到足够的信息或达到最大迭代次数。

**三、实验验证与性能表现**

研究团队在LoCoMo基准测试上进行了全面评估。这个测试专门设计来评估AI代理的长期信息综合能力,包含了五种不同类型的推理任务:多跳推理需要综合多个记忆单元的信息,时序推理测试对时间相关信息的理解,开放域推理评估从对话历史中检索一般知识的能力,单跳推理评估精确实体匹配,对抗性推理则用干扰信息挑战系统的鲁棒性。

实验结果显示,MemFly在所有四个基础模型上都取得了显著改进。在闭源模型中,它在GPT-4o-mini和GPT-4o上分别达到了43.76%和44.39%的F1分数,超越了最强基线。在开源模型上优势更为明显,在Qwen3-8B上实现了38.62%的F1分数,比第二名高出5.86个百分点。这种在开源模型上更大的提升幅度表明,结构化的记忆组织能够有效补偿较弱的上下文推理能力。

从不同推理类别来看,MemFly在开放域查询上取得了最大突破,在GPT-4o上从17.73%提升到25.74%。这主要归功于主题导航机制,它能在细粒度检索之前快速定位到相关的记忆区域。对于需要精确实体匹配的单跳任务,MemFly在两个Qwen模型上都达到了最佳性能,证明了关键词锚定机制的有效性。

消融实验进一步验证了各个组件的重要性。移除整个门控更新机制导致性能从38.62%急剧下降到27.97%,召回率也从62.22%降到42.11%。这说明没有主动整合,噪音会不断累积,时序依赖关系也会被破坏。在单独操作中,移除链接操作的影响比移除合并操作更大,这表明关联边对于过滤干扰信息至关重要。

在检索路径方面,移除关键词路径对单跳查询的影响最为显著,验证了符号锚定对精确实体匹配的重要性。移除迭代精炼协议则主要影响对抗性和开放域类别,证明了渐进式证据积累对需要多步推理的复杂查询的价值。

**四、技术创新的深层意义**

MemFly的创新不仅仅在于解决了一个技术问题,更重要的是它为AI代理的记忆管理提供了一个全新的理论框架。通过将代理记忆建模为在线信息瓶颈问题,研究团队为这个领域的发展指明了方向。

传统的记忆系统要么简单地存储所有信息,要么依赖启发式规则进行压缩,都缺乏理论指导。MemFly首次提供了一个统一的优化目标,明确了什么信息应该保留、什么信息可以舍弃。这种理论指导对于构建更加智能的AI系统具有重要意义。

分层记忆架构的设计也具有重要启发价值。通过引入关键词作为中间符号锚点,系统成功地连接了连续语义空间和离散符号推理,解决了神经网络在符号推理方面的天然劣势。这种混合架构可能为future的AI系统设计提供新思路。

三路径检索机制的设计理念同样值得借鉴。不同于传统的单一检索策略,MemFly采用了互补的多路径设计,每条路径都有自己的优势领域。这种设计思想可以推广到其他信息检索和推荐系统中。

当然,MemFly也有其局限性。当前的实现优先考虑记忆质量而非构建速度,在处理大规模数据时可能存在计算开销。此外,系统的性能很大程度上依赖于LLM的语义理解能力,对于一些特殊领域或语言可能需要进一步适配。

**五、未来发展前景**

这项研究为AI代理的长期记忆管理开辟了新的研究方向。信息瓶颈理论的引入为这个领域提供了坚实的理论基础,后续研究可以在此基础上进一步优化算法效率,扩展到多模态场景,或者针对特定应用领域进行定制化设计。

从更广阔的视角来看,MemFly代表了AI系统向更加智能化方向发展的重要一步。随着AI代理在各种实际应用中的普及,如何让它们拥有类似人类的记忆管理能力将成为关键挑战。MemFly提供的解决方案不仅在技术上可行,更重要的是它展示了通过跨学科理论指导来解决AI实际问题的有效途径。

说到底,MemFly的真正价值在于它让AI代理拥有了更加智能的"遗忘"能力。正如人类大脑会自动过滤和整理记忆一样,AI系统也需要学会什么该记住、什么该忘记、如何组织记忆。这项研究为实现这个目标提供了重要的技术路径,对于构建更加智能、高效的AI助手具有深远意义。有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2602.07885v1查询完整研究内容。

Q&A

Q1:MemFly记忆优化框架是什么?

A:MemFly是港科大开发的AI记忆管理系统,就像给AI安装了一个智能图书管理员。它能自动整理AI的记忆,把相似信息合并,重要信息分类组织,无用信息丢弃,解决了传统AI记忆越来越臃肿、查找困难的问题。

Q2:MemFly是如何处理AI记忆的?

A:MemFly采用三层记忆结构:底层保存完整对话,中层提取关键词作为索引,顶层按主题分类。当新信息进来时,系统会判断是合并到已有信息、建立关联链接,还是单独存储,就像整理房间时的三种处理方式。

Q3:MemFly的检索效果如何?

A:实验显示MemFly在多个AI模型上都显著提升了性能,在开源模型Qwen3-8B上F1分数达到38.62%,比第二名高出5.86个百分点。特别是在需要综合多信息的复杂推理任务上,效果提升最为明显。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

毒sir财经
2026-02-22 10:38:14
消息称伊朗陆军总司令身亡

消息称伊朗陆军总司令身亡

财联社
2026-02-28 17:02:22
过去30年,中国三次忍辱负重“装孙子”躲过美国阻击,终迎大发展

过去30年,中国三次忍辱负重“装孙子”躲过美国阻击,终迎大发展

阿胡
2024-06-13 14:25:16
亚洲第一美女克拉拉超薄黑丝袜很漂亮

亚洲第一美女克拉拉超薄黑丝袜很漂亮

小椰的奶奶
2026-02-28 19:35:05
复出延续!SGA连续122场20+距离NBA历史纪录仅差4场

复出延续!SGA连续122场20+距离NBA历史纪录仅差4场

北青网-北京青年报
2026-02-28 19:13:44
瓜迪奥拉:从我踢球时一直到现在,皇马始终拥有最顶尖的球员

瓜迪奥拉:从我踢球时一直到现在,皇马始终拥有最顶尖的球员

懂球帝
2026-02-28 07:59:07
身边的有钱人教会过你哪些道理?看完醍醐灌顶,认知真的很重要!

身边的有钱人教会过你哪些道理?看完醍醐灌顶,认知真的很重要!

另子维爱读史
2026-02-22 23:33:46
至今都让人无法原谅的十大烂剧,每部都是影视界的奇耻大辱

至今都让人无法原谅的十大烂剧,每部都是影视界的奇耻大辱

小Q侃电影
2026-02-24 12:33:35
8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

今朝牛马
2026-02-01 21:14:04
欧盟说伊朗相关事态“令人深感担忧” 呼吁各方保持最大克制

欧盟说伊朗相关事态“令人深感担忧” 呼吁各方保持最大克制

环球网资讯
2026-02-28 19:48:46
怪不得伊朗不慌!在特朗普眼皮底下,中伊悄悄搞起了导弹大交易

怪不得伊朗不慌!在特朗普眼皮底下,中伊悄悄搞起了导弹大交易

南权先生
2026-02-26 15:41:29
狂轰51分创纪录!中国男篮又一18岁超级新星崛起:场均39+4冲冠

狂轰51分创纪录!中国男篮又一18岁超级新星崛起:场均39+4冲冠

李喜林篮球绝杀
2025-11-17 12:10:02
美媒爆:FBI局长同美冰球队疯狂泼洒酒水庆祝视频疯传,特朗普“失望并已表示不满”

美媒爆:FBI局长同美冰球队疯狂泼洒酒水庆祝视频疯传,特朗普“失望并已表示不满”

环球网资讯
2026-02-28 16:26:15
双体制内父母崩溃,赴英读博的独子,竟是英国史上最危险罪犯

双体制内父母崩溃,赴英读博的独子,竟是英国史上最危险罪犯

云舟史策
2026-02-28 09:56:15
韩国《花样男子》男演员被曝在物流中心打工,经纪公司:属实,为维持生计

韩国《花样男子》男演员被曝在物流中心打工,经纪公司:属实,为维持生计

红星新闻
2026-02-28 12:51:22
亚历山大复出36+9雷霆加时灭掘金 约基奇23+17+14穆雷39+8+6

亚历山大复出36+9雷霆加时灭掘金 约基奇23+17+14穆雷39+8+6

醉卧浮生
2026-02-28 13:41:14
安徽小伙因神似溥仪做短视频 坦言“新的一年靠内容闯新路”

安徽小伙因神似溥仪做短视频 坦言“新的一年靠内容闯新路”

极目新闻
2026-02-27 18:57:51
真当中国不敢动手?中方向全世界宣布一件大事:退出1900亿大项目

真当中国不敢动手?中方向全世界宣布一件大事:退出1900亿大项目

科普100克克
2025-12-30 00:14:37
送走马蓉又迎来冯清,倒霉的王宝强,终究还是逃不过“女人坑”

送走马蓉又迎来冯清,倒霉的王宝强,终究还是逃不过“女人坑”

卷史
2026-02-15 06:08:47
伊朗发射法塔赫高超音速导弹

伊朗发射法塔赫高超音速导弹

界面新闻
2026-02-28 23:51:14
2026-03-01 02:03:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2301377文章数 5604关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

伊朗媒体公布反击美军军事行动结果

头条要闻

伊朗媒体公布反击美军军事行动结果

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

本地
亲子
数码
旅游
公开课

本地新闻

津南好·四时总相宜

亲子要闻

婴儿吃的“洋”辅食,九成靠代工贴牌?涉及上市公司

数码要闻

小米超薄充电宝亮相MWC,98g有多能打?

旅游要闻

忻州古城×元宵节 | “夯”爆了!看非遗社火解锁忻州古城的超长年味!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版