网易首页 > 网易号 > 正文 申请入驻

南洋理工大学让AI学会自己进化记忆能力

0
分享至


在人工智能助手与用户进行长时间对话时,如何让它们记住之前讨论的内容?这个看似简单的问题,其实是AI领域一个重大挑战。由南洋理工大学、伊利诺伊大学香槟分校、伊利诺伊大学芝加哥分校和清华大学联合完成的研究团队,在2026年2月发表了一项突破性研究成果,提出了名为MemSkill的创新方法。这项研究发表在arXiv预印本平台,编号为arXiv:2602.02474v1,为AI代理的记忆管理开辟了全新的道路。

传统的AI记忆系统就像是按照固定菜谱烹饪的厨师,只能机械地执行预设的记忆操作步骤,比如添加、更新、删除或跳过信息。这种方式在面对复杂多变的对话情况时显得僵硬无力,就像用同一个菜谱做所有菜品一样效果不佳。更重要的是,这些传统系统无法根据实际使用情况来改进自己的记忆策略,就像一个永远不会从经验中学习的厨师。

研究团队观察到,理想的AI记忆系统应该像一位经验丰富的大厨,不仅掌握各种烹饪技巧,还能根据不同食材和客人口味灵活调整,甚至从每次烹饪经验中学习和创新新的技法。基于这个洞察,他们开发了MemSkill系统,将传统的固定记忆操作转变为可学习和可进化的"记忆技能"。

MemSkill的核心思想是建立一个记忆技能银行,每个技能就像是一个专门的烹饪技法说明书,详细描述了在什么情况下使用、如何使用以及需要注意什么。与传统方法不同的是,这个技能银行不是一成不变的,而是可以根据实际使用效果不断改进和扩展的。系统包含三个关键组件:控制器负责从技能银行中选择最合适的技能组合,就像大厨根据当前情况选择合适的烹饪技法;执行器则根据选中的技能来实际处理记忆操作,就像按照选定技法来烹饪;设计器会定期检查那些效果不好的案例,分析问题所在并改进技能,甚至创造新的技能。

在具体实现上,系统首先用四个基本的记忆技能进行初始化,包括插入新记忆、更新已有记忆、删除错误记忆和跳过无用信息,就像厨师最开始掌握的基本功。然后,控制器通过强化学习的方式学会如何选择合适的技能组合。当面对新的对话片段时,控制器会分析当前情况,从技能银行中挑选最相关的几个技能,执行器再根据这些技能的指导来处理记忆。

系统最具创新性的部分在于其自我进化能力。设计器会持续监控那些处理效果不佳的困难案例,将它们收集到一个"难题缓冲区"中。当积累了足够多的难题后,设计器会分析这些失败案例的共同模式,找出现有技能的不足之处。基于这些分析,它会对现有技能进行改进,或者创造全新的技能来填补能力空白。这个过程就像是大厨通过反思失败的菜品来改进技艺,甚至发明新的烹饪方法。

为了验证MemSkill的效果,研究团队在四个不同的任务上进行了全面测试。在对话记忆任务中,他们使用了LoCoMo和LongMemEval两个数据集,这些包含了长时间的多轮对话,需要AI系统能够记住之前提到的各种信息。在交互式任务中,他们使用ALFWorld环境,这是一个模拟的虚拟世界,AI需要通过与环境交互来完成各种任务,同时保持对之前行动的记忆。此外,他们还在HotpotQA上测试了技能的跨领域迁移能力。

实验结果令人印象深刻。在对话记忆任务上,MemSkill相比最强的传统方法提升了约10-15个百分点。在交互式任务中,成功率提升甚至更加显著,在某些情况下达到了40%以上的改进。更重要的是,MemSkill显示出了优秀的泛化能力:在一个任务上训练的技能可以成功应用到其他相关任务上,甚至可以跨越不同的语言模型。

为了深入理解MemSkill的工作机制,研究团队进行了详细的消融实验。当移除控制器的学习能力,改为随机选择技能时,性能出现了明显下降,证明了智能技能选择的重要性。当固定技能银行不允许进化时,性能下降更加显著,特别是在一些复杂任务上,说明技能进化是系统成功的关键因素。

研究团队还展示了一些具体进化出来的技能例子。在对话场景中,系统学会了专门捕获时间相关信息的技能,能够识别和记录事件发生的时间、持续时间和先后顺序。它还发展出了处理实体关系的技能,能够准确记录不同人物之间的关系变化。在交互式任务中,系统进化出了专门追踪物体位置和状态的技能,这对于完成需要操作物体的任务至关重要。

MemSkill的创新之处不仅在于技术实现,更在于它代表了AI记忆管理的一种全新范式。传统方法试图预先定义所有可能需要的记忆操作,这就像试图为所有可能的烹饪情况预设菜谱一样不现实。MemSkill则认为记忆技能应该是动态的、可学习的,能够根据实际需求自我调整和进化。

这种方法的优势在多个方面得到了体现。首先是适应性更强,系统能够根据具体任务的特点发展出专门的记忆策略。其次是可扩展性更好,当遇到新类型的信息或任务时,系统可以自动学习相应的处理技能,而不需要人工重新设计。最后是泛化能力更强,在一个场景中学到的技能往往可以迁移到相关的其他场景中。

从技术角度来看,MemSkill巧妙地结合了几个关键技术。强化学习使得控制器能够学会智能地选择技能组合;大语言模型的推理能力被用来分析失败案例和生成新技能;而技能的结构化表示则确保了系统的可解释性和可控性。

研究还揭示了一些有趣的发现。比如,系统在不同领域进化出的技能呈现出明显的专业化特征:对话系统更关注时间信息和人物关系,而交互式任务系统则更关注物体状态和位置信息。这种自然的专业化表明系统确实能够自动发现不同任务的核心需求。

当前MemSkill还存在一些局限性。设计器目前只能处理插入和更新类型的技能进化,对于删除和跳过操作的优化还有待完善。另外,技能进化过程需要消耗一定的计算资源,在实际部署时需要在性能提升和计算成本之间找到平衡。

展望未来,MemSkill为AI记忆管理开辟了广阔的发展空间。研究团队设想,这种自我进化的记忆技能可能会扩展到其他AI能力上,比如工具使用、规划制定等。此外,多个AI系统之间的技能共享和协同进化也是一个有趣的研究方向。

说到底,MemSkill的意义远超出技术本身。它代表了一种新的AI设计哲学:与其试图预先定义所有可能的行为,不如让AI系统具备自我学习和进化的能力。这种方法不仅提高了系统的性能,更重要的是增强了AI适应复杂现实世界的能力。随着这类自我进化技术的发展,我们可能会看到更加智能、灵活和可靠的AI助手出现在日常生活中,能够真正理解和适应每个用户的独特需求。

Q&A

Q1:MemSkill记忆技能系统与传统AI记忆方法有什么本质区别?

A:传统AI记忆系统使用固定的操作步骤处理信息,就像按照一成不变的菜谱做菜。而MemSkill创建了可学习和可进化的"记忆技能银行",系统能根据实际效果自动改进技能甚至创造新技能,就像经验丰富的大厨能够根据情况灵活调整并发明新的烹饪技法。

Q2:MemSkill的自我进化能力具体是如何实现的?

A:系统通过三个组件协作实现进化:控制器学会选择合适的技能组合,执行器按技能指导处理记忆,设计器则收集处理失败的困难案例进行分析,找出现有技能的不足并据此改进旧技能或创造新技能。这个过程持续进行,让系统不断优化自己的记忆处理能力。

Q3:MemSkill在实际应用中的性能提升有多大?

A:在多个测试任务中,MemSkill相比最强的传统方法平均提升了10-15个百分点,在某些交互式任务中成功率提升甚至超过40%。更重要的是,在一个任务上训练的技能可以成功应用到其他相关任务上,显示出优秀的泛化能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有钱能使鬼推磨!身价数亿、拿下三块地的华晨宇,还是被骂惨了

有钱能使鬼推磨!身价数亿、拿下三块地的华晨宇,还是被骂惨了

白面书誏
2026-02-09 17:36:47
佐藤教练谈苏翊鸣:北京冬奥后胖成35岁大叔,放纵生活失去目标

佐藤教练谈苏翊鸣:北京冬奥后胖成35岁大叔,放纵生活失去目标

一枚野球君
2026-02-09 20:03:49
金-卡戴珊与汉密尔顿同框亮相超级碗,自恋情传闻后首次公开现身

金-卡戴珊与汉密尔顿同框亮相超级碗,自恋情传闻后首次公开现身

懂球帝
2026-02-09 09:58:16
南京博物院发致歉信

南京博物院发致歉信

界面新闻
2026-02-09 21:30:40
上海这里火了!全天取号6300桌,最长等位15小时,凌晨5点才进店!黄牛称一天挣1000元

上海这里火了!全天取号6300桌,最长等位15小时,凌晨5点才进店!黄牛称一天挣1000元

新民晚报
2026-02-09 19:29:47
事出反常必有妖,目前广州上海正悄悄出现9大反常现象,让人深思

事出反常必有妖,目前广州上海正悄悄出现9大反常现象,让人深思

深度报
2026-02-08 21:24:43
别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

复转这些年
2026-02-09 23:45:54
自民党胜选后,高市早苗摆出对华3条毒计,中国的天赐良机来了!

自民党胜选后,高市早苗摆出对华3条毒计,中国的天赐良机来了!

梁猕爱玩车
2026-02-09 14:04:56
强烈不满!香港特区政府再次召见

强烈不满!香港特区政府再次召见

环球时报国际
2026-02-09 00:16:05
40分12板12助攻,马刺队卡斯尔砍下历史性的40分三双,梦想成真

40分12板12助攻,马刺队卡斯尔砍下历史性的40分三双,梦想成真

好火子
2026-02-10 04:01:16
男子开3千公里参加战友婚礼,随礼8万,到家接到电话:看看后备箱

男子开3千公里参加战友婚礼,随礼8万,到家接到电话:看看后备箱

温情邮局
2025-08-18 14:57:26
大理民宿老板实名举报携程垄断:不合作没客源,合作了有钱收没钱赚

大理民宿老板实名举报携程垄断:不合作没客源,合作了有钱收没钱赚

爆角追踪
2026-02-09 10:39:56
高市大胜后,日本共产党立即作出决定:进入全面防御与对抗状态!

高市大胜后,日本共产党立即作出决定:进入全面防御与对抗状态!

青青子衿
2026-02-09 20:42:50
曾任公安部政治部副主任、人事训练局局长的田静(女),已任新职

曾任公安部政治部副主任、人事训练局局长的田静(女),已任新职

警界君
2026-02-09 18:11:14
知名餐饮品牌上海多店停业!无锡门店最新情况

知名餐饮品牌上海多店停业!无锡门店最新情况

江南晚报
2026-02-09 16:12:56
上海交大解剖260名脑梗死者,惊讶发现:患脑梗的人,有5大共性

上海交大解剖260名脑梗死者,惊讶发现:患脑梗的人,有5大共性

刘哥谈体育
2026-02-08 10:27:55
德国外长在新加坡公开宣告:宁可忍受美国转身离开也绝不拥抱中国

德国外长在新加坡公开宣告:宁可忍受美国转身离开也绝不拥抱中国

荆楚寰宇文枢
2026-02-09 22:07:43
曹德旺又开口了:未来10年,把存款换成这4个资产,或将衣食无忧

曹德旺又开口了:未来10年,把存款换成这4个资产,或将衣食无忧

猫叔东山再起
2026-02-09 10:05:08
纪委再划红线!春节公职人员这5种行为千万别碰,将严肃处理!

纪委再划红线!春节公职人员这5种行为千万别碰,将严肃处理!

职场资深秘书
2026-02-09 14:55:08
已婚也逃不过!在爱泼斯坦的安排下,比尔盖茨和安妮·海瑟薇会面

已婚也逃不过!在爱泼斯坦的安排下,比尔盖茨和安妮·海瑟薇会面

夜深爱杂谈
2026-02-09 18:16:04
2026-02-10 04:19:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
1749文章数 160关注度
往期回顾 全部

科技要闻

实测|字节新模型带着音效和复杂运镜杀疯了

头条要闻

人民日报评"南博事件":无论涉及到什么人 绝不放任

头条要闻

人民日报评"南博事件":无论涉及到什么人 绝不放任

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

沪深北交易所优化再融资 释放3个信号

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

时尚
本地
游戏
旅游
军事航空

冬季穿衣越简单越实用!从这些日常穿搭中收获灵感,大方又自然

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

推出“黑命贵”DLC后,《我的世界》被骂“洗脑儿童”"/> 主站 商城 论坛 自运营 登录 注册 推出“黑命贵”DLC后,《我的世界》被骂“洗脑儿童” ...

旅游要闻

把银河搬到海边,灯里游太空!2026粤港澳大湾区灯会启幕

军事要闻

美伊最敏感时刻 林肯号航母迎来三位“不速之客”

无障碍浏览 进入关怀版