网易首页 > 网易号 > 正文 申请入驻

哈佛揭示外部反馈对Agent记忆管理重要性,构建自我演化型Agent

0
分享至

近年来,大模型的迅速发展赋能了大量交互式的智能代理(大模型 Agent),使后者在类似代码生成、自动驾驶、个人助理等领域展现出令人瞩目的潜力。

这些 Agent 通常需要类似人类的记忆能力,以便持续学习并逐渐提升自身表现。具体而言,Agent 需要记录并回忆曾经遇到的任务输入以及对应的输出结果,从而帮助其在新的任务中取得良好表现。

然而,目前各种 Agent 所使用的记忆模块往往是为特定任务专门设计的。例如,自动驾驶 Agent 存储的是车辆的轨迹与状态数据,代码生成 Agent 保存的是代码片段,而个人助理型 Agent 则可能倾向于总结对话信息。这种碎片化的、任务导向的设计方式,使得研究记忆管理的通用规律与共性变得极其困难。因此,美国伊利诺伊大学香槟分校本科校友、美国哈佛大学博士生熊梓迪和所在团队决定回归到最基本的记忆管理操作——添加操作与删除操作,以便解决这样一个通用而核心的问题:到底该如何管理记忆,才能长期提升大模型 Agent 的表现?

研究团队的目标是提供系统性的实验证据和具有普适性的原则,避免开发者因为缺乏通用准则而只能凭经验制定策略,从而导致性能的不稳定甚至退化。

如前所述,与以往关注复杂记忆机制设计的研究不同,研究团队的研究重点回归到记忆管理最基础的两个操作上:

  • 添加:判断一个新任务的执行结果是否值得被记忆。
  • 删除:决定何时以及按照什么标准删除过去的记忆。

通过研究不同精度的外部反馈作为这两项操作的执行标准,研究团队发现了以下三个核心规律:

  • 第一个规律是经验跟随现象(Experience-Following):Agent 在处理当前任务时,倾向于复制检索到的相似历史任务的输出,而这种现象不区分记忆质量的好坏,具有高度一致性。
  • 第二个规律是错误传播效应(Error Propagation):当记忆添加的外部反馈精度和评估标准不严,错误或低质量的任务执行结果被存入记忆后,会不断被后续任务所模仿,从而导致一连串的决策失误,甚至使 Agent 长期表现退化。
  • 第三个规律是经验回放失配(Misaligned Memory Replay):即使某些记忆本身正确,但如果它们与当前任务的上下文不匹配或已过时,仍然会拖累 Agent 的表现。因此,需要通过精准的外部反馈进行持续维护或删除。

整体而言,研究团队揭示了一个长期被忽视的重要问题,即精准可靠的外部反馈对于记忆管理设计的重要性。在绝大多数实际场景中,由于缺乏这种高质量反馈,Agent 的记忆系统反而可能阻碍而非促进其长期的表现。

研究团队希望本研究能够激发更多关于大模型 Agent 各模块通用机制的系统性研究,并期待本工作中的发现能够为未来记忆模块的设计提供实证参考,从而推动构建更智能、具备自我演化能力的大模型 Agent。

谈及研究过程,熊梓迪对 DeepTech 表示,他与本次相关论文的共同通讯作者 Zhen Xiang 师兄(现为美国佐治亚大学助理教授)希望找到一种普遍适用于各种 Agent 的记忆管理方案。研究早期,他们尝试了许多复杂的方法,但发现由于 Agent 任务差异巨大,很难提炼出真正通用的解决方案,也难以清晰界定研究问题。

反思之后,研究团队决定回归最基础的记忆操作,聚焦于记忆的添加和删除。之所以选择这两个操作,是因为它们不仅是记忆系统中最基本的部分,同时在不同 Agent 中都有明确可能的实现方式。

研究团队随后建立了一个统一的实验框架,选择了具有代表性的多个不同领域的 Agent,包括医疗数据、自动驾驶、物联网安全等,以充分验证普适性。经过大量的实验和分析,研究团队发现了 Agent 记忆管理中三个重要的共性问题:经验跟随、错误传播和经验回放失配。这些发现帮助研究团队明确了准确可靠的外部反馈在记忆管理中不可或缺的角色,也为后续的研究和应用提供了明确的方向。

不过,熊梓迪坦言:“实验中应用程序编程接口(API,Application Programming Interface)的花销非常昂贵,比如像 GPT-4o 作为 backbone 让 Agent 在几千条任务上跑的花销真的很惊人。”这也更加凸显了本次研究的不易。

日前,相关论文以《内存管理如何影响大模型代理:经验跟随行为的实证研究》(How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior)为题发在arXiv[1],熊梓迪是第一作者。

未来,研究团队希望进一步探索如何在缺乏高质量外部反馈的情况下,尽可能减少记忆模块可能带来的负面影响,并提升其长期表现。他们相信,这对于现实的大模型 Agent 应用具有重要的价值。

参考资料:

1.https://arxiv.org/pdf/2505.16067

排版:刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“机车女神”痞幼拿下张雪!评论区沦陷了!

“机车女神”痞幼拿下张雪!评论区沦陷了!

4A广告文案
2026-05-07 09:13:48
武汉地铁“无人行李箱墙”冲上热搜!网友:太戳人了……

武汉地铁“无人行李箱墙”冲上热搜!网友:太戳人了……

环球网资讯
2026-05-08 08:09:12
要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

影孖看世界
2026-05-07 15:58:50
恩里克邀请球员们去巴黎一家餐厅庆祝其56岁生日,但本人没去

恩里克邀请球员们去巴黎一家餐厅庆祝其56岁生日,但本人没去

懂球帝
2026-05-08 06:29:27
吴宜泽夺冠后,姐姐吴宜然凭颜值火出圈,身材火辣是机车爱好者

吴宜泽夺冠后,姐姐吴宜然凭颜值火出圈,身材火辣是机车爱好者

胡一舸南游y
2026-05-07 23:59:00
30万人突然没活干!烟花厂全链停产,饭碗断了,出路在哪?

30万人突然没活干!烟花厂全链停产,饭碗断了,出路在哪?

三农雷哥
2026-05-08 07:59:35
王曼昱轻松击败申裕斌,为何孙颖莎赢金娜英艰难?马琳贡献表情包

王曼昱轻松击败申裕斌,为何孙颖莎赢金娜英艰难?马琳贡献表情包

体育大学僧
2026-05-08 09:39:34
工作几年后才发现:越是草台班子,越沉迷毫无意义的精细化

工作几年后才发现:越是草台班子,越沉迷毫无意义的精细化

细说职场
2026-05-06 13:45:18
“银行员工转走储户1800万元炒股”,最新进展:银行全额支付储户1000万元存款本金和利息,另一储户800万元仍无明确进展

“银行员工转走储户1800万元炒股”,最新进展:银行全额支付储户1000万元存款本金和利息,另一储户800万元仍无明确进展

大风新闻
2026-05-07 15:17:13
使用违禁药物!中国马拉松国际健将,遭国际田径诚信委员会禁赛

使用违禁药物!中国马拉松国际健将,遭国际田径诚信委员会禁赛

全景体育V
2026-05-08 07:05:35
汪峰被曝换新欢,森林北清空账号划清界限

汪峰被曝换新欢,森林北清空账号划清界限

搞笑娱乐笑话
2026-05-08 09:37:22
多国紧急排查汉坦病毒疫情,世卫官员称公众不必过度恐慌

多国紧急排查汉坦病毒疫情,世卫官员称公众不必过度恐慌

环球网资讯
2026-05-08 06:56:12
75岁姜昆近况:与46岁单身爱女相依为命,日子过得让人羡慕

75岁姜昆近况:与46岁单身爱女相依为命,日子过得让人羡慕

娱说瑜悦
2026-04-04 15:38:01
搞垮中国交通的罪魁祸首,并非是车太多?这几座山不移除就白搭了

搞垮中国交通的罪魁祸首,并非是车太多?这几座山不移除就白搭了

原来仙女不讲理
2026-05-07 23:09:21
纳赛尔:恩里克第一年几乎每晚都睡在训练基地,研究球队发展

纳赛尔:恩里克第一年几乎每晚都睡在训练基地,研究球队发展

懂球帝
2026-05-07 23:44:38
王心凌演出被镭射激光烫到腿,现场痛到尖叫,主办方致歉!医生:突发烫伤建议第一时间进行冷敷或冷水冲洗

王心凌演出被镭射激光烫到腿,现场痛到尖叫,主办方致歉!医生:突发烫伤建议第一时间进行冷敷或冷水冲洗

鲁中晨报
2026-05-06 15:38:22
221%暴涨后,华友钴业5月停产!印尼的“关门打狗”有多狠

221%暴涨后,华友钴业5月停产!印尼的“关门打狗”有多狠

今夜繁星坠落
2026-05-08 04:10:30
记者:巴尔韦德的声明很荒唐,整件事怎么听都说不通

记者:巴尔韦德的声明很荒唐,整件事怎么听都说不通

懂球帝
2026-05-08 08:05:08
中国光伏的堡垒,被印度从内部攻破

中国光伏的堡垒,被印度从内部攻破

观察者网
2026-05-08 09:00:37
买牛肉,内行:少买牛腱子和牛腩,多买这3种,好吃不贵!

买牛肉,内行:少买牛腱子和牛腩,多买这3种,好吃不贵!

江江食研社
2026-05-07 15:53:17
2026-05-08 11:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16673文章数 514930关注度
往期回顾 全部

科技要闻

追赶星舰:中国商业火箭离SpaceX有多远?

头条要闻

媒体:特朗普党内同盟访华 当着王毅的面感谢中国

头条要闻

媒体:特朗普党内同盟访华 当着王毅的面感谢中国

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

黄子佼获缓刑4年,无需入狱服刑

财经要闻

一觉醒来,美伊又打起来了

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

旅游
教育
游戏
家居
时尚

旅游要闻

记者手记|新加坡景区迎来中国智能机器狗

教育要闻

开始报名!山东2026夏季学考(合格考)缴费+注意事项!

PS Store“特惠”标签突然消失又回归?玩家虚惊一场

家居要闻

破茧成蝶 土味精装房爆改

今年母亲节,和妈妈一起变漂亮

无障碍浏览 进入关怀版