关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
现在的AI智能体是真的厉害,不管是做深度科研、写工业报告,还是帮着处理日常琐事,能力越来越强。
不过你知道吗,这些智能体背后都有个“记忆系统”,就像咱们人类的大脑皮层,专门记着和环境交互的过程、提炼的经验技巧,靠着这些才能越用越熟练。
目前多数的智能体记忆都是死的,科学家们设计好一套架构就不变了。这就好比让一个学生用背课文的方法学数学,用解方程组的思路学语文,不管什么任务都一套逻辑,效率肯定高不了。
OPPO AI Agent团队和LV-NUS实验室联手开源了MemEvolve来解决这一难题。
![]()
智能体的记忆系统主要分两种,一种是记用户偏好的个性化记忆,另一种是记技能经验的自改进记忆。
自改进记忆从最开始记原始交互过程,到后来提炼技巧、快捷键,再到现在存API、代码库,形式一直在变,但核心问题没解决太死板。
擅长记API的记忆系统,上网冲浪时顺风顺水,碰到数学推理就歇菜;靠自我批判升级的,做逻辑题厉害,编码时就掉链子。
说白了,不同任务需要不同的记忆方式,固定架构根本满足不了,这也是为啥很多智能体换个任务就拉胯的关键原因。
咱们人类最厉害的地方就是会灵活调整学习方法,AI智能体以前顶多算会总结的好学生,但MemEvolve让它们变成了会找对方法的聪明人。
MemEvolve比较历史的就是让智能体实现了“双重进化”。不仅能积累经验,还能自己优化记经验的方式。
![]()
它有两个循环在同时工作,内循环负责让智能体攒经验,就像咱们平时做题积累知识点,记忆架构暂时不变,只是把新学到的东西存进去,还会记录任务完成得好不好、花了多少成本、费了多长时间。
外循环更关键,会根据内循环的表现,调整记忆架构。比如发现某个记忆方式检索太慢,就优化检索逻辑;觉得存储的信息太杂,就调整存储规则。
刚开始只有一个基础架构,慢慢迭代出越来越好用的版本,形成“攒经验-调方法-攒更多经验”的良性循环。
为了方便调整,MemEvolve把所有记忆架构拆成了四个核心模块,就像乐高积木,想改哪个就改哪个,不用整体推倒重来。
编码模块负责把原始经验整理成结构化的信息,比如把杂乱的交互过程提炼成清晰的步骤;存储模块就是找地方存这些信息,向量数据库、知识图谱都能用;
![]()
检索模块负责需要的时候快速找到有用的记忆;管理模块则定期“清理”记忆库,删掉没用的、合并重复的,避免内存臃肿。
MemEvolve不会瞎改架构,先给现有架构做“体检”,看看哪个模块拖后腿,是检索太慢,还是编码不够清晰。
然后根据问题针对性优化,生成几个新版本,再通过任务测试选出最好用的,这样每次进化都能精准命中问题。
光有框架不够,OPPO还搞了个统一的代码库EvolveLab,把12种主流的记忆架构都重新实现了一遍,像ExpeL、Voyager这些知名架构,都能在里面找到。
这个代码库最贴心的是接口统一,不管哪种记忆架构,都能无缝替换,方便研究者们公平对比。而且内置了好几个权威测试平台,支持在线和离线两种评估模式,不用自己再搭测试环境。
不管是刚入门的研究者,还是资深大佬,都能靠它快速测试自己的想法,大大降低了自进化记忆系统的研究门槛,相当于给整个领域搭了个标准化的“竞技场”。
研究团队在四个权威测试平台上做了大规模实验,结果让人眼前一亮。把MemEvolve集成到SmolAgent和Flash-Searcher这两个主流框架里,效果立竿见影。
Flash-Searcher搭配GPT-5-mini,在WebWalkerQA测试中,pass@3从69.67%涨到81.18%;
SmolAgent搭配GPT-5-mini,在GAIALevel-1测试中,准确率从69.81%飙到92.45%。最夸张的是KimiK2搭配Flash-Searcher,在WebWalkerQA上直接提升了17.06%,这个幅度在AI领域真的很少见。
![]()
一般的记忆系统换个任务就不行了,但MemEvolve在TaskCraft上训练出来的记忆架构,直接用到WebWalkerQA和xBench-DS上,不用任何调整就能提升性能。
更强的是跨模型、跨框架兼容性,用GPT-5-mini训练的记忆架构,换到KimiK 2和DeepSeekV3.2上照样好用;
放到CK-Pro、OWL这些不同设计思路的框架里,也能稳定提分,不用专门适配,真正做到了即插即用。
开源地址:https://github.com/bingreeky/MemEvolve
想系统掌握AI核心技能、获取行业认可资质?
CAIE注册人工智能工程师认证
助你拓宽职业赛道,成为AI领域持证实力派
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.