网易首页 > 网易号 > 正文 申请入驻

终结“Agentic 失忆”:EverMemOS多项基准再次刷新 SOTA

0
分享至


始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。

开源 EverMemOS 的最新版本在四大记忆基准上实现了最先进(SOTA)准确率。通过推出云端 API 以及面向开发者的生态计划,EverMind 正在为下一代具备长期、一致智能的 Agentic AI 提供关键基础设施,从而有效解决“失忆”难题。

自开源AI Memory Infra——EverMemOS以来,EverMind持续尝试和行业分享其技术成果和评测方法。近日,其官网Blog分享了EverMemOS的研发架构论文和持续提升的评测表现。该“自组织记忆操作系统”旨在弥合短暂的聊天交互与长期智能 Agent 之间的鸿沟——它能够把碎片化的情景式经历(episodic experiences)转化为连贯、稳定的知识结构。

之后不久,EverMind宣布EverMemOS 云服务版本进入内测阶段,其官网waitlist用户将优先进入白名单,并收到内测邀请。

与此同时,EverMInd联合OpenAI在内的十多个AI知名社区共同启动Memory Genesis Competition2026全球开发者大赛,推动开发者在AI Memory领域的共创合作和生态建设。


01.

研究突破:受“痕迹记忆(engram)”启发的记忆生命周期

在最新发布的论文《EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning》中,EverMind 详细阐述了其技术提出的一套受 engram 启发的生命周期机制,用以模拟生物认知过程。与传统 RAG 或成本高昂的超长上下文窗口不同,EverMemOS 能将经验组织为连贯、可演化的结构。

系统通过独特的三阶段工作流实现 SOTA 表现:

  1. 情景痕迹形成(Episodic Trace Formation):将对话流转换为 MemCells,用于捕捉情景痕迹、原子事实以及有时间边界的前瞻信息。

  2. 语义巩固(Semantic Consolidation):把 MemCells 动态组织为主题化的 MemScenes,提炼稳定的语义结构,并持续更新持久化的用户画像。

  3. 重建式回忆(Reconstructive Recollection):通过 agentic 检索组合“必要且充分”的推理上下文,在优化算力成本的同时保证高准确率。

02.

打破行业基准

EverMemOS 最新版本超越现有记忆系统与全上下文模型,在“准确率—效率”权衡上取得领先:

  • LoCoMo(93.05% 准确率):超越全部现有记忆系统与全上下文模型;在多跳推理(+19.7%)与时序任务(+16.1%)上优势显著,同时大幅降低 token 使用与计算成本。

  • LongMemEval(83.00% 准确率):在知识更新与时序推理方面位居第一;其中知识更新任务提升 20.6%,体现出系统可通过持续语义巩固不断“进化”的能力。

  • HaluMem(90.04% 召回):在记忆完整性方面建立新的行业标准,显著减少长时程任务中的幻觉。

  • PersonaMem v2:在 9 个复杂场景中,在深度个性化与行为一致性维度取得最佳综合表现。

“如果模型每次会话后都会重置理解,真正的 Agentic AI 就无从谈起。我们正在从静态的上下文窗口迈向动态、自组织的记忆,”EverMind 联合创始人 Jason Deng 表示,“借助 EverMemOS,我们为智能体提供了一段‘活的、会演化的历史’。基准结果表明:我们能够以远低于全上下文模型的算力成本,实现更高的准确率。”

03.

EverMemOS 云服务

为将研究快速转化为行业可用能力,EverMind 推出了 EverMemOS Cloud Service(云服务)。该平台让开发者与企业无需复杂的基础设施搭建,即可通过简单 API 集成记忆增强能力:

  • 即时升级 Agent:数分钟内把无状态聊天机器人升级为具备上下文感知的智能体。

  • 企业级安全:确保记忆数据隐私与安全。

  • 持续进化:随着底层研究迭代,记忆架构自动更新。

目前已对候补名单(waitlist)用户开放访问,也可以通过官网申请加入内测:console.evermind.ai。

Memory Genesis Competition2026

EverMind 正在投入资源,通过首届 Memory Genesis Competition开发者大赛 推动“记忆原生应用”生态。

奖池:初始奖金池 80,000 美元,并提供收入分成机会。

三大赛道:

  1. Memory + Agent:打造具备长期叙事能力的智能体。

  2. EverMemOS 插件(Plugin):扩展操作系统生态。

  3. EverMemOS 基础设施(Infra):优化核心架构。

职业与成长:优秀参赛者将获得全职机会、社区称号,以及 EverMind 工程团队的直接导师辅导。

开发者可在2月线上参赛并提交作品,3月份将在社区逐步公布优秀项目,并将邀请优秀团队参加4月初在硅谷举办的线下活动。

开发者可在 evermind.ai/activities 注册。

https://wisemodel.cn/codes/huchuanrui/EverMemOS

----- END -----


wisemodel相关:

系列模型:


关于wisemodel更多


1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
50岁和尚想不开跳河轻生:寺庙回应他违反了戒律,被驱逐出寺院

50岁和尚想不开跳河轻生:寺庙回应他违反了戒律,被驱逐出寺院

汉史趣闻
2026-02-07 17:03:56
炸锅!爱泼斯坦文件再爆猛料,狱中监控曝光,橙色人影现身…

炸锅!爱泼斯坦文件再爆猛料,狱中监控曝光,橙色人影现身…

魏家东
2026-02-07 13:11:04
中方反击次日,港口先冷清,巴拿马提解决方案,或归还长和经营权

中方反击次日,港口先冷清,巴拿马提解决方案,或归还长和经营权

来科点谱
2026-02-07 19:37:51
蓝调:一种心灵的常驻气候

蓝调:一种心灵的常驻气候

疾跑的小蜗牛
2026-02-07 20:04:07
我国成功发射可重复使用试验航天器

我国成功发射可重复使用试验航天器

界面新闻
2026-02-07 12:38:37
四川大学通报关于王竹卿相关问题:高度重视,已成立工作专班

四川大学通报关于王竹卿相关问题:高度重视,已成立工作专班

界面新闻
2026-02-07 12:14:30
太空光伏概念爆发!多家上市公司,集体公告

太空光伏概念爆发!多家上市公司,集体公告

每日经济新闻
2026-02-04 23:06:05
四川大学硕博生83页材料联合举报博导,校方启动调查程序,知情学生:他向警方报案称被诽谤

四川大学硕博生83页材料联合举报博导,校方启动调查程序,知情学生:他向警方报案称被诽谤

极目新闻
2026-02-07 18:46:53
触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

老特有话说
2026-02-04 23:42:16
巴萨发布官方公告 宣布退出欧超联赛

巴萨发布官方公告 宣布退出欧超联赛

体坛周报
2026-02-07 19:36:38
特朗普想搞“五国集团”:由美国、中国、俄罗斯、印度和日本组成,取代七国集团

特朗普想搞“五国集团”:由美国、中国、俄罗斯、印度和日本组成,取代七国集团

扬子晚报
2026-02-07 15:20:27
2026除夕,别再说“新年快乐”,精选20句拜年祝福语,高级不俗套

2026除夕,别再说“新年快乐”,精选20句拜年祝福语,高级不俗套

Lily美食谈
2026-02-06 23:29:15
乒乓球男单大爆冷!头号种子1:3被淘汰,无缘8强,奥运亚军出局

乒乓球男单大爆冷!头号种子1:3被淘汰,无缘8强,奥运亚军出局

国乒二三事
2026-02-07 07:08:49
揪心!谷爱凌脑出血休克,癫痫发作濒死边缘,母亲泪崩曝细节

揪心!谷爱凌脑出血休克,癫痫发作濒死边缘,母亲泪崩曝细节

古事寻踪记
2026-02-06 07:13:45
委内瑞拉全面驱逐俄企,欧盟出台新的对俄制裁,桑杜拒绝诺奖提名

委内瑞拉全面驱逐俄企,欧盟出台新的对俄制裁,桑杜拒绝诺奖提名

史政先锋
2026-02-07 13:25:08
因与人产生矛盾,持双管猎枪射击致对方1死1伤,山东菏泽69岁“黑老大”段效灵被执行死刑,其组织和领导黑社会性质多次故意杀人,犯罪69次

因与人产生矛盾,持双管猎枪射击致对方1死1伤,山东菏泽69岁“黑老大”段效灵被执行死刑,其组织和领导黑社会性质多次故意杀人,犯罪69次

大风新闻
2026-02-07 18:17:28
近五年跌得最惨的10只中字头股票,有的区间跌幅超90%!

近五年跌得最惨的10只中字头股票,有的区间跌幅超90%!

财经智多星
2026-02-07 19:44:05
34岁周冬雨整容失败了?近照变40岁大妈,脸垮僵硬不敢认似郑秀文

34岁周冬雨整容失败了?近照变40岁大妈,脸垮僵硬不敢认似郑秀文

八星人
2026-02-06 10:49:41
当下的经济困局,根本不是外部打压

当下的经济困局,根本不是外部打压

流苏晚晴
2026-02-07 17:04:52
打服全联盟有多难?乔丹后满打满算有5人做到,强如KD也不够格

打服全联盟有多难?乔丹后满打满算有5人做到,强如KD也不够格

毒舌NBA
2026-02-07 16:45:25
2026-02-07 22:56:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
454文章数 14关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

半年巨亏超1500亿元 全球第四大汽车巨头突然爆雷

头条要闻

半年巨亏超1500亿元 全球第四大汽车巨头突然爆雷

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

旅游
教育
亲子
健康
家居

旅游要闻

日夜皆有景,喜乐庆新春!仙游大济溪口鱼鳞坝解锁新春游玩新体验

教育要闻

奇葩生活费发放方式引争议,大学生成长空间遭挤压

亲子要闻

怀孕的女人闹情绪有多离谱?网友:觉得洗衣机太累了,让我给它道歉

转头就晕的耳石症,能开车上班吗?

家居要闻

现代轻奢 温馨治愈系

无障碍浏览 进入关怀版