网易首页 > 网易号 > 正文 申请入驻

MemOS“性能与智能”双跃升,面向AI应用的开源记忆管理操作系统

0
分享至

MemOS(Memory Operating System)是一个面向 AI 应用的开源记忆管理操作系统,为参数记忆、激活记忆和明文记忆等多种类型提供统一管理和智能调度,为大语言模型提供稳定、高效、可扩展的记忆支持,其模块化设计便于集成新的记忆类型、模型和存储方案,适用于各类智能应用场景。

对于开发者来说,MemOS 就像数据库之于应用:不需要重复造轮子去解决“AI 怎么记忆”的问题,只要调用 MemOS 提供的服务,就能轻松给你的 Agent 或应用装上“记忆能力”。

MemOS 架构如下


MemOS 刚刚发布了更新,下面是值得关注的变化。


一、版本速览:性能与智能双跃升

本次更新带来了 MemOS 全面的性能与智能升级,并围绕三个关键词进行优化:

  • 更快 — 接口进入毫秒级响应,支持异步记忆添加;

  • 更准 — 全面升级明文检索、BM25、图召回与混合检索策略;

  • 更懂你 — 新增偏好记忆,让模型真正理解你的风格与选择。

与此同时,我们还首次发布了 LoCoMo、LongMemEval、PersonaMem、PrefEval 四项权威评测的完整结果与代码。

评测数据:

https://huggingface.co/datasets/MemTensor/MemOS_eval_result

脚本:

https://github.com/MemTensor/MemOS/tree/main/evaluation/scripts

现已全面开源,欢迎各位小伙伴查看与复现。

本次发布亮点一览


二、接口加速:记忆写入与搜索全面提速

在本次更新中,我们引入异步机制与调度模块,让记忆写入和检索真正进入“毫秒时代”。

MemOS 利用 MemReader 组件增强对记忆的理解。在之前的版本中,ADD 接口需要耗时数秒才能处理完整个记忆添加流程。


此次更新,我们先快速切片并入库用户添加的原始记忆,并在几百毫秒内返回成功,用户即添加、即消费,然后将整个 MemReader 的记忆处理过程依托于 MemSchedule 模块异步处理,实现用户的“无感精细处理”。

开源项目内快速配置异步添加记忆

# 开启异步添加模式 async: 异步添加 sync: 同步添加
ASYNC_MODE=async


# 打开记忆调度模块
MOS_ENABLE_SCHEDULER=true


☁️ 在云平台中使用异步添加记忆

当前,Add Message 接口已经新增了异步记忆添加机制,更新后用户上轮发送的消息能够即时被检索为记忆,保证对话中的上下文连续,解决了记忆添加延迟新记忆未能即时被检索的问题。

在云平台中,你的消息将即时被检索,无需等待同步延迟。
这意味着:刚说完的话,AI 立刻记得。

三、偏好记忆:让模型更懂你

在事实记忆之外,MemOS 新增了「偏好记忆(Preference Memory)」模块。

它能自动识别用户显式与隐式偏好,让模型在回答时更贴合个体语境。

在 PrefEval 数据集中,偏好遵循正确率提升 20%+

模型不止“记得你说过什么”,还能“理解你喜欢什么”。


开源项目内配置偏好记忆

# 配置Milvus向量数据库
MILVUS_URI=http://localhost:19530
MILVUS_USER_NAME=your milvus user name
MILVUS_PASSWORD=Your passward


# 开启偏好记忆
ENABLE_PREFERENCE_MEMORY=true
PREFERENCE_ADDER_MODE=fine # fast or fine


TIPS: 1. PREFERENCE_ADDER_MODE 中,fast 更快,fine 重复率更低。 2. 开启偏好记忆不会增加 search 的耗时,会有少量 token 增加,具体取决于 pref_top_k。

☁️ 云平台中添加并检索偏好记忆

添加消息示例:

import os
import json
import requests

os.environ["MEMOS_API_KEY"] = "YOUR_API_KEY"
os.environ["MEMOS_BASE_URL"] = "https://memos.memtensor.cn/api/openmem/v1"

# headers 和 base URL
headers = {
"Authorization": f"Token {os.environ['MEMOS_API_KEY']}",
"Content-Type": "application/json"
}
BASE_URL = os.environ['MEMOS_BASE_URL']

# 示例历史对话数据
history_messages = [
{"role": "user", "content": "我暑假定好去广州旅游,住宿的话有哪些连锁酒店可选?"},
{"role": "assistant", "content": "您可以考虑【七天、全季、希尔顿】等等"},
{"role": "user", "content": "我选七天"},
{"role": "assistant", "content": "好的,有其他问题再问我。"}
]

def add_message(user_id, conversation_id, messages):
data = {
"user_id": user_id,
"conversation_id": conversation_id,
"messages": messages
}
res = requests.post(f"{BASE_URL}/add/message", headers=headers, data=json.dumps(data))
result = res.json()

if result.get('code') == 0:
print(f"✅ 添加成功")
else:
print(f"❌ 添加失败, {result.get('message')}")

# === 使用示例 ===

# 导入历史对话
add_message("memos_user_pref_test_777", "memos_conversation_pref_test777", history_messages)

检索记忆示例:

import os
import json
import requests

os.environ["MEMOS_API_KEY"] = "YOUR_API_KEY"
os.environ["MEMOS_BASE_URL"] = "https://memos.memtensor.cn/api/openmem/v1"

# headers 和 base URL
headers = {
"Authorization": f"Token {os.environ['MEMOS_API_KEY']}",
"Content-Type": "application/json"
}
BASE_URL = os.environ['MEMOS_BASE_URL']

# 用户当前query
query_text = "我国庆想出去玩,帮我推荐个没去过的城市,以及没住过的酒店品牌"

data = {
"user_id": "memos_user_pref_test_777",
"conversation_id": "memos_conversation_pref_test777",
"query": query_text,
}

# 调用 /search/memory 查询相关记忆
res = requests.post(f"{BASE_URL}/search/memory", headers=headers, data=json.dumps(data))

print(f"result: {res.json()}")

# 示例返回(为了方便理解此处做了简化,仅供参考)

# 偏好类型的记忆
# preference_detail_list [
# {
# "preference_type": "implicit_preference",
# "preference": "用户可能偏好性价比较高的酒店选择。",
# "reasoning": "七天酒店通常以经济实惠著称,而用户选择七天酒店可能表明其在住宿方面倾向于选择性价比较高的选项。虽然用户没有明确提到预算限制或具体酒店偏好,但在提供的选项中选择七天可能反映了对价格和实用性的重视。",
# "conversation_id": "0610"
# }
# ]

# 事实类型的记忆
# memory_detail_list [
# {
# "memory_key": "暑假广州旅游计划",
# "memory_value": "用户计划在暑假期间前往广州旅游,并选择了七天连锁酒店作为住宿选项。",
# "conversation_id": "0610",
# "tags": [
# "旅游",
# "广州",
# "住宿",
# "酒店"
# ]
# }
# ]

通过示例代码,大家可以发现:模型自动记录了“七天酒店”作为显式偏好,同时推断出隐式偏好:“用户倾向于性价比高的住宿选项”。

未来,你的 AI 将能更好地优化推荐与响应。

四、检索增强:更准确的上下文理解

MemOS 在本次更新中引入了多层次的检索增强策略,让模型在长文本与复杂语境中表现更稳定。

  • 原文检索:增加原始上下文细节,避免信息压缩导致的语义丢失;

  • 图检索(Graph Search):结合 BM25 与图召回,实现语义级的相关性匹配;

  • 混合检索(Mixture Mode):异步合并慢检索结果,保证结果质量优于快检索、耗时低于慢检索。

在 LoCoMo 与 LongMemEval 中:

  • LoCoMo 指标提升约 +1pt;

  • LongMemEval 单轮任务表现提升显著。

开源项目内配置原文检索


MOS_RERANKER_BACKEND=http_bge
MOS_RERANKER_URL=http://xxxxx:xxxx/v1/rerank


MOS_RERANKER_BACKEND=http_bge_strategy
MOS_RERANKER_STRATEGY=single_turn
MOS_RERANKER_URL=http://xxxxx:xxxx/v1/rerank

TIPS: 开启重排策略后会显著增加 context 长度,请根具自己需求进行配置开启

开源项目内配置图检索

# 添加启用则配置,不添加则不启用
FAST_GRAPH=true # 图检索
BM25_CALL=true # 关键词检索

TIPS: 启用 graph 优化不增加耗时,启用 BM25 则耗时长。

在开源项目内配置混合检索

SEARCH_MODE=mixture
API_SEARCH_WINDOW_SIZE=5
API_SEARCH_HISTORY_TURNS=5

五、评测结果:领先四大权威数据集

MemOS 在四项公开基准中均取得领先表现,展现了系统在长程记忆、上下文保持与偏好理解方面的综合优势。


评测代码与数据集已全面开源,详细结果已发布至 Hugging Face :

https://huggingface.co/datasets/MemTensor/MemOS_eval_result

六、开源更新:调度、检索、评测体系全面进化

New Features:

  • Async Add 支持明文与偏好记忆

  • Scheduler 模块化调度

  • Graph/BM25 混合检索

  • PrefEval 字段标准化

Improvements:

  • Redis ORM 优化

  • API 路由重构

  • 上下文追踪增强

Fixes:

  • 修复 PolarDB 边界问题 (/)

  • 统一 Milvus 接口与日志链路

✨ 写在最后

从“记忆更快”,到“记忆更准”,再到“更懂你”,这不再只是让模型“记得”,而是让模型“理解记忆”——理解你的偏好、语境与风格,构建专属的长程智能体体验。

一键体验云平台

立即进入 MemOS 云平台,体验毫秒级记忆与偏好召回能力。

https://memos-dashboard.openmem.net/

加入开源项目,共建记忆生态

欢迎访问我们的 GitHub:

https://github.com/MemTensor/MemOS

如果你喜欢我们的工作,请一键三连:

⭐️ Star Fork Watch

并欢迎通过 Issue 提交你的使用反馈、优化建议或 Bug 报告。

https://github.com/MemTensor/MemOS/issues

关于 MemOS

MemOS 为 AGI 构建统一的记忆管理平台,让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。

作为记忆张量首次提出“记忆调度”架构的 AI 记忆操作系统,我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理,为智能系统提供高效且灵活的记忆管理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你敢信吗?全世界只有我们和日本自己,还执着地叫着“天皇”!

你敢信吗?全世界只有我们和日本自己,还执着地叫着“天皇”!

南权先生
2025-11-06 19:35:03
新首相高市早苗:打破常规,与金正恩会谈聚焦绑架问题

新首相高市早苗:打破常规,与金正恩会谈聚焦绑架问题

天气观察站
2025-11-09 04:37:54
第二个富士康?企业宣布全线搬迁、近10万工人丢掉饭碗,其实央媒早有预警

第二个富士康?企业宣布全线搬迁、近10万工人丢掉饭碗,其实央媒早有预警

亿通电子游戏
2025-11-08 05:47:57
男篮1/4决赛对阵和时间出炉!辽篮再遇老对手,广东对手是最弱的

男篮1/4决赛对阵和时间出炉!辽篮再遇老对手,广东对手是最弱的

老吴说体育
2025-11-09 00:26:52
快船彻底崩了?伦纳德申请医疗退役,哈登暂离,冠军梦成空

快船彻底崩了?伦纳德申请医疗退役,哈登暂离,冠军梦成空

体坛黑馬
2025-11-08 21:07:13
穆里尼奥又要领违约金了?日落西山的世一帅或该退休了

穆里尼奥又要领违约金了?日落西山的世一帅或该退休了

K唐伯虎
2025-11-08 08:05:46
河南28岁离异女看上宁波35岁拆迁大哥主动要留宿 更多细节曝光

河南28岁离异女看上宁波35岁拆迁大哥主动要留宿 更多细节曝光

阿SIR观察
2025-11-08 11:03:09
下周一人民币遭踢!伦敦金属交易所动手,美国想12月印钱锁死中国

下周一人民币遭踢!伦敦金属交易所动手,美国想12月印钱锁死中国

亿通电子游戏
2025-11-08 13:09:04
荷兰宣布光刻机新规!全球芯片业震动,中国供应链自给开加速

荷兰宣布光刻机新规!全球芯片业震动,中国供应链自给开加速

白梦日记
2025-11-06 20:31:54
黑色幽默!电诈园区办公室中文标语,简直是天大的讽刺

黑色幽默!电诈园区办公室中文标语,简直是天大的讽刺

麦大人
2025-11-06 08:32:30
巴基斯坦防长:谈崩了

巴基斯坦防长:谈崩了

第一财经资讯
2025-11-08 15:18:06
多项数据都跌到了近几年的最低点!火箭交易杜兰特到底是否正确?

多项数据都跌到了近几年的最低点!火箭交易杜兰特到底是否正确?

稻谷与小麦
2025-11-09 02:27:20
全运会战报:蒯曼首秀晋级,陈幸同两连胜,下轮战强敌胜负难料

全运会战报:蒯曼首秀晋级,陈幸同两连胜,下轮战强敌胜负难料

清风品历史
2025-11-09 05:10:34
“新冠吹哨人”李文亮离世后,他的妻子付雪洁,如今生活过的怎样

“新冠吹哨人”李文亮离世后,他的妻子付雪洁,如今生活过的怎样

文雅笔墨
2025-11-09 02:37:53
赵鸿刚被禁赛半年,剩余5场比赛全部取消,伤势比想象的严重很多

赵鸿刚被禁赛半年,剩余5场比赛全部取消,伤势比想象的严重很多

新游戏大妹子
2025-11-08 13:08:22
重大工程开工,省委书记、省长赴施工现场,察看示意图听取汇报

重大工程开工,省委书记、省长赴施工现场,察看示意图听取汇报

政知新媒体
2025-11-08 12:56:25
全运会首日爆大冷!世界冠军竟倒在第一轮?

全运会首日爆大冷!世界冠军竟倒在第一轮?

鸿鹄说电影
2025-11-08 15:44:32
税务大地震!2025年起个体户私户收款将全面监控,这三条红线别碰

税务大地震!2025年起个体户私户收款将全面监控,这三条红线别碰

常青财税
2025-11-08 20:42:49
山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

四月十九
2024-09-03 17:10:30
澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

红豆讲堂
2025-10-14 09:30:03
2025-11-09 05:55:00
开源中国 incentive-icons
开源中国
每天为开发者推送最新技术资讯
7415文章数 34479关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

张家界荒野求生选手抓到野猪吃得满嘴流油 赛事方回应

头条要闻

张家界荒野求生选手抓到野猪吃得满嘴流油 赛事方回应

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

家居
亲子
数码
手机
公开课

家居要闻

现代自由 功能美学居所

亲子要闻

权威医者说|“备孕夫妻”饮食小技巧

数码要闻

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

手机要闻

iPhone 18全系标配2400万前摄:苹果史上最强

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版