网易首页 > 网易号 > 正文 申请入驻

智元推出在线学习系统SOP,实现「部署即进化」

0
分享至

AIPress.com.cn报道

1月6日消息,智元具身研究中心正式发布了一套全新的在线后训练系统SOP(Scalable Online Post-training),旨在让机器人在大规模真实部署过程中不断学习、优化与进化。

传统机器人学习主要依赖预训练模型和离线数据,这在仿真环境或封闭实验室中已取得初步成果。但一旦进入真实环境,离线训练的边际效益迅速递减,模型表现出对特定任务的过拟合、对新场景的泛化不足等问题。学界和产业界普遍认为,解决这一难题的关键在于打破训练与部署之间的壁垒,让机器人在运行过程中持续积累经验、进行在线调整。


智元提出的 SOP 系统正是顺应这一趋势而生。它通过在线学习、分布式架构与多任务能力的结合,让多个机器人在不同环境中同步执行任务,将各自的交互数据及时上传至云端学习系统,再将更新后的模型参数实时推送回各机器人,实现真正意义上的“部署即进化”。这种从离线、串行学习向在线、并行学习的转变,使机器人集群能够更高效地探索现实世界的复杂状态空间,提升整体策略的泛化能力。

在实验评估中,SOP 对已有视觉-语言-动作(VLA)预训练模型的表现提升显著。在多任务场景测试中,结合 SOP 的后训练策略在复杂任务成功率上实现了大幅增长,在商超场景等真实环境下表现出更稳定的策略执行能力。

此外,在线经验学习不仅提高了失败恢复能力,而且显著提升了任务吞吐量和操作稳定性。这些结果表明,即便是真实世界中多变的环境,机器人也能通过持续学习保持策略优良。


另一项重要实验结果显示,在总训练时间相同的情况下,多机器人并行采集数据的学习效率远超单机训练模式。这意味着 SOP 不仅提升了单体策略的质量,还能在训练速度上实现倍增效应,使学习过程更快、更稳健。


在预训练规模与 SOP 效果的关系测试中,结果也显示,尽管预训练数据量对模型基础能力有显著贡献,SOP 在后续在线经验学习阶段对性能提升的边际价值更为明显。这一结果与业界对“真实世界数据驱动学习”趋势的判断相契合:离线大规模预训练为机器人提供基础理解能力,而在线后训练则能突破静态模型的局限,使机器人更好地应对动态变化场景。


值得注意的是,在当前机器人研究和产业实践中,类似的在线学习和真实世界部署探索正在加速推进。比如在具身智能和大模型融合方向,研究者提出了更为复杂的视觉-语言-动作基础模型(VLA)体系,以期让机器人具备更强的环境感知和决策能力,这也成为机器人从实验室向现实任务迁移的重要基础。

SOP 这类在线后训练系统为机器人规模化部署与智能长期演进提供了重要思路。它突破了过去机器人学习对离线数据的依赖,将个体经验高效融入集体知识库,使机器人不再是固定策略的执行体,而是能够在真实世界中不断学习、持续进化的智能体。这对于具身智能、大规模机器人部署乃至通用机器人发展都具有里程碑意义。

未来,随着在线学习技术与真实世界数据采集体系的进一步完善,机器人有望在更多实际场景中实现稳健运行,从被动执行预设任务逐渐迈向自主学习与优化,真正实现智能机器人的规模化落地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜致礼有多美?1956年和杨振宁旧金山留影,充满魅力比明星还漂亮

杜致礼有多美?1956年和杨振宁旧金山留影,充满魅力比明星还漂亮

万物知识圈
2026-01-08 09:18:51
火箭1分惜败直落西部第6!火蜜直言难受 队记:连输6支弱旅真有趣

火箭1分惜败直落西部第6!火蜜直言难受 队记:连输6支弱旅真有趣

颜小白的篮球梦
2026-01-08 14:11:06
安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居柬埔寨和欧洲

安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居柬埔寨和欧洲

红星新闻
2026-01-07 12:50:29
现阶段,我最认同的政治制度

现阶段,我最认同的政治制度

力哥说
2026-01-08 00:38:37
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
26年央视春晚导演官宣彩排!小品领军人物确认回归,终于等到这天

26年央视春晚导演官宣彩排!小品领军人物确认回归,终于等到这天

瓜汁橘长Dr
2026-01-08 10:51:52
获刑13年,江苏省政协原副主席王昊受贿案一审宣判

获刑13年,江苏省政协原副主席王昊受贿案一审宣判

界面新闻
2026-01-07 17:02:01
3厘米厚的保命门竟敞开!马杜罗最绝望的瞬间,不是美军兵临城下

3厘米厚的保命门竟敞开!马杜罗最绝望的瞬间,不是美军兵临城下

达文西看世界
2026-01-07 16:49:37
法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

历史回忆室
2026-01-02 19:54:11
陈志被曝已被捕并遣送回中国 当地人士:太子银行和地产仍正常运营

陈志被曝已被捕并遣送回中国 当地人士:太子银行和地产仍正常运营

红星新闻
2026-01-07 21:52:16
成龙在人民日报撰文

成龙在人民日报撰文

澎湃新闻
2026-01-08 11:56:23
四川省煤炭产业集团原副总经理张万松被开除党籍

四川省煤炭产业集团原副总经理张万松被开除党籍

界面新闻
2026-01-07 17:34:46
1980年轰动巨大的新疆白毛风事件有多恐怖?749局首次认怂

1980年轰动巨大的新疆白毛风事件有多恐怖?749局首次认怂

小月文史
2024-11-20 19:14:38
这下麻烦大了!不到48小时,闫学晶再迎2大噩耗,何庆魁也被牵连

这下麻烦大了!不到48小时,闫学晶再迎2大噩耗,何庆魁也被牵连

阿纂看事
2026-01-07 12:16:27
让农民挨冻的环保,是坏保

让农民挨冻的环保,是坏保

不主流讲话
2026-01-08 09:32:40
中国驻日大使罕见缺席日方新年问候交流会!日本政坛大佬施压高市

中国驻日大使罕见缺席日方新年问候交流会!日本政坛大佬施压高市

时时有聊
2026-01-08 07:45:16
王石的体面,被田朴珺扯得干干净净

王石的体面,被田朴珺扯得干干净净

言叔财经视角
2026-01-05 13:50:10
湖人队友有多差?两数据全靠东契奇支撑,替补加起来不如对手一将

湖人队友有多差?两数据全靠东契奇支撑,替补加起来不如对手一将

谢说篮球
2026-01-08 14:52:46
别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

流苏晚晴
2026-01-02 17:56:17
王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳了

王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳了

议纪史
2026-01-07 12:20:03
2026-01-08 15:15:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
102697文章数 61661关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

国家级射击教练因走私武器罪获刑10年:多省射击队购买

头条要闻

国家级射击教练因走私武器罪获刑10年:多省射击队购买

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

旅游
健康
游戏
房产
军事航空

旅游要闻

不止“故乡的云”!泰安九女峰片区用两项省级大奖定义文旅融合新美学

这些新疗法,让化疗不再那么痛苦

外媒痛批仙剑4RE盲目抄袭光与影!称其简直是可笑

房产要闻

三亚新房,又全国第一了!

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版