网易首页 > 网易号 > 正文 申请入驻

EmbodiChain开源,用100%生成式数据自动训练具身智能模型

0
分享至



机器之心发布

  • 论文地址:
  • https://www.techrxiv.org/doi/full/10.36227/techrxiv.176153394.41323502
  • 开源主页:
  • https://dexforce.com/embodichain/index.html#/
  • 代码仓库:
  • https://github.com/DexForce/EmbodiChain
  • 技术文档:
  • https://dexforce.github.io/EmbodiChain/introduction.html

大语言模型的爆发,让大家见证了 Scaling Law 的威力:只要数据够多、算力够猛,智能似乎就会自动涌现。但在机器人领域,这个公式似乎失效了。

  • 在 LLM 时代,数据是「存量」,我们只需要负责「清洗」;
  • 在具身智能时代,数据必须是「增量」,我们必须具备「创造」数据的能力。

不同于互联网上唾手可得的万亿级文本,机器人所需的、经过 3D 标定且符合物理规律的高质量交互数据,极度稀缺且昂贵。正因如此,数据采集范式成为了近年来行业研究的绝对焦点。

可以看到,整个行业正在向着更低成本、更便捷的方向全速推进:从昂贵的遥操设备,到基于动捕手套的灵巧手捕捉和更加便携式的夹爪方案,再到如今甚至不再需要佩戴手套、仅凭双手演示即可采集数据的创新方案。这些轻量化的数采范式正在将人类的经验数字化,这一路径不仅充满价值,更值得持续深耕,它是连接人类技能与机器人动作的桥梁。

整个行业在将具身智能推向大模型时代的这个目标上狂奔。

但是,即使是最极致的采集效率,客观上仍受限于物理时间的流逝和人力成本的边界。当下没有任何现有的物理采集范式,能匹配 LLM 训练所需的「互联网级」规模。这成为了具身智能迈向更高阶智能的最大桎梏。

效率定律





效率定律 (Efficiency Law) 下模型性能与数据生成速率的关系

要跨越这个鸿沟,除了物理采集的持续精进,另一种极具潜力的解决方式,就是构建一个能够超高速、自动化生成物理现实的数字世界(跨维智能团队在《GS-World》中详述了这一路径)。



在这个基于物理引擎的生成式世界中,数据的生成速率超越了时间的限制(Efficiency Law);机器人可以在零成本的试错中习得对物理因果的深刻理解;所有的边缘情况(Corner Cases)都可以在这里被模拟、被攻克。

GS-World 与 EmbodiChain

今天,跨维智能正式开源 EmbodiChain。作为通往GS-World(基于生成式仿真的世界模型)的基石,EmbodiChain 不仅仅是一个数据和模型平台,更是一次对具身智能学习范式的重构。

跨维团队提出并验证一个大胆的假设:仅凭 100% 的生成式仿真数据,只要生成速率(Rate of Generation)突破临界点,机器人就能在真实世界中涌现出超越 SOTA 的泛化能力。

这不是科幻,这就是跨维正在验证的效率定律(Efficiency Law)。

然而,要将 GS-World 从蓝图变为现实,绝非易事。跨维研究团队必须面对并攻克三个核心科学难题,这也是 EmbodiChain 致力于解决的关键:

  1. 如何实现数据生产自动化?
  2. 真实世界极其复杂,如何仅凭少量先验(如一段视频、一句描述),就在数字世界中自动重建、生成海量且物理一致的场景与任务,而无需人工手动搭建?
  3. 如何打破「虚实鸿沟」(Sim2Real Gap)?
  4. 仿真数据再多,如果不能迁移到真机也是徒劳。如何在不依赖或尽量少依赖真实数据微调的情况下,让模型习得适应真实世界噪声与动态变化的鲁棒策略?
  5. 如何突破数据生成的「IO 墙」?
  6. Scaling 需要亿级甚至十亿级的交互步数。传统的「生成 - 存储 - 读取 - 训练」模式效率极低。如何构建极致高效的数据流转机制,实现「在线数据流」?

EmbodiChain:一条永不停歇的「在线数据流和模型生产线」

为了实现这一愿景,跨维智能构建了GS-World(Generative Simulation World Model,生成式仿真世界模型)的核心基石 ——EmbodiChain。

EmbodiChain 作为一个底层的基建技术,可以把它看作去存储化的数字化流水线。Scaling 需要亿级甚至十亿级的交互步数,传统的「生成 - 存储 - 读取 - 训练」模式在面对海量 3D 数据时,存储与传输将成为不可承受之重。

在 EmbodiChain 的架构中,可以彻底抛弃「先存硬盘、再读硬盘」的陈旧范式,取而代之的是在线数据流(Online Data Streaming)和模型自动生产线。



EmbodiChain 的核心工作流。数据在生成的同时即被消费,橘色的数据流贯穿全场,无需落地存储。

这条流水线是如何工作的?

  • 世界生成(Generative Simulation):引擎不仅是环境,更是造物主。Real2Sim 模块从极少的真实样本中提取物理先验,Gen2Sim 模块则响应语言指令,自动构建出符合牛顿力学等物理规律的 3D 场景与资产。
  • 数据扩增(Data Scaling):数据不仅要多,还要「难」。系统自动进行视觉增强、物理参数随机化,并剔除那些机器人「够不着」的无效采样。
  • 自我修复(Closed-loop Recovery):真正的智能来自于从错误中学习。当仿真中的机器人抓取失败,系统会自动生成修正轨迹。这种「失败 - 修正」的闭环,比单纯的成功演示更有价值。

这一切都在 GPU 内部并行高速运转,数据如洪流般产生,训练完即销毁,不留下一丝冗余,只留下模型能力的增长。

路线之争:机器人需要的是物理精确的生成式模型

在通往具身智能世界模型的路上,目前存在两条截然不同的路线。

一条是近期火热的视频生成路线(Video World Model),如 Sora 或 LTX-Video,它们试图通过「画出」下一帧来模拟世界。虽然视觉效果惊艳,但一些对比实验揭示了其致命弱点:幻觉。

视频模型生成的画面往往缺乏长程的时空一致性,且很难精确遵循动力学方程。用这种「做梦」产生的数据训练机器人,就像让一个飞行员在爱丽丝的仙境中学习开飞机 —— 看着很美,一上真机就坠毁。

相反,EmbodiChain 选择的是GS-World 路线(基于生成式仿真的世界模型)。

  • 物理先验(Physical Priors):跨维智能坚持世界模型必须是 3D 的、交互式的、物理严谨的。
  • 特权信息(Privileged Information):在 EmbodiChain 中,使用者拥有上帝视角。比如使用者能够获取物体的精确掩码、空间关系和可供性(Affordance)。通过训练模型预测这些真实世界中不可见的「特权信息」,迫使模型理解了场景背后的几何本质,而不仅仅是表面的像素。

这正是 Yann LeCun 所倡导的理念:世界模型应该是对世界状态的预测与规划。



EmbodiChain中可以获取的特权信息示例

零真实数据,VLA 真的可行吗?

为了验证这套「效率定律」,跨维智能做了一件极端的测试:不使用任何真实数据训练模型。

跨维智能训练出的 Sim2Real-VLA 模型,在真实世界中执行任务。结果令人惊讶:

  • 远超基线:在没有任何真实数据微调的情况下,它在操作成功率上大幅领先 ACT、Diffusion Policy 等主流方法。
  • 无惧干扰:即使跨维智能像「捣乱者」一样更换桌布、移动物体、改变光照,模型依然稳如泰山。甚至在某些任务中,由于去除了真实数据中容易过拟合的背景噪声,模型的表现反而比用真实数据训练还要好。





Sim2Real-VLA 在全生成数据训练下,不仅击败了 SOTA,更展现了惊人的鲁棒性。

愿景:通往 GS-World 的「效率奇点」

EmbodiChain 的开源,只是一个开始。

GS-World 蓝图远不止于此。在跨维智能的规划中,这是一个引擎驱动的闭环路径(Engine-driven Loop):

  • 不仅环境是生成的,任务也是生成的;
  • 不仅策略是进化的,机器人的身体结构(Morphology)也会随着任务需求协同进化。

跨维智能希望 EmbodiChain 能成为每一位具身智能研究者的基础设施。不需要再为了几千条数据而在实验室里没日没夜地遥操作,不需要再为几十 TB 的硬盘存储发愁。

因为智能的未来,不应该被困在数据的匮乏中。

EmbodiChain 现已开源,邀请你一起见证具身智能的「效率奇点」。

文中视频链接:https://mp.weixin.qq.com/s/IGe1myOEmAW7JOrQyBLhBA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
两年了,为何许家印迟迟不判刑?真相比你想象的更复杂!

两年了,为何许家印迟迟不判刑?真相比你想象的更复杂!

李云飞Afey
2026-01-20 11:43:34
终于有一部国产剧,不靠「爽感」博眼球了

终于有一部国产剧,不靠「爽感」博眼球了

独立鱼
2026-01-20 22:06:35
闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

小熊侃史
2026-01-16 07:40:07
从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

草莓解说体育
2026-01-20 04:16:58
僵持24小时,两艘中方邮轮返航,5000万桶石油滞销,美方计划泡汤

僵持24小时,两艘中方邮轮返航,5000万桶石油滞销,美方计划泡汤

胖福的小木屋
2026-01-20 23:48:38
红利曼防御体系崩了!

红利曼防御体系崩了!

星火聊天下
2026-01-18 05:41:14
皇马偷着乐!阿森纳6400万镑引援成水货,皇马早看穿本质果断弃签

皇马偷着乐!阿森纳6400万镑引援成水货,皇马早看穿本质果断弃签

夜白侃球
2026-01-19 21:40:38
越媒:若越南U23进入决赛,越南一企业将奖励球队20亿越南盾

越媒:若越南U23进入决赛,越南一企业将奖励球队20亿越南盾

懂球帝
2026-01-20 21:10:28
A股:周二晚间传来2个核弹级利好!明天很可能会迎史诗级别大行情?

A股:周二晚间传来2个核弹级利好!明天很可能会迎史诗级别大行情?

股市皆大事
2026-01-20 18:10:59
1.07亿镑纪录签约,切尔西为何愿卖恩佐?

1.07亿镑纪录签约,切尔西为何愿卖恩佐?

浮萍足球
2026-01-20 04:14:08
别了,曼城!“十年重臣”将转投米兰!瓜帅钦点7000万“节拍器”

别了,曼城!“十年重臣”将转投米兰!瓜帅钦点7000万“节拍器”

头狼追球
2026-01-20 13:55:53
季克良:工作50年喝掉2吨茅台,退休7年被返聘,今87岁身体硬朗

季克良:工作50年喝掉2吨茅台,退休7年被返聘,今87岁身体硬朗

白面书誏
2026-01-20 00:58:18
半场0-0,李昊多次关键扑救,中国队继续保持零封,越南折损一将

半场0-0,李昊多次关键扑救,中国队继续保持零封,越南折损一将

侧身凌空斩
2026-01-21 00:19:46
U23国足淘汰赛处子球!又是彭啸建功,包办赛事2球,鲍盛鑫助攻

U23国足淘汰赛处子球!又是彭啸建功,包办赛事2球,鲍盛鑫助攻

奥拜尔
2026-01-21 00:40:05
伊朗或退出2026年世界杯,谁能替代他们?

伊朗或退出2026年世界杯,谁能替代他们?

星耀国际足坛
2026-01-20 18:12:43
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
路由器背面的USB接口别闲置!5个强大用法,不用真的亏大了

路由器背面的USB接口别闲置!5个强大用法,不用真的亏大了

小柱解说游戏
2026-01-20 09:37:30
中国篮坛大冲突!球员与观众、家长打起来了 场面一片混乱

中国篮坛大冲突!球员与观众、家长打起来了 场面一片混乱

体育哲人
2026-01-20 20:53:14
官方出手了!吴磊床照事件再升级,何猷君被曝出轨,赵露思被牵连

官方出手了!吴磊床照事件再升级,何猷君被曝出轨,赵露思被牵连

查尔菲的笔记
2026-01-20 16:05:51
神仙姐姐公开承认过的男朋友

神仙姐姐公开承认过的男朋友

微微热评
2026-01-20 18:35:54
2026-01-21 01:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12155文章数 142547关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

14999元华为智能门锁上市即倒挂 二级市场折让3千多元

头条要闻

14999元华为智能门锁上市即倒挂 二级市场折让3千多元

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

家居
游戏
本地
手机
公开课

家居要闻

隽永之章 清雅无尘

《秘奥:秘宇奥忆》评测:因简洁而特别"/> 主站 商城 论坛 自运营 登录 注册 《秘奥:秘宇奥忆》评测:因简洁而特别 Marvin 2026-01-2...

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

手机要闻

联想moto X70 Air Pro发布:4499元起 5000万像素旗舰三摄

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版