网易首页 > 网易号 > 正文 申请入驻

清北联合推出Motion Transfer,机器人从人类数据端到端学习技能

0
分享至



本文的作者来自清华大学、北京大学、武汉大学和上海交通大学,主要作者为清华大学硕士生袁承博、武汉大学本科生周睿和北京大学博士生刘梦真,通讯作者为清华大学交叉信息研究院的高阳助理教授。

近期,Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5,其核心亮点之一便是被称为 Motion Transfer Mechanism(MT)的端到端动作迁移算法 —— 无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。

正当业内还在揣摩 MT 的「庐山真面目」时,清华、北大等高校联合团队率先把同类思路推到更高维度:直接把「动作迁移」做到人类 VR 数据上!

更难得的是,他们第一时间放出完整技术报告、训练代码与权重,全部开源可复现。下面带你快速拆解这项「人类→机器人」零样本动作迁移新范式。



  • 论文链接:https://arxiv.org/abs/2509.17759
  • 项目链接:https://motiontrans.github.io/
  • 代码地址:https://github.com/michaelyuancb/motiontrans

什么是 MotionTrans 框架



MotionTrans:端到端、零样本、多任务的迁移人类技能

该论文提出 MotionTrans—— 业界纯端到端、人类→机器人的 Zero-shot RGB-to-Action 技能迁移框架,一举打通「看人会」到「我会做」的最后一公里。

  1. 零样本迁移:无需任何同任务机器人演示,仅靠人类佩戴 VR 采集的 数据,机器人即可一次性学会倒水、拔插座、关电脑、收纳等日常操作,实现真正的「眼会到手会」。
  2. 小样本精进:在零样本基础上,再用极少量(约 5–20 条)机器人本体数据微调,即可把 13 种人类技能推至高成功率。
  3. 端到端且架构无关:整套算法为端到端,且与机器人模型架构完全解耦;作者已在 Diffusion Policy 与 VLA 两大主流范式上「即插即用」,验证零样本迁移的通用性与可扩展性。

MotionTrans 算法是怎么实现的



MotionTrans算法框架概览图

MotionTrans 算法框架是一套简单易用,方便扩展的系统。具体来说,团队首先自研了基于 VR 设备的人类数据采集系统(已开源)。该系统支持便携式的同时采集人类第一人称视频、头部运动、腕部位姿和手部动作。

然后,团队通过坐标系变换和手部重定向(Retargeting)等方法,将人类数据转换为机器人格式。具体来说:

  1. 第一人称视频:人类数据与机器人数据都使用第一人称视角来作为视觉感知。
  2. 相对腕部动作表征:为了进一步缩小人类动作与机器人动作之间的差距,团队使用相对位腕部姿(Relative Pose)来作为腕部动作表征。
  3. 手部重定向:团队使用 Dex-Retargeting 工具将人类手部动作转换为机器手对应的关节运动。

除此之外,团队还提出使用人类 - 机器人统一的动作归一化(Unfied Action Normalization)以及赋权重的人类 - 机器人联合训练算法(Weighted Human-Robot CoTraining),来进一步实现人类向机器人技能迁移的效果。MotionTrans 是一套通用的端到端训练框架。

因此,团队选择了最为主流的 Diffusion Policy 和 VLA 模型来作为模型架构。最后,团队采集了一个大规模人类 - 机器人数据数据集,包含 3200 + 轨迹、15 个机器人任务、15 个 (与机器人任务不同的) 人类任务和超过 10 个真实生活场景。



MotionTrans Dataset:高多样性的大规模人类-机器人数据集

零样本表现:直接从人类数据学会若干技能

团队首先评估零样本迁移:直接把「人类集合」里的任务部署到机器人,对于这些任务,全程未采集过任何一条机器人演示。

结果显式,在全部 13 个任务上,机器人模型的平均成功率可以达到 20 %,其中:Pick-and-Place 系列表现最佳,成功率可达 60% – 80%;VLA 模型在 「关电脑」任务上更是拿下 100 % 一次性通关;其它更为困难的任务,如拔插座、开盒子、避障放置等也取得可观的成功率。

除此之外,即便成功率为 0 的任务,MotionTrans 依旧学会了正确的动作方向与趋势。以擦桌子为例,模型虽未能把抹布推到足够远,但已清晰输出 “向前推” 的连续动作,验证了框架在零机器人数据条件下能够捕获任务核心语义。



MotionTrans支持零样本实现端到端的人类向机器人技能迁移

微调后表现:仅用少量机器人微调数据,精通 13 个新任务

在随后的「小样本微调」阶段,团队只给每个「人类原生」任务补采了 5 条机器人轨迹 ——短短几分钟的示教,便让模型在 13 个任务上的平均成功率从 20% 的零样本基线跃至约 50%;当把机器人轨迹增加到 20 条,平均成功率更是直达到 80%。

除此之外,实验结果显示,同时使用机器人数据和人类数据联合训练的 MotionTrans 方法要显著优于对比的 Baseline 方法。

最后,团队还实施了大量消融试验和探索性实验,来验证 MotionTrans 框架设计的合理性,以及揭示 Motion Transfer 发生的底层原理与机制。



MotionTrans算法机器人数据微调效果曲线图

总结:人类数据学习的全新视角

MotionTrans 首次向社区证明:即便是最前沿的端到端 VLA 模型,也能在「零机器人演示」的严苛设定下,仅凭人类 VR 数据就解锁全新的技能。

这一结果改变了人们对人类数据的认知 —— 它不再只是提升鲁棒性或加速收敛的 「调味剂」,而是足以独立充当「主菜」,让机器人直接习得陌生任务。框架本身简洁直白、模块化设计,采、转、训三步即插即用,未来面对更大规模的数据集或参数量级的模型,只需横向扩容即可适用。

最后,团队开源了所有的数据、代码和模型,为后续的相关研究提供支持。

更多细节请参阅原论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
糟糕!小鹏汽车大跌10%,理想触及52周股价最低

糟糕!小鹏汽车大跌10%,理想触及52周股价最低

鞭牛士
2025-11-18 06:50:58
轮状病毒、诺如病毒等感染进入高发期 万一感染该怎么办?

轮状病毒、诺如病毒等感染进入高发期 万一感染该怎么办?

大象新闻
2025-11-18 06:50:03
四川舰刚刚出海三天,就突然返回造船厂码头,是发生了什么事吗?

四川舰刚刚出海三天,就突然返回造船厂码头,是发生了什么事吗?

荷兰豆爱健康
2025-11-18 08:38:27
80后已经有1100万人提前下车了。

80后已经有1100万人提前下车了。

爱吃糖的猫cat
2025-11-16 18:27:38
“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

妍妍教育日记
2025-11-09 10:44:07
记者:恩里克很欣赏小蜘蛛且球员也愿加盟,马竞要价1.2亿欧

记者:恩里克很欣赏小蜘蛛且球员也愿加盟,马竞要价1.2亿欧

懂球帝
2025-11-17 16:09:11
老弗爷看走眼!错失西班牙队中场核心,造成皇马“缺脑”之痛

老弗爷看走眼!错失西班牙队中场核心,造成皇马“缺脑”之痛

梦回千年aa
2025-11-18 10:08:19
女子为10件毛衣从法国飞回国维权:不是钱的事,就为一口气!

女子为10件毛衣从法国飞回国维权:不是钱的事,就为一口气!

潇湘晨报
2025-11-17 15:07:31
宋佳获奖后口碑大翻车!官方评论区沦陷,过往得奖经历被彻底开扒

宋佳获奖后口碑大翻车!官方评论区沦陷,过往得奖经历被彻底开扒

萌神木木
2025-11-16 14:09:44
美国女排普拉默,身高198大骨架,和小个子男友一起跳舞,举高高

美国女排普拉默,身高198大骨架,和小个子男友一起跳舞,举高高

可乐谈情感
2025-11-17 13:20:12
把兰州文旅干破防的“剪刀姐”身份被扒,不是谁发视频谁有理

把兰州文旅干破防的“剪刀姐”身份被扒,不是谁发视频谁有理

Mr王的饭后茶
2025-11-16 21:54:10
王妃精致到发丝,王子直接变秃子

王妃精致到发丝,王子直接变秃子

Yuki女人故事
2025-11-17 15:03:06
霍启仁大婚!霍震霆、朱玲玲出席两人关系融洽,新娘子父母气质好

霍启仁大婚!霍震霆、朱玲玲出席两人关系融洽,新娘子父母气质好

娱乐团长
2025-11-17 16:07:52
霍建华烟瘾大,面相都变凶了

霍建华烟瘾大,面相都变凶了

冬天来旅游
2025-11-18 08:04:58
1-7!意大利悬了,可遇三大苦主,世界杯附加赛首轮,只有5种选择

1-7!意大利悬了,可遇三大苦主,世界杯附加赛首轮,只有5种选择

嗨皮看球
2025-11-17 17:30:29
尼日利亚连续两届无缘世界杯,该国足协向总统、政府、人民道歉

尼日利亚连续两届无缘世界杯,该国足协向总统、政府、人民道歉

懂球帝
2025-11-18 00:48:08
泰王访华目的揭秘,背后是女王储和四子夺嫡的“托孤”豪赌

泰王访华目的揭秘,背后是女王储和四子夺嫡的“托孤”豪赌

天气观察站
2025-11-17 06:25:51
71天恋情8个月退网!叶珂回归放猛料:感谢黄晓明孩子由奶奶照顾

71天恋情8个月退网!叶珂回归放猛料:感谢黄晓明孩子由奶奶照顾

老吴教育课堂
2025-11-18 02:36:48
日本政府正式宣布!11 月 11 日日本政府官宣 2026 年上调签证费

日本政府正式宣布!11 月 11 日日本政府官宣 2026 年上调签证费

南权先生
2025-11-13 15:52:13
暂停!“感受到中方态度的严厉”

暂停!“感受到中方态度的严厉”

观察者网
2025-11-18 10:04:03
2025-11-18 11:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11739文章数 142506关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

"中方没有G20见高市早苗计划" 外交部回答斩钉截铁

头条要闻

"中方没有G20见高市早苗计划" 外交部回答斩钉截铁

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

家居
亲子
本地
房产
军事航空

家居要闻

彰显奢华 意式经典风格

亲子要闻

从怀孕到生娃,这2个阶段最该“闭嘴”,说多反而不吉

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

房产要闻

大胆预测:三亚湾终极版低密度豪宅可能要来了!

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版