网易首页 > 网易号 > 正文 申请入驻

地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

0
分享至

近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。





作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。



技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。



在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。



表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现



表2 H-RDT在Agilex2.0真机挂杯子任务中的表现



表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率



表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。



优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。



作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。





作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。



技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。



在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。



表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现



表2 H-RDT在Agilex2.0真机挂杯子任务中的表现



表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率



表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。



优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。



作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内地富豪,正在集体觉醒

内地富豪,正在集体觉醒

米宅海外
2026-01-20 08:03:00
巴特勒右膝韧带撕裂赛季报销,既是勇士的天灾、也是人祸

巴特勒右膝韧带撕裂赛季报销,既是勇士的天灾、也是人祸

富贵体坛说
2026-01-21 00:10:41
U23国足:计划有变?策略不变!

U23国足:计划有变?策略不变!

足球报
2026-01-20 12:53:41
2025出生人口大跌,“学生危机”将影响全社会、各行业!

2025出生人口大跌,“学生危机”将影响全社会、各行业!

51上私立
2026-01-20 19:45:33
福建平潭一首饰店遭抢劫 店主称损失两百万 官方:公安机关正在调查

福建平潭一首饰店遭抢劫 店主称损失两百万 官方:公安机关正在调查

极目新闻
2026-01-20 20:28:10
李湘账号被封仅2天,令人担忧的事发生,和释永信关系早真相大白

李湘账号被封仅2天,令人担忧的事发生,和释永信关系早真相大白

小徐讲八卦
2026-01-18 16:35:00
聂卫平:曾因一本书与陈祖德大打出手

聂卫平:曾因一本书与陈祖德大打出手

细品名人
2026-01-21 07:48:19
迟到3天的噩耗!80岁陈惠敏痛悼结拜兄弟:三弟走了,我的天塌了

迟到3天的噩耗!80岁陈惠敏痛悼结拜兄弟:三弟走了,我的天塌了

草莓解说体育
2026-01-20 16:00:01
1.01元/公里,48小时黄了:司机连夜鼓掌,平台连夜认怂

1.01元/公里,48小时黄了:司机连夜鼓掌,平台连夜认怂

刘哥谈体育
2026-01-18 12:24:35
北京一奔驰女销售请客户吃饭,细节曝光之后,父母:老脸全丢光了

北京一奔驰女销售请客户吃饭,细节曝光之后,父母:老脸全丢光了

清茶浅谈
2025-03-30 14:32:30
女学生被猎犬撕咬,脚筋咬断仍不松口,狗主人被拘,居民再曝猛料

女学生被猎犬撕咬,脚筋咬断仍不松口,狗主人被拘,居民再曝猛料

观察鉴娱
2026-01-21 10:04:39
6场11球,姆巴佩追平C罗单赛季欧冠小组赛/联赛阶段进球纪录

6场11球,姆巴佩追平C罗单赛季欧冠小组赛/联赛阶段进球纪录

懂球帝
2026-01-21 05:00:14
华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

鹤羽说个事
2026-01-14 15:22:18
1979年,党中央抓捕许世友儿子,许世友得知后:抓得好,抓得妙

1979年,党中央抓捕许世友儿子,许世友得知后:抓得好,抓得妙

大海的诺言
2024-10-04 08:55:11
聂卫平葬礼结束女儿,自曝守灵细节:每天合眼两三小时,字字戳心

聂卫平葬礼结束女儿,自曝守灵细节:每天合眼两三小时,字字戳心

行走的知识库
2026-01-20 00:59:17
惨败!申京14+13,杜兰特23中7,乌度卡没招了,火箭需要一个哈登

惨败!申京14+13,杜兰特23中7,乌度卡没招了,火箭需要一个哈登

巴叔GO聊体育
2026-01-20 15:34:02
“斩杀线”:美国民生的残酷真相

“斩杀线”:美国民生的残酷真相

新华社
2026-01-19 22:23:50
10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

牛锅巴小钒
2026-01-21 09:09:57
陈行甲语出惊人:贪官贪钱一是养儿子,二是买房子,可我都不需要

陈行甲语出惊人:贪官贪钱一是养儿子,二是买房子,可我都不需要

新时代精神
2026-01-20 22:05:43
跟你们说个大事!今年车价还会暴跌大跌

跟你们说个大事!今年车价还会暴跌大跌

流苏晚晴
2026-01-18 19:20:39
2026-01-21 10:47:00
爱集微 incentive-icons
爱集微
集微网官方账号
108885文章数 98335关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

中学食堂承包商举报校领导2年拿走300万现金 官方通报

头条要闻

中学食堂承包商举报校领导2年拿走300万现金 官方通报

体育要闻

如果NBA只剩下最后一个传统中锋

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

拆解涉税黑中介虚开套路

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

游戏
健康
时尚
房产
家居

《光环:战役进化》登陆PS5原因:玩家数量多 扩展新粉丝

血常规3项异常,是身体警报!

告别93岁时尚传奇Valentino:他留下了全世界最美的“红”

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

家居要闻

褪去浮华 触达松弛与欣喜

无障碍浏览 进入关怀版