网易首页 > 网易号 > 正文 申请入驻

地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

0
分享至

近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。

作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。

技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。

在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。

表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现

表2 H-RDT在Agilex2.0真机挂杯子任务中的表现

表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率

表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。

优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。

作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。

作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。

技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。

在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。

表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现

表2 H-RDT在Agilex2.0真机挂杯子任务中的表现

表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率

表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。

优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。

作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
抛弃漂亮饭的年轻人,集体钻进老式咖啡餐吧?

抛弃漂亮饭的年轻人,集体钻进老式咖啡餐吧?

九行Travel
2026-05-11 16:05:20
知情人士披露:美国或考虑恢复对伊朗军事行动

知情人士披露:美国或考虑恢复对伊朗军事行动

界面新闻
2026-05-12 13:27:48
男团、女团夺冠仅1天,韩媒、日媒接连发声锐评,态度出奇一致

男团、女团夺冠仅1天,韩媒、日媒接连发声锐评,态度出奇一致

梦醉为红颜一笑
2026-05-12 11:54:46
世界纪录将被浙江企业改写!绍兴造世界最高楼冲刺1008米!

世界纪录将被浙江企业改写!绍兴造世界最高楼冲刺1008米!

天气观察站
2026-05-12 11:09:49
刘晓彤当选!惠若琪在列,徐云丽无缘,中国排协公布完整名单

刘晓彤当选!惠若琪在列,徐云丽无缘,中国排协公布完整名单

跑者排球视角
2026-05-12 16:49:17
卡拉格:切尔西绝对会不惜一切代价把热刺送到英冠

卡拉格:切尔西绝对会不惜一切代价把热刺送到英冠

懂球帝
2026-05-12 12:20:06
正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

健康科普365
2026-05-09 21:05:04
今年将迎“史上最热夏天”?专家分析

今年将迎“史上最热夏天”?专家分析

澎湃新闻
2026-05-13 00:02:11
食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

罪案洞察者
2025-11-03 13:59:03
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

阿讯说天下
2026-04-18 11:52:55
珠穆朗玛峰南坡大本营附近发生雪崩,滑落的雪流掀起强烈气浪直冲而下,亲历者:事发时正在上厕所,眼见雪流逼近,急忙躲进厨房避险

珠穆朗玛峰南坡大本营附近发生雪崩,滑落的雪流掀起强烈气浪直冲而下,亲历者:事发时正在上厕所,眼见雪流逼近,急忙躲进厨房避险

大风新闻
2026-05-12 16:24:28
申花签下马莱加三年长约,锋线补强球迷期待新赛季

申花签下马莱加三年长约,锋线补强球迷期待新赛季

漫川舟船
2026-05-13 00:16:35
他奉命清查康、谢罪行,73岁当中纪委常务书记,侄女是著名歌唱家

他奉命清查康、谢罪行,73岁当中纪委常务书记,侄女是著名歌唱家

旧书卷里的长安
2026-05-11 21:04:17
从“跨省大交流”走上省部级岗位

从“跨省大交流”走上省部级岗位

香港經濟導報
2026-05-12 11:41:21
表决结果出炉,江启臣临阵退缩,绿营气急败坏,卢秀燕这回尴尬了

表决结果出炉,江启臣临阵退缩,绿营气急败坏,卢秀燕这回尴尬了

呼呼历史论
2026-05-11 18:33:47
WTA1000罗马站:高芙2-1逆转俄罗斯悍将,惊险晋级4强

WTA1000罗马站:高芙2-1逆转俄罗斯悍将,惊险晋级4强

俯身冲顶
2026-05-13 03:27:36
中纪委点名!国资做LP,亏了200亿

中纪委点名!国资做LP,亏了200亿

融资中国
2026-05-12 11:53:02
连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

风过乡
2026-05-12 10:30:02
赚了1.1万!深夜大跳水!A股明天暴风雨?

赚了1.1万!深夜大跳水!A股明天暴风雨?

龙行天下虎
2026-05-13 00:07:31
2026-05-13 05:39:00
爱集微 incentive-icons
爱集微
集微网官方账号
109516文章数 98353关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
房产
艺术
教育
手机

干细胞能让人“返老还童”吗

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

艺术要闻

震惊!他竟用镜头看透了所有女人的秘密!

教育要闻

求求你试试「5+1+1」学习法!!!

手机要闻

10年支持不变:谷歌力保现有Chromebook

无障碍浏览 进入关怀版