网易首页 > 网易号 > 正文 申请入驻

地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

0
分享至

近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。

作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。

技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。

在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。

表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现

表2 H-RDT在Agilex2.0真机挂杯子任务中的表现

表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率

表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。

优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。

作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人学习领域提供了高效解法。

作为全球人工智能领域最具影响力的顶级会议之一,CVPR每年汇聚学术界与工业界的最新研究成果,引领计算机视觉发展前沿。2025年CVPR中的第二届MEIS研讨会以“生成式人工智能时代的多智能体具身系统”为焦点,发起并举办了RoboTwin双臂协作挑战赛,成为全球首个专注于“建图-感知-操作”全链条能力的权威机器人竞赛,吸引了全球众多科研团队参与。

比赛聚焦于双臂机器人的复杂操作能力,要求参赛模型在仿真与真实环境中完成一系列高难度任务,包括但不限于柔性物体操作、空间推理、双手协作等,全面评估机器人的智能水平与操作精度。在真机赛环节,机器人需在真实世界中完成指定任务,如叠毛巾、精准放置物品等,对模型的泛化能力、环境适应性和操作稳定性提出了极高要求。仿真赛则侧重于模型在虚拟环境中的多任务处理能力。

面对通用机器人操作数据的规模与泛化问题,地平线机器人实验室联合清华大学计算机系朱军教授团队提出了从海量人类操作数据中学习的VLA模型H-RDT (Human to Robotics Diffusion Transformer) ,能够利用带有3D手部位姿标注的人类操作视频增强机器人操作能力,为通用机器人操作技能的规模化学习提供了新范式。

技术和架构创新,实现跨本体迁移与高效动作生成

不同机器人本体和动作空间的差异导致统一训练困难,现有数据集规模有限且质量参差不齐。这些问题从根本上制约了通用机器人操作数据的规模与泛化能力。

H-RDT模型采用独特的两阶段训练范式用于实现跨本体部署。首先在大规模第一人称人类操作数据上进行预训练,构建共享动作表征空间;随后通过模块化动作编解码器在机器人数据上进行微调,实现跨本体迁移。这一设计有效解决了不同机器人本体和动作空间差异导致的统一训练难题,显著提升了模型的泛化能力。

在架构方面,H-RDT基于一个具有20亿参数的扩散Transformer架构,配备专门的动作编码器和解码器,利用流匹配方法建模复杂的动作分布,实现了更优的训练稳定性与推理效率。为解决人类与机器人之间的差异,团队采用了精细的3D手部姿态表示方法,将动作编码为紧凑的48维向量,以捕捉关键的双手灵巧操作信息,为机器人操作提供了丰富的“上层动作空间”指导,显著提升了策略的泛化能力,有效缓解了不同机器人之间的差异问题。

在真机实验中,H-RDT模型在Aloha-Agilex-2.0、双臂ARX5、UR5+UMI三种真机设置上展现了领先的性能和出色的跨本体迁移能力。下面4个表格给出了详细的测试指标。

表1 H-RDT在Agilex2.0真机叠毛巾任务中的表现

表2 H-RDT在Agilex2.0真机挂杯子任务中的表现

表3 H-RDT在ARX5真机少样本实验中表现出优越的样本利用效率

表4 H-RDT在双UR5+UMI真机实验中在每个子任务上都表现出优越的性能

在仿真实验中,H-RDT在RoboTwin 2.0基准测试的45项任务上取得了87.2%的平均成功率,显著优于RDT、π0等基线方法,证明了其在多任务处理中的领先优势。

优异的实验结果充分验证了H-RDT模型的技术先进性和实用性,为其在实际应用中的推广奠定了坚实基础。

前景广阔,H-RDT模型赋能多领域智能化升级

H-RDT模型的成功,为机器人学习领域提供了新的研究思路与技术路径。通过利用海量人类操作数据预训练,H-RDT模型能有效缓解大规模高质量机器人演示数据稀缺的问题,为通用机器人操作数据的规模与泛化能力提升开辟了新途径。这一创新方法不仅在学术上取得了突破,更在具身智能技术的实际应用中展现了巨大潜力。

H-RDT模型的跨本体迁移能力与少样本学习效率,为机器人在不同场景下的快速适应与高效操作提供了可能,有望推动智能家居、工业制造、医疗护理等多领域的智能化应用升级。

作为机器人产业界的重要推动者之一,地平线在人工智能学习领域积累了深厚的技术底蕴,展现出强大的创新能力。早在2023年,由地平线学者作为一作公开发表的业界首个端到端自动驾驶大模型UniAD,便荣获CVPR 2023最佳论文奖,现已成为行业端到端技术的Benchmark。而此次H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中的出色表现,更是地平线在人工智能领域持续深耕、不断突破的又一有力见证。

地平线认为:“真正的智能是说每一辆车、每一个电器都具有环境感知、人机交互和决策控制的能力”。随着技术成熟与应用深化,以H-RDT模型为代表的创新技术将助力具身智能技术拓展更广泛的发展与应用。未来,地平线将继续秉承创新驱动发展的理念,坚持“赋能智能汽车和机器人,让人类生活更安全、更美好”的愿景,加大在机器人和智能汽车领域的技术研发投入,不断探索新技术、新应用,为推动全球智能化技术普惠贡献更多力量,真正实现“让机器的归机器,人的归人”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全国高速明天大调整!车主集体欢呼:早该这么干了

全国高速明天大调整!车主集体欢呼:早该这么干了

沙雕小琳琳
2026-03-26 02:05:39
女子在按摩店做理疗时被技师偷走金项链

女子在按摩店做理疗时被技师偷走金项链

新闻晨报随申Hi
2026-03-26 09:56:05
人民日报转发,三大巧合坐实“遗言”,猝死前说的话全应验了!

人民日报转发,三大巧合坐实“遗言”,猝死前说的话全应验了!

奇思妙想草叶君
2026-03-25 12:40:13
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
人民日报对张雪峰的评价——

人民日报对张雪峰的评价——

叶初七
2026-03-26 10:03:04
32克金项链不翼而飞,闺蜜全程陪同报警勘察!警方:小偷就是……卖了3.4万元

32克金项链不翼而飞,闺蜜全程陪同报警勘察!警方:小偷就是……卖了3.4万元

环球网资讯
2026-03-26 13:30:10
伊朗对以色列发起导弹打击 以多地响起防空警报

伊朗对以色列发起导弹打击 以多地响起防空警报

财联社
2026-03-26 14:50:24
张少康辞去广东省人民政府副省长职务

张少康辞去广东省人民政府副省长职务

新快报新闻
2026-03-26 11:50:03
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

环球网资讯
2026-03-25 15:39:26
中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

每日经济新闻
2026-03-26 13:25:09
周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

爆角追踪
2026-03-26 08:56:24
约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

醉卧浮生
2026-03-26 12:35:12
上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

环球网资讯
2026-03-26 08:13:14
人社部:职称评审将重大调整!!

人社部:职称评审将重大调整!!

新浪财经
2026-03-25 21:42:36
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

180视角
2026-03-26 14:51:03
中国买了欧洲1000亿人民币的飞机:东航向空客购买101架A320

中国买了欧洲1000亿人民币的飞机:东航向空客购买101架A320

观察者网
2026-03-25 18:00:06
这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

小椰的奶奶
2026-03-26 09:50:43
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
2026-03-26 16:16:49
爱集微 incentive-icons
爱集微
集微网官方账号
109241文章数 98340关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
时尚
数码
教育
手机

家居要闻

傍海而居 静观蝴蝶海

皮衣+裙,高级到炸

数码要闻

三星更新870 EVO系列SATA SSD:最高8TB 定价超1万元

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

手机要闻

苹果回应iPhone自动打电话 升级系统可解决

无障碍浏览 进入关怀版