网易首页 > 网易号 > 正文 申请入驻

R²D²:借助 NVIDIA 研究中心的工作流和模型,灵巧机器人更适应环境

0
分享至

如今,机械臂被广泛应用于装配、包装、检测等众多领域。然而,它们仍需预先编程才能执行特定且往往是重复性的任务。为了满足在大多数环境中对适应性日益增长的需求,需要具备感知能力的机械臂,以便根据实时数据做出决策并调整行为。这不仅能让机械臂在协作环境中执行各类任务时更加灵活,还能通过对危险的感知来提升安全性。

本期的“NVIDIA 机器人研究与开发摘要 (R²D²) ”探讨了 NVIDIA 研究中心和机器人灵巧操作、物体操控和抓取有关的工作流以及 AI 模型(相关成果如下文),以及它们如何应对机器人面临的关键挑战,如适应性和数据稀缺问题:

  • DextrAH-RGB:一种基于立体 RGB 输入实现灵巧抓取的工作流。
  • DexMimicGen:一种利用模仿学习 (IL) 进行双手灵巧操控的数据生成流程,在 2025 年 IEEE 国际机器人与自动化会议 (ICRA) 上展示。
  • GraspGen:一个包含超过 5700 万个针对不同机器人和夹具的抓取数据的合成数据集。

什么是灵巧机器人?

灵巧机器人能够精确、灵活且高效地操控物体。机器人的灵巧性涉及精细的运动控制、协调能力,以及在非结构化环境中处理各种任务的能力。机器人灵巧性的关键方面包括抓握、操控、触觉敏感度、敏捷性和协调性。

机器人的灵巧性在制造业、医疗健康和物流等行业中至关重要,它使那些传统上需要人类精准操作的任务实现自动化成为可能。

NVIDIA 的机器人灵巧操作

工作流及模型

灵巧抓取是机器人技术中的一项具有挑战性的任务,要求机器人能够精确且快速地操控各种各样的物体。传统方法在处理反光物体时往往存在困难,并且难以很好地推广应用到新的物体或动态环境中。

NVIDIA 研究中心通过开发端到端的基础模型和工作流来应对这些挑战,这些模型和工作流能够让机器人在不同物体和环境中实现稳定可靠的操控。

用于灵巧抓取的 DextrAH-RGB

DextrAH-RGB 是一种基于立体 RGB 输入,实现机械臂手部灵巧抓取的工作流。利用这一工作流,相关策略完全在仿真环境中进行训练,并且在实际部署时能够应用于各种新的物体。DextrAH-RGB 借助 NVIDIA Isaac Lab,在仿真环境中针对不同物体进行了大规模训练。

训练过程分为两个阶段。首先,运用强化学习 (RL) 在仿真环境中训练一个教师策略。教师策略是一种特殊的织物引导策略 (FGP),它在几何织物动作空间内发挥作用。几何织物是一种矢量化的底层控制方式,将运动转化为关节位置、速度和加速度信号,并以命令的形式传输给机器人的控制器。通过嵌入避障和目标达成行为,这种方式在部署时确保了安全性和响应速度,从而实现快速迭代。

教师策略有一个长短期记忆 (LSTM) 层,能够对现实世界的物理特性进行推理和适应。这有助于融入诸如重新抓取和理解抓取成功与否等纠正行为,以应对当前的动态情况。训练的第一阶段通过利用领域随机化来确保策略稳定健性和适应性。在训练教师策略时,会改变物理、视觉和干扰参数,逐步增加环境的难度。

在训练的第二阶段,使用逼真的平铺渲染技术,将教师策略提炼为仿真环境中基于 RGB 的学生策略。这一步使用了一个名为 DAgger 的模仿学习框架。学生策略通过立体相机接收 RGB 图像,从而能够间接地推断出物体的深度和位置。

图 1. DextrAH-RGB 训练流程

波士顿动力 Atlas MTS 机器人

实现从仿真到现实的应用

NVIDIA 与波士顿动力合作,对 DextrAH-RGB 进行训练和部署。图 2 和视频 2 展示了一个由通用策略驱动的机器人系统,该系统在 Atlas 机器人的上半身成功部署了强大的、具备零样本从仿真到现实抓取能力的策略。

图 2. 使用 Isaac Lab 大规模训练 Atlas 机器人的教师策略

该系统展示了由 Atlas 机器人的三指夹具驱动的多种抓取方式,这些夹具能够抓取轻物和重物,并显示出逐渐形成的故障检测和重试行为。

用于双手操控数据生成的

DexMimicGen

DexMimicGen 是一种用于双手操控数据生成的工作流,它使用少量的人类演示来生成大规模的轨迹数据集。其目的是通过让机器人在仿真环境中学习动作(这些动作可以迁移到现实世界中),来减少手动数据收集这一繁琐的任务。这个工作流解决了人形机器人在双手灵巧操作的模仿学习中数据稀缺的挑战。

DexMimicGen 使用基于仿真的增强技术来生成数据集。首先,人类演示者使用远程操作设备收集少量演示数据。然后,DexMimicGen 在仿真环境中生成大量的演示轨迹数据集。例如,在最初发布时,借助 DexMimicGen,研究人员仅从 60 个人类演示中就生成了 21000 个演示数据。最后,使用模仿学习在生成的数据集上训练一个策略,以执行操控任务,并将其部署到真实的机器人上。

图 3. DexMimicGen 工作流

双手操控具有挑战性,因为在不同任务中需要两只手臂之间进行精确的协调。比如两只手分别抓取不同物体这样的并行任务,需要独立的控制策略。再比如抬起一个大物体这样的协调任务,需要两只手臂同步动作和时间。顺序任务则要求子任务按照一定的顺序完成,比如用一只手移动一个盒子,然后用另一只手把一个物体放进去。

DexMimicGen 在数据生成过程中考虑到了这些不同的要求,采用了一种 “并行、协调和顺序” 的子任务分类法。对于独立的手臂子任务,使用异步执行策略;对于协调任务,使用同步机制;对于顺序子任务,使用顺序约束。这种方法确保了在数据生成过程中精确的对齐和逻辑的任务执行。

图 4. 使用基于 DexMimicGen 生成的

数据训练的模型成功对罐头进行分类

当在真实世界中部署时,借助 DexMimicGen 的“现实—仿真—现实”数据生成流程生成的数据,人形机器人在进行罐头分类任务时,实现了 90% 的成功率。相比之下,仅使用人类演示数据进行训练时,模型的成功率为 0%。这些结果充分表明,DexMimicGen 在减少人力投入的同时,能够让机器人更有效地学习复杂的操控任务。

适用于多种机器人和夹具的

GraspGen 数据集

为了支持相关研究,GraspGen 在 Hugging Face 平台上提供了一个全新的仿真数据集,其中包含针对三种不同夹具的 5700 万个抓取数据。该数据集涵盖了不同物体网格的 6D 夹具变换数据以及抓取成功的标签。

图 5. 数据集中一系列不同物体的建议抓取方式

这三种夹具分别是 Franka Panda 夹具、Robotiq 2F-140 工业夹具和单触点吸盘夹具。GraspGen 数据集完全是在仿真环境中生成的,展示了自动数据生成在扩大数据集规模和多样性方面的优势。

图 6. GraspGen 仿真数据集中三种夹具的坐标系约定:Robotiq 2F-140 夹具(左)、单触点吸盘夹具(中)和 Franka Panda 夹具(右)

总结


为了满足在大多数环境中对适应性日益增长的需求,需要机械臂能够根据实时数据做出决策并调整行为。本文探讨了几种机器人灵巧操作、操控和抓取工作流以及 AI 模型,以及它们如何应对机器人面临的关键挑战,如适应性和数据稀缺问题。

想要了解更多信息,请探索以下资源:

DextrAH-RGB

  • 项目网站:
  • https://dextrah-rgb.github.io/
  • DextrAH-RGB:使用灵巧手抓取任何物体的视觉运动策略 (DextrAH-RGB: Visuomotor Policies to Grasp Anything with Dexterous Hands):
  • https://arxiv.org/abs/2412.01791

DexMimicGen

  • 项目网站:
  • https://dexmimicgen.github.io/
  • DexMimicGen:通过模仿学习实现双手灵巧操控的自动化数据生成 (DexMimicGen: Automated Data Generation for Bimanual Dexterous Manipulation via Imitation Learning):
  • https://arxiv.org/pdf/2410.24185
  • NVlabs/dexmimicgen GitHub 代码库:
  • https://github.com/NVlabs/dexmimicgen

GraspGen

  • Hugging Face 数据集:
  • https://huggingface.co/datasets/nvidia/PhysicalAI-Robotics-GraspGen

这篇文章是“NVIDIA 机器人研究与开发摘要 (R²D²) ”的一部分,旨在让开发者更深入地了解 NVIDIA 研究中心在物理 AI 和机器人应用方面的最新突破。

了解 NVIDIA 研究中心的更多信息:

https://www.nvidia.cn/research/

立即注册 NVIDIA 机器人基础课程,即刻开始您的机器人技术之旅:

https://www.nvidia.com/en-us/learn/learning-path/robotics/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈兰德谈“维京划船”庆祝:这是一个非常特别的时刻

哈兰德谈“维京划船”庆祝:这是一个非常特别的时刻

懂球帝
2026-06-23 11:38:07
从头打到尾、参加过所有战争的,只有这两位开国上将

从头打到尾、参加过所有战争的,只有这两位开国上将

【历史客栈】
2026-06-23 09:00:41
黑色星期二!日韩股市崩跌,A股三大指数重挫,机构:管好仓位

黑色星期二!日韩股市崩跌,A股三大指数重挫,机构:管好仓位

21世纪经济报道
2026-06-23 16:30:18
新一轮下岗潮真来了?三大行业即将面临失业,早知道早准备

新一轮下岗潮真来了?三大行业即将面临失业,早知道早准备

骚年先锋
2026-06-23 02:26:57
【环时深度】在对华关系上犯错数年,立陶宛失去了什么

【环时深度】在对华关系上犯错数年,立陶宛失去了什么

环球网资讯
2026-06-23 06:49:10
梅西被朗尼克、克洛普、斯卡洛尼、洛伦佐等集体歌颂!

梅西被朗尼克、克洛普、斯卡洛尼、洛伦佐等集体歌颂!

历史第一人梅西
2026-06-23 10:57:06
陈震账号解封后开始发布健身内容,网友:偷税漏税居然还能解封

陈震账号解封后开始发布健身内容,网友:偷税漏税居然还能解封

映射生活的身影
2026-06-23 16:55:39
名嘴:把梅西与乔丹做比较没问题,但把詹姆斯加进来就太荒唐了

名嘴:把梅西与乔丹做比较没问题,但把詹姆斯加进来就太荒唐了

懂球帝
2026-06-23 12:32:08
希特勒最离谱的一道命令,德国人默默执行了77年,连美国都点赞

希特勒最离谱的一道命令,德国人默默执行了77年,连美国都点赞

娱乐圈的哔哔王
2026-06-23 11:03:17
一架专机直飞北京,开启5天行程 菲律宾这下是不明白也得明白了

一架专机直飞北京,开启5天行程 菲律宾这下是不明白也得明白了

绝对军评
2026-06-22 08:12:25
如果一个县,半数以上的干部都出身纪委,会有哪些影响?

如果一个县,半数以上的干部都出身纪委,会有哪些影响?

职场资深秘书
2026-06-23 14:20:02
接亲时,小舅子要求新郎给30万出门费,新郎怒:这婚不结了,退婚

接亲时,小舅子要求新郎给30万出门费,新郎怒:这婚不结了,退婚

广西秦胖胖
2026-06-22 15:27:33
江苏一女子窗台养花,因“养得太好”招来邻居厌恶,太抓狂了…

江苏一女子窗台养花,因“养得太好”招来邻居厌恶,太抓狂了…

三农老历
2026-06-23 15:05:34
国安主场与三镇的比赛没开踢!三位久违强援就有望复出,值得期待

国安主场与三镇的比赛没开踢!三位久违强援就有望复出,值得期待

老牛体育解说
2026-06-23 17:04:38
曼城准备报价1.4亿欧元,英超转会纪录或将被刷新

曼城准备报价1.4亿欧元,英超转会纪录或将被刷新

林间小温柔
2026-06-23 01:06:15
陪玩陪睡只是皮毛!继关晓彤后,向佐再曝“猛料”,谢娜也没逃过

陪玩陪睡只是皮毛!继关晓彤后,向佐再曝“猛料”,谢娜也没逃过

趣文说娱
2026-06-21 23:14:56
黎笋长子:父亲下定决心对华开战前确认三件事,缺其一便不会打仗

黎笋长子:父亲下定决心对华开战前确认三件事,缺其一便不会打仗

唠叨说历史
2026-06-18 16:19:19
快扔掉!戴一天,辐射量相当于拍 117 次胸片

快扔掉!戴一天,辐射量相当于拍 117 次胸片

新浪财经
2026-06-21 21:37:47
闪迪、美光美股盘前跌超10%

闪迪、美光美股盘前跌超10%

每日经济新闻
2026-06-23 16:30:24
社会内卷到离谱!月薪 3500 无社保的保安岗,大批年轻人扎堆来抢

社会内卷到离谱!月薪 3500 无社保的保安岗,大批年轻人扎堆来抢

金哥说新能源车
2026-06-23 16:21:24
2026-06-23 17:52:49
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
3577文章数 1459关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

运城13岁女孩称遭男子强奸警方不予立案 当事人发声

头条要闻

运城13岁女孩称遭男子强奸警方不予立案 当事人发声

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

屋顶光伏度苦夏

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

亲子
游戏
本地
家居
公开课

亲子要闻

汪汪队狗狗认知恐龙 #大型挖掘机挖土视频 #挖掘机挖土视频

动物版星露谷《森灵旅社》EA版今日发售!

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

家居要闻

绿意盎然 自然之境

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版