网易首页 > 网易号 > 正文 申请入驻

银河通用&清华推出DexNDM,用神经动力学重塑灵巧操作

0
分享至



DexNDM 成果第一作者为清华大学交叉信息研究院博士生刘雪怡,通讯作者为清华大学交叉信息研究院助理教授、上海期智研究院 PI 弋力,研发指导团队还包括北京大学助理教授王鹤与北京银河通用有限公司

机器人使用灵巧手帮人类在工厂里拧螺丝,在家里切菜做饭的一天何时可以到来?为了实现这一愿景,旨在解决灵巧操作技能 sim-to-real 难题的 DexNDM 应运而生。



  • 论文标题:DexNDM: Closing the Reality Gap for Dexterous In-Hand Rotation via Joint-Wise Neural Dynamics Model
  • 论文链接:https://arxiv.org/abs/2510.08556
  • 项目网站:https://meowuu7.github.io/DexNDM/
  • YouTube 视频:https://www.youtube.com/watch?v=tU2Mv8vWftU

背景 – 高灵巧性复杂工具遥操作

实现高灵巧性的复杂工具遥操作,例如控制机械手使用螺丝刀或锤子,是机器人领域一个长期存在的核心挑战。传统的直接映射遥操方案,即由人手直接控制机械手,其能力通常局限于简单的抓取与放置任务,无法胜任需要精细指尖协调的复杂操控。

为了突破这一瓶颈,我们主张采用一种半自主遥操作的范式。其核心思想是将复杂的遥操任务分解为一系列机器人可以自主执行的、稳定可靠的原子技能。操作者仅需下达高层指令,由机器人底层控制器精准地完成具体操作,从而将人的意图与机器人的高精度执行力完美结合。

在众多原子技能中,手内物体旋转是一项至关重要、同时又极具挑战的基础能力。它不仅是灵巧手 “灵巧性” 的集中体现,也是使用绝大多数工具的前提。然而,手内旋转涉及到复杂且快速变化的接触动态,这带来了巨大的仿真与现实鸿沟(Sim-to-Real Gap)。以往的研究因此常常局限于特定场景,如简单的物体几何形状、受限的物体尺寸或特定的手腕姿态,难以形成通用的解决方案。

为此,我们提出了DexNDM,一个旨在学习通用、稳定底层原子技能的新方法。DexNDM 旨在突破现有工作的局限,它能够让灵巧手掌握沿着多种转轴、在多样的手腕朝向下、稳定旋转各类物体的技能,覆盖了包括具有挑战性的长条状物体和微小物体在内的广泛场景。

基于 DexNDM 所提供的强大且稳定的旋转原子技能,我们最终构建了一个高灵巧性、高鲁棒性的半自主遥操系统。在该系统中,操作者可以轻松地引导灵巧手完成此前无法实现的高难度任务,例如使用螺丝刀拧紧螺丝、用锤子敲击钉子等手 - 工具 - 物体交互的复杂工具操作,甚至可以完成对系统鲁棒性有极高要求的长程家具装配任务。这充分证明了我们所提出的 “原子技能赋能复杂遥操” 路径的有效性。

前所未有的灵巧性

【亮点 1】全场景物体覆盖:从微小到超长,从简单到复杂,皆可精准驾驭

1. 首次攻克极端挑战下的持续旋转

DexNDM 突破了现有手内旋转技术的天花板,首次实现了在手掌朝下、侧向等极具挑战性的腕部姿态下,对长条状物体(如棍、笔)沿长轴的持续稳定旋转,以及对微小物体沿多轴的灵巧转动。这是以往工作中从未实现过的能力。



图 1:旋转小物体和长物体

2. 极广物体覆盖,完美驾驭复杂几何体



图 2:极广物体覆盖

DexNDM 在可操作物体的多样性方面取得了显著突破,实现了对从微小到细长、从简单到复杂几何体的全面覆盖,其广度远超以往任何工作(如图 2 所示)。

为了量化这一优势,我们将其与此前在复杂几何体旋转方面表现最佳的工作 Visual Dexterity 进行了直接比较。结果显示,即便 DexNDM 采用的是比 Visual Dexterity 所用的定制化 D’Claw 机械手更小、更通用的 Leap Hand,它在旋转相同物体时依然表现出相当甚至更优的性能。这证明了我们算法的卓越性,即用更通用的硬件实现了更强的能力。

更进一步,DexNDM 开创了一项前所未有的能力。我们首次展示了使用 Allegro、Leap Hand 这类通用型机械手,在手掌朝下等具有挑战性的腕部姿态下,稳定旋转多种表面凹凸不平的复杂几何体(如图 3 所示)。这一高难度场景下的操控能力是所有先前工作都未能企及的。



图 3:旋转复杂几何体

【亮点 2】全姿态精准操控:任意腕部姿态,多样旋转轴,皆可随心而动

除了在物体种类上的卓越通用性,DexNDM 的另一大特色在于其对腕部姿态和旋转轴向的强大适应性。无论机械手处于何种朝向,也无论任务要求物体沿哪个轴旋转,DexNDM 都能稳定、精确地完成指令,展现了其策略的高度灵活性和泛化能力(图 4)。



图 4:多样的手腕朝向

【亮点 3】高「灵巧性」、高鲁棒性灵巧手遥操系统,驾驭多种工具,胜任长程装配任务

我们将 DexNDM 强大的手内旋转能力作为一项 “原子技能”,构建了一套灵巧性远超传统方案的遥操作系统。在该系统中,操作者仅需通过手臂控制机械臂的位姿,并通过简单指令下达期望的物体旋转轴向,DexNDM 便能自适应地规划并执行精细的手指运动,从而稳定地旋转手中的物体。基于此,我们成功实现了多种复杂的工具使用任务,如使用螺丝刀拧螺丝,使用刀切香蕉,使用锤子锤钉子,使用笔写字等。

更进一步,DexNDM 策略的超强鲁棒性,使得遥操作系统能够胜任对稳定性要求极高的长程(Long-horizon)装配任务。例如,我们成功完成了为一张桌子安装全部四条桌腿的完整装配流程,整个过程流畅稳定,不会因策略失效或遭遇未见场景而中断。



图 5:高 「灵巧性」高鲁棒的灵巧手遥操作

技术突破

DexNDM 所实现的真实世界中强大的物体旋转能力得益于其在 sim-to-real 方法上的创新(图 6)。

具体而言,本文方法的核心是一种关节级动力学模型,它通过有效拟合少量真实世界采集的数据,并据此相应地调整仿真策略的动作,从而弥合仿真和现实之间的动力学偏差。该模型具有很高的数据效率,并能在不同的手 - 物交互分布间实现良好的泛化:它对手 - 物交互的动力学进行逐关节的分解,将系统级影响压缩为低维变量,并根据每个关节自身的动力学特性学习其演化过程,从而隐式地捕获这些耦合效应。

作者配套采用了一套全自动的数据采集策略,以最少的人为干预收集多样化的真实世界交互数据。DexNDM 所提出的逐关节动力学建模和全自动数据采集策略为真实世界中复杂的交互动力学建模提供了新的思路,并为真实世界中交互数据采集困难昂贵的问题提出了一个巧妙地行之有效的解法。

基于训练得到的真实世界中灵巧手逐关节动力学模型,作者在原 policy 的基础上训练了一个残差策略网络,旨在根据原策略网络的指令输出来输出一个修正项,从而弥补仿真和真实世界之间的动力学偏差。



图 6:方法概述

1. 关节级神经动力学模型

与较为直接的建模整手和物体的交互动力学不同,关节级神经动力学模型将复杂的交互动力学在每个关节进行分解,通过从单关节的历史信息中独立预测其自身的下一个时刻的状态,完成全手的状态转移预测。这样做的两个好处是增加了模型的数据利用效率并同时提高了模型对手 - 物交互数据分布变化的泛化能力。

作者通过理论分析和实验验证了关节级神经动力学模型的三个关键性质,即高表现力、高数据利用效率和强可泛化性。这样的泛化能力使得作者可以仅在和目标任务有所不同的数据上训练该动力学模型,并将其泛化到目标任务上来。这也使得本文廉价的全自动的数据采集方案成为了可能。

2. 自动化数据采集系统

基于四个宗旨,即 (i) 采集到的数据与策略网络的转移分布相关,(ii) 有物体的负载,(iii) 分布覆盖全面,(iv) 容易扩展,作者构建了一个自动化的数据采集系统,称为「混乱之盒」。

实现方法很简单:将机器人手放入一个装有软球的容器中。然后作者以开环方式重放来自仿真基础策略的动作,它提供了一个粗粒度的分布先验(i)。手与这些球的相互作用会施加丰富、随机化的载荷(ii-iii)。以 50% 的概率,作者为每个动作添加高斯噪声(σ=0.01),以扩大覆盖范围(iii)。整个过程完全自动化、对硬件安全,且无需人工复位(iv)。下图可以支持本文模型和数据设计的合理性:单个关节的输入 / 输出(I/O)历史能够覆盖与任务相关的分布,而整只手的历史则不能。



图 7:关节级动力学建模在有偏数据分布时的优势

3. 残差策略的训练



结语

DexNDM 在 Sim-to-Real 这一机器人学的核心难题上迈出了坚实而重要的一步。它解决了在灵巧操控中学习可靠真实世界动力学模型的难题,并从 0 到 1 实现了前所未有的灵巧操作技能 —— 这些技能对于传统遥操作方案而言几乎是无法想象的,这恰恰彰显了先进 Sim-to-Real 方法的魅力与无限潜力。

诚然,DexNDM 尚有其局限之处。作者相信,这只是一个开始,灵巧手作为人形机器人的皇冠,是注定的未来,也必定会大放异彩。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
够狠!阿联酋清空伊朗人居留权,5300亿资产说冻就冻

够狠!阿联酋清空伊朗人居留权,5300亿资产说冻就冻

老马拉车莫少装
2026-03-29 19:12:12
强雷雨+10级大风将袭,珠海:立即停止户外活动和作业

强雷雨+10级大风将袭,珠海:立即停止户外活动和作业

界面新闻
2026-03-30 09:24:18
单依纯演唱会一半歌曲都是翻唱!《李白》侵权,演唱会删除这首歌

单依纯演唱会一半歌曲都是翻唱!《李白》侵权,演唱会删除这首歌

观鱼听雨
2026-03-29 22:55:38
沙特油轮绕开霍尔木兹抵达日本:世界油阀,被一脚踹开了!

沙特油轮绕开霍尔木兹抵达日本:世界油阀,被一脚踹开了!

老马拉车莫少装
2026-03-29 11:19:25
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

削桐作琴
2026-02-25 18:15:14
吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

小徐讲八卦
2026-03-30 07:47:00
保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

历史点行
2026-03-29 13:38:28
康涅狄格73-72绝杀杜克!马林斯logo三分绝杀,凯登-布泽尔致命失误

康涅狄格73-72绝杀杜克!马林斯logo三分绝杀,凯登-布泽尔致命失误

懂球帝
2026-03-30 08:46:05
痞幼因网红身份,在别墅区被邻居集体“抵制”

痞幼因网红身份,在别墅区被邻居集体“抵制”

笑饮孤鸿非
2026-03-29 06:41:39
茶水是心梗“加速器”?医生:不想心脏出问题,这几种茶一定少喝

茶水是心梗“加速器”?医生:不想心脏出问题,这几种茶一定少喝

健康之光
2026-03-28 16:00:09
第三艘航母出动,数千名士兵抵达,美军大举增兵中东战场

第三艘航母出动,数千名士兵抵达,美军大举增兵中东战场

环球网资讯
2026-03-30 07:06:09
李荣浩预判封神,单依纯道歉果然甩锅团队!李荣浩再发四连问声讨

李荣浩预判封神,单依纯道歉果然甩锅团队!李荣浩再发四连问声讨

露珠聊影视
2026-03-29 17:57:06
谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

游民星空
2026-03-29 10:06:07
5亿遗产,67%归妻,16.5%留女!张雪峰留给世界的最后账本!

5亿遗产,67%归妻,16.5%留女!张雪峰留给世界的最后账本!

新浪财经
2026-03-27 10:53:31
我被贬成前台,董事长视察时当场愣住:谁把我女儿调这儿的?

我被贬成前台,董事长视察时当场愣住:谁把我女儿调这儿的?

晓艾故事汇
2026-03-28 09:15:04
比赖清德还狂的人出现了,如果她当选台湾领导人,解放军必定收台

比赖清德还狂的人出现了,如果她当选台湾领导人,解放军必定收台

芳芳历史烩
2026-03-29 21:09:31
恒大集团许家印坑的最惨的9位大佬

恒大集团许家印坑的最惨的9位大佬

地产微资讯
2026-03-29 19:08:15
宣布大涨价!全网多渠道售罄、缺货!网友:现在卖掉还赚钱了

宣布大涨价!全网多渠道售罄、缺货!网友:现在卖掉还赚钱了

半岛晨报
2026-03-29 21:35:03
何润东15年前谈项羽的采访火了,他的侃侃而谈,够小鲜肉学一辈子

何润东15年前谈项羽的采访火了,他的侃侃而谈,够小鲜肉学一辈子

大铁猫娱乐
2026-03-27 14:20:03
偷鸡不成蚀把米!想让李荣浩道歉赔钱却全网社死,吴向飞要遭殃了

偷鸡不成蚀把米!想让李荣浩道歉赔钱却全网社死,吴向飞要遭殃了

叨唠
2026-03-30 00:09:47
2026-03-30 11:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12628文章数 142599关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

伊朗警告:美以军政人员住所将成为合法打击目标

头条要闻

伊朗警告:美以军政人员住所将成为合法打击目标

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

艺术
亲子
手机
健康
教育

艺术要闻

600 年前的「产亡孤魂」,藏着中国女性最痛的记忆

亲子要闻

浙江医生提醒低龄宝宝过敏首选西替利嗪

手机要闻

为何厂商不再推出中高端LCD手机 背后三大现实原因:供应链、成本、策略

干细胞抗衰4大误区,90%的人都中招

教育要闻

五点建议,帮您志愿填报避坑!

无障碍浏览 进入关怀版