网易首页 > 网易号 > 正文 申请入驻

RSS 2025|物理驱动的世界模型PIN-WM:直接从视觉观测估计物理属性

0
分享至


第一作者李文轩目前就读于国防科技大学计算机学院,硕士二年级,导师为徐凯教授,研究方向包括世界模型、可微物理仿真等。共同第一作者赵航,现为武汉大学计算机学院博士后,博士期间导师为徐凯教授,研究方向为工业具身智能。本文通信作者为深圳大学胡瑞珍教授与国防科技大学徐凯教授。

在机器人操作中,物体运动往往涉及摩擦、碰撞等复杂物理机制。准确的物理属性描述可以实现对物体运动结果更准确的预测,并提升机器人在操作技能学习中的表现。

然而,一般用于训练机器人操作策略的仿真交互环境,其物理属性与真实环境往往存在明显差异且难以校准,机器人控制策略的虚拟到现实迁移(Sim2Real)一直是困扰社区的问题。

为解决上述问题,国防科大、深圳大学、武汉大学团队提出 PIN-WM(Physics-INformed World Models)——一种物理驱动的世界模型。

  • 论文标题:PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation
  • 论文地址:https://arxiv.org/abs/2504.16693
  • 项目主页:https://pinwm.github.io

基于可微物理和可微渲染,PIN-WM 以真实世界运动结果为监督信号,可以从视觉观测中直接辨识刚体物理属性。由于可微物理提供了物理系统的动力学基础描述和有效的梯度引导,PIN-WM仅需少量且任务无关的交互轨迹进行学习,随后可以基于未见「状态-动作对」实现对下一时刻状态的良好泛化估计。

进一步,团队提出物理感知的数字表亲 PADC(Physics-Aware Digital Cousins),在辨识参数附近局部扰动,生成具有近似且多样视觉和物理特性的世界模型变体,以建模未被观测的潜在偏差,进一步提高策略学习的鲁棒性。

基于 PIN-WM 和 PADC,团队在世界模型中训练非抓取式操作技能,无需策略微调即可直接实现操作技能的 Sim2Real 迁移。

论文创新点

  • 一种物理驱动的世界模型:使用可微仿真和可微渲染技术从视觉观测中直接辨识刚体的物理参数。
  • 一种物理感知的数字表亲:在辨识参数附近进行小范围扰动,生成多组具有近似且多样视觉和物理特性的世界模型变体,以应对未建模误差,提升策略在真实环境中的鲁棒性。

图 1:PIN-WM 仅需少量任务无关交互轨迹辨识物理属性,以支持机器人操作技能学习与 Sim2Real 迁移

技术路线

该团队提出一种从现实到虚拟再到现实的框架,以学习非抓取操作相关的技能策略。该框架可分为两大阶段:系统辨识和策略训练。

  • 从现实到仿真(Real2Sim):系统辨识
  • 渲染属性估计:收集物体的多视角图片,并计算 Rendering loss,然后使用 2DGS 对其渲染参数进行优化。
  • 物理属性估计:收集机器人与物体的交互视频,同样基于 Rendering loss,使用 2DGS 和可微 LCP 传播梯度,从而对物理参数进行优化(此时固定渲染参数)。
  • 从仿真到现实(Sim2Real):策略训练与部署
  • 结合数字表亲学习策略:在辨识参数附近进行小范围扰动,生成多组具有视觉和物理特性差异的世界模型变体,并在此基础上训练策略。
  • 策略部署:将世界模型中学习到的策略部署到真实场景中,完成虚拟到现实迁移。

图 2:Real2Sim2Real 框架用于学习非抓取操作策略

实验结果

「推」(Push)和「翻转」(Flip)作为经典的非抓取式任务,对摩擦、碰撞等复杂物理机制非常敏感。PIN-WM 在这两项代表性任务上进行实验评估:「推」指通过推的方式将平面上的物体移动到目标姿态,「翻转」指通过戳的方式将物体翻转(图 3)。通过统计各方法在两项任务中的成功率及完成步数,对其性能进行对比评估。

图 3:仿真场景中「推」和「翻转」任务轨迹

在仿真实验方面,PIN-WM 分别与数据驱动的方法、预设物理参数的方法和辨识物理参数的方法进行对比。团队在更具挑战性的低摩擦场景下学习世界模型以及机器人操作策略,物理参数估计误差造成的机器人操作失准会在低摩擦的场景下被进一步放大,导致任务失败。

实验结果说明:数据驱动方法(Dreamer,Diffusion Policy)在已使用更多交互数据的情况下泛化能力依然不足,策略测试性能欠佳;预设物理参数方法(RoboGSim、Domain Randomization)底层动力学与真实物理有明显差异,而其他辨识物理参数的方法依赖简化的物理模型(2D Physics)或者缺少梯度引导(ASID),动力学的拟合效果相对较差,失准的动力学建模导致策略表现依然欠佳;在可微物理梯度引导下,PIN-WM 能够实现更准确的物理参数辨识,在「推」和「翻转」两项非抓取式操作任务上的策略表现均明显优于其他方法(表 1)。

表 1:仿真场景中的非抓取策略性能对比

在真机实验方面,PIN-WM 同样与上述主要基线对比,在真实场景「推」和「翻转」两项任务上的性能优势得到验证(表 2)。

表 2:真实场景中的非抓取策略性能对比

图 4 展示了真实场景中不同方法执行「推」任务时的轨迹对比图。

图 4:真实场景中不同方法执行「推」任务时的轨迹对比

图 5 展示了真实场景中不同方法执行「翻转」任务时的轨迹对比图。

图 5:真实场景中不同方法执行「翻转」任务时的轨迹对比

PIN-WM 执行系统辨识后,在光滑玻璃平面上「推」T 形物体的测试结果,机器人可以准确地将物体推入目标位置。

未执行系统辨识时,策略在光滑玻璃平面上「推」T 形物体,机器人在目标位置反复尝试,始终无法将物体正确推入目标位置。

PIN-WM 执行系统辨识后,在光滑玻璃平面上「推」正方体的测试结果。正方体的质量和体积更小,机器人操作更加困难,而 PIN-WM 训练出的策略能够准确完成任务。

未执行系统辨识时,策略在光滑玻璃平面上「推」正方体,无法将正方体正确推入目标位置。

PIN-WM 执行系统辨识后,在粗糙平面上「戳」正方体使其翻转。

未执行系统辨识时,在粗糙平面上「戳」正方体,正方体轻微抬升,却始终无法有效翻转。

PIN-WM 执行系统辨识后,在粗糙平面上「推」任务的测试结果(轨迹 1)。

PIN-WM 执行系统辨识后,在粗糙平面上「推」任务的测试结果(轨迹 2)。

在更大尺寸物体上验证 PIN-WM 的有效性,执行系统辨识后,在粗糙平面上「推」T 形物体的测试结果(轨迹 1)。

PIN-WM 执行系统辨识后,在粗糙平面上「推」更大尺寸 T 形物体的测试结果(轨迹 2)。

总结

国防科大、深圳大学、武汉大学团队提出了一种物理驱动的世界模型 PIN-WM(Physics-INformed World Models),可以从视觉观测(少量且任务无关的交互轨迹)中辨识刚体的物理属性。

同时,团队提出具备物理感知的数字表亲 PADC(Physics-Aware Digital Cousins),在辨识参数附近进行局部扰动以建模潜在的偏差,从而进一步提高虚拟到现实的迁移性能。团队通过广泛的实验证明了 PIN-WM 的有效性,其提出的方法有效提升了非抓握式操作技能从仿真到现实迁移的性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄天鹅就鸡蛋角黄素抽检结果发布声明

黄天鹅就鸡蛋角黄素抽检结果发布声明

澎湃新闻
2026-03-25 15:39:05
9020mAh!新机官宣:3月26日,正式发布上市!

9020mAh!新机官宣:3月26日,正式发布上市!

科技堡垒
2026-03-26 11:29:06
历史唯一!9场比赛,仅差51次助攻啊,约基奇又又要创造历史

历史唯一!9场比赛,仅差51次助攻啊,约基奇又又要创造历史

球童无忌
2026-03-25 16:56:03
一夜之间,这两个城市房价上涨了!

一夜之间,这两个城市房价上涨了!

靓仔情感
2026-03-26 13:57:14
举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

懂球帝
2026-03-26 10:15:02
毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

诺言卿史录
2026-03-26 09:06:41
伊朗开始收“买路钱”了:想过霍尔木兹海峡?拿200万美元来

伊朗开始收“买路钱”了:想过霍尔木兹海峡?拿200万美元来

Ck的蜜糖
2026-03-26 16:57:49
湖南省委书记到凤凰,乘坐世界首条磁浮旅游专线

湖南省委书记到凤凰,乘坐世界首条磁浮旅游专线

观察者网
2026-03-25 21:33:09
广东球迷高喊:流氓教练杜锋下课!杜锋回应:感谢现场观众 非常热情

广东球迷高喊:流氓教练杜锋下课!杜锋回应:感谢现场观众 非常热情

晚雾空青
2026-03-26 16:09:03
悲催!丈夫月收入从2万到四五千,从程序员到送快递,女子想离婚

悲催!丈夫月收入从2万到四五千,从程序员到送快递,女子想离婚

火山詩话
2026-03-15 10:23:17
研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

观察鉴娱
2026-03-26 09:25:28
邓超孙俪正式解绑:16年婚姻,各自安好

邓超孙俪正式解绑:16年婚姻,各自安好

二胡的岁月如歌
2026-03-26 14:50:14
正式翻脸:沙特与阿联酋开放军事基地,放任美军暴打伊朗

正式翻脸:沙特与阿联酋开放军事基地,放任美军暴打伊朗

雅儿姐在遛弯
2026-03-26 08:24:39
大瓜!张雪峰女儿只能分得16.5%遗产

大瓜!张雪峰女儿只能分得16.5%遗产

兰亭墨未干
2026-03-26 14:52:45
490亿元的大项目即将开建!!

490亿元的大项目即将开建!!

新浪财经
2026-03-26 11:14:48
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

刘蕳爱下厨
2026-03-25 15:08:52
美以联合空袭伊拉克

美以联合空袭伊拉克

第一财经资讯
2026-03-26 12:56:50
快讯!美国要打大仗了!

快讯!美国要打大仗了!

达文西看世界
2026-03-26 09:29:08
战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

子桑说
2026-03-25 17:27:05
2026-03-26 17:28:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12606文章数 142593关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
本地
时尚
旅游
公开课

亲子要闻

妈妈是时尚小达人爸爸是朴素老模范!我要当爸爸的专属赞助人

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

皮衣+裙,高级到炸

旅游要闻

德阳绵竹:赏花、览文旅精品......沿山旅游“火”起来

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版