网易首页 > 网易号 > 正文 申请入驻

南大等8家单位,物理模拟器与世界模型驱动的机器人具身智能综述

0
分享至

本文作者来自:南京大学、香港大学、中南大学、地平线、中国科学院计算所、上海交通大学、慕尼黑工业大学、清华大学。

当下,随着机器人与人工智能技术的飞速进展,“具身智能”(Embodied Intelligence)已成为业界与学界共同关注的核心课题。与纯感知或生成任务不同,具身智能要求智能体在复杂环境中自主感知、预测并执行动作,才能真正迈向通用智能(AGI)。而要实现这一宏大目标,物理模拟器与世界模型的深度融合被认为是最具潜力的路径:前者通过高度可控的虚拟环境,为算法训练提供安全、高效的多场景试错土壤;后者则模拟了从感知到决策的 “脑内演算” 过程,使智能体能够在动作之前,先在内部进行环境预测与策略规划。

这篇由南京大学、香港大学等机构学者撰写的综述论文 ——A Survey: Learning Embodied Intelligence from Physical Simulators and World Models,使用 25 张图、6 张表格、超 400 篇参考系统地梳理了两大技术如何协同推动机器人从 “会做” 向 “会想” 演进的全貌。

  • 论文题目:A Survey: Learning Embodied Intelligence from Physical Simulators and World Models
  • 工作内容:基于物理模拟器与世界模型的具身智能学习
  • 论文链接:https://arxiv.org/abs/2507.00917
  • 仓库链接:https://github.com/NJU3DV-LoongGroup/Embodied-World-Models-Survey

论文摘要

对通用人工智能(AGI)的追求使具身智能成为机器人研究的前沿课题。具身智能关注的是能够在物理世界中感知、推理并行动的智能体。要实现鲁棒的具身智能,不仅需要先进的感知与控制能力,还需具备将抽象认知扎根于现实交互中的能力。

在这一过程中,两项基础技术 —— 物理模拟器与世界模型 —— 已成为关键推动力量。物理模拟器为训练与评估机器人智能体提供了可控、高保真度的环境,使复杂行为的开发变得安全而高效。相比之下,世界模型为机器人赋予了对环境的内部表示能力,从而使其能够进行预测性规划和超越直接感知的自适应决策。

本文系统回顾了近年来通过物理模拟器与世界模型融合学习具身智能的研究进展。我们分析了这两者在提升智能体自主性、适应性与泛化能力方面的互补作用,并探讨了外部模拟与内部建模之间的协同关系,如何推动从模拟训练走向真实部署的跨越。通过整合当前的研究成果与开放问题,本文旨在为构建更强大、更具泛化能力的具身智能系统提供全面的视角。我们还维护了一个持续更新的文献与开源项目仓库,地址为:https://github.com/NJU3DV-LoongGroup/Embodied-World-Models-Survey。

主要贡献:

  • 智能机器人能力分级标准: 提出一个涵盖自主性、任务处理能力、环境适应能力与社会认知能力四个关键维度的五级能力分级体系(IR-L0 至 IR-L4)。
  • 机器人学习技术分析: 系统回顾智能机器人在腿式运动(如双足行走、摔倒恢复)、操作控制(如灵巧操作、双手协调)与人机交互(如认知协作、社会嵌入)方面的最新技术进展。
  • 主流物理模拟器分析: 全面对比Webots、Gazebo、MuJoCo、Isaac Gym/Sim/Lab 等主流模拟器的物理仿真能力、渲染质量与传感器支持能力。
  • 世界模型的最新进展: 首先回顾世界模型的代表性架构及其潜在作用,例如作为可控模拟器、动态建模器与奖励模型在具身智能中的应用。进一步探讨专为自动驾驶与关节型机器人设计的最新世界模型方案。

研究内容与结构一览

1、智能机器人五级能力分级(IR-L0 ~ IR-L4)

  • IR-L0:基础执行 —— 完全依赖人类指令,无环境感知。
  • IR-L1:规则响应 —— 有限的传感器驱动,能在封闭环境下执行预设任务。
  • IR-L2:感知自适应 —— 引入视觉、LiDAR 等多模态,具备基本路径规划与避障能力。
  • IR-L3:类人协作 —— 多轮对话、情感识别,能在动态场景中与人类协同工作。
  • IR-L4:完全自主 —— 具备自我生成目标、长期学习与伦理决策能力 。

2、机器人核心技术回顾

  • 运动能力:从 Model Predictive Control、Whole-Body Control,到基于深度强化学习的端到端策略;
  • 操控能力:单臂抓取到双臂协作,乃至全身动作控制,辅以 VLM/LLM 驱动的视觉 — 语言 — 动作一体化模型;
  • 交互能力:认知协作、物理安全与社会嵌入三大维度的最新进展 。

3、物理模拟器横评

回顾主流模拟平台(Webots、Gazebo、MuJoCo、Isaac Gym/Sim)的物理引擎精度、渲染质量及传感器组件支持;

对比其在异构硬件与大规模并行训练中的表现差异,并指出未来优化方向。

4、世界模型架构与应用

代表性结构:从预测网络、生成式模型到多任务复合型 “动态+奖励” 模型;

应用场景:自动驾驶中的轨迹预测、关节机器人中的仿真 — 现实闭环校准。

智能机器人分级标准

仿真器仿真能力对比

仿真器渲染能力对比

自动驾驶领域的世界模型代表性工作汇总

机器人领域的世界模型代表性工作汇总

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
10亿换一命!京东副总裁蔡磊对抗渐冻症4年后,终于赢得一线生机

10亿换一命!京东副总裁蔡磊对抗渐冻症4年后,终于赢得一线生机

王二哥老搞笑
2026-02-01 10:38:03
热水袋是大补,医生提醒:一个热水袋胜过十个老中医!不要嫌老土

热水袋是大补,医生提醒:一个热水袋胜过十个老中医!不要嫌老土

岐黄传人孙大夫
2026-01-29 05:55:03
东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

乐枫电影
2026-02-01 14:36:35
台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

顾史
2026-01-21 21:04:39
我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

小月文史
2024-05-27 18:48:10
这就是杜月笙妻妾真实的样貌,并非演员扮演,货真价实的罕见照片

这就是杜月笙妻妾真实的样貌,并非演员扮演,货真价实的罕见照片

浩渺青史
2025-11-20 01:45:25
乌克兰大停电!英军驱逐俄罗斯货船,法国与欧盟19国有严重分歧

乌克兰大停电!英军驱逐俄罗斯货船,法国与欧盟19国有严重分歧

鹰眼Defence
2026-02-01 17:08:59
物业不让门口放鞋子或者鞋柜,看看“邻居家的新招”,干净整洁还美观!

物业不让门口放鞋子或者鞋柜,看看“邻居家的新招”,干净整洁还美观!

手工制作阿爱
2026-02-01 15:06:24
媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

侃球熊弟
2026-02-01 00:06:51
徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

狼叔评论
2026-02-01 18:46:02
56岁教授吃叶酸+维生素B12和B6,3年后复查,身体情况了?

56岁教授吃叶酸+维生素B12和B6,3年后复查,身体情况了?

岐黄传人孙大夫
2026-02-01 13:45:03
朱媛媛最后影像!杀青合影时强撑微笑,辛柏青全程陪护成最后守候

朱媛媛最后影像!杀青合影时强撑微笑,辛柏青全程陪护成最后守候

乐悠悠娱乐
2026-01-30 11:06:13
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

胡一舸南游y
2026-02-01 18:43:56
为什么毛主席总忘不了徐海东的恩情?有一件事比5000大洋更重要

为什么毛主席总忘不了徐海东的恩情?有一件事比5000大洋更重要

文史达观
2026-01-31 16:38:24
曼联英超唯一全勤铁人出人意料!新续命狂人,三要素让玻璃人变强

曼联英超唯一全勤铁人出人意料!新续命狂人,三要素让玻璃人变强

罗米的曼联博客
2026-02-01 09:45:55
经济压力有多大?个人每次挣钱低于1000元免交增值税,评论区扎心

经济压力有多大?个人每次挣钱低于1000元免交增值税,评论区扎心

你食不食油饼
2026-02-01 15:11:26
字母哥去哪里其实取决于两点:要钱还是要总冠军

字母哥去哪里其实取决于两点:要钱还是要总冠军

姜大叔侃球
2026-02-01 18:33:24
云南一中学,突然飞来一颗500吨巨石,稳稳立在院子中央,至今也无法知晓从何而来

云南一中学,突然飞来一颗500吨巨石,稳稳立在院子中央,至今也无法知晓从何而来

犀利强哥
2026-02-01 17:24:59
纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

谈史论天地
2026-01-28 17:20:03
28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

极目新闻
2026-02-01 13:10:29
2026-02-01 19:35:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12226文章数 142561关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

艺术
本地
亲子
教育
数码

艺术要闻

砸11亿!青岛山姆店终于要开了,山东人等太久!

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

我发现一个暖心真相:春节带娃出游,竟是闹中养静的好契机

教育要闻

洪家亮:让“身上有汗、眼里有光”成为孩子的成长常态

数码要闻

SSD涨价近3倍!8TB固态硬盘价格近2万 够装一台高端游戏PC了

无障碍浏览 进入关怀版