网易首页 > 网易号 > 正文 申请入驻

李飞飞押注的3D世界模型黑科技,被这篇论文一次性扒光!

0
分享至

前两天,李飞飞创业公司World Labs发布空间智能模型新成果,并推出可预览和创建3D世界的Marble平台。并发帖子表示她对3D世界生成的进展感到兴奋。


那么这背后都有哪些黑科技?今天分享一篇最新3D、4D世界模型技术最新全面系统性综述

  • 2D 视频生成卷到头了,但 真实物理世界天生是 3D+时间维度的

  • 自动驾驶、机器人、XR、数字孪生都需要 几何一致、可交互、长时序 的时空场景。

  • 缺乏统一术语 & 碎片化严重 :同样叫“world model”,有人指视频生成,有人指预测器,有人指闭环仿真器。


图 1:综述整体框架

  • 本综述首次系统梳理 3D/4D 原生表示 (RGB-D、Occupancy Grid、LiDAR Point Cloud)的世界模型,给出明确定义、分层分类法、数据集与评测指标,并开源持续维护。

分层分类法

3D/4D World Model = 在原生三维或四维表示上,生成(Generative)或预测(Predictive)几何合理、语义可控、时空一致的场景, 以支持感知-决策-仿真全链路任务。


图 2:三模态 × 四功能全景图(来源:论文 Figure 2) |

模态

代表表示

功能角色(4 类)

VideoGen

多视角视频流

① Data Engine ② Action Interpreter ③ Neural Simulator

OccGen

体素 Occupancy

① Scene Representor ② Occ Forecaster ③ Autoregressive Simulator

LiDARGen

点云序列

① Data Engine ② Action Forecaster ③ Autoregressive Simulator


各模态深度拆解 VideoGen——把视频生成做成“时空编剧” 典型方法时间线(2021-2025)

图 3:VideoGen 代表方法逐年汇总(来源:论文 Figure 3)

  • Data Engine :MagicDrive、DiVE、DreamForge 等用 BEV/HD-Map 做几何约束,生成多视角长视频,解决长尾数据稀缺。

  • Action Interpreter :GAIA-1/2、DriveWM、Vista 把“转向+速度”映射到未来帧,实现 动作-结果 可微分仿真。

  • Neural Simulator :DriveArena、DreamForge 在闭环里交替“生成-决策”,替代传统游戏引擎渲染管线。

VideoGen模型分类
关键挑战:长时序一致性(InfinityDrive)、多视角几何对齐(DiST-4D)、稀疏标注下的可控性(MaskGWM)。
OccGen——把世界变成“可交互的乐高”

图 5:OccGen 三功能分类(来源:论文 Figure 5) |

  • Scene Representor :SSD、SemCity 用扩散模型把稀疏 occupancy 补全为稠密语义体素,提升感知鲁棒性。

  • Occupancy Forecaster :OccWorld、OccSora、T3Former 以 ego-action 为条件,预测未来 3s 的 4D occupancy,误差 < 30 cm。

  • Autoregressive Simulator :DynamicCity、UniScene 支持“布局→时序体素→多传感数据”一条龙,实现 可编辑的大型开放世界

OccGen
关键挑战:细粒度动态物体(自行车、行人)补全、长时序误差累积、与下游规划器端到端联合训练。
LiDARGen——直接“点云编剧”

图 6:LiDARGen 三功能分类(来源:论文 Figure 6)

  • Data Engine :R2DM、LiDM、WeatherGen 用扩散/流匹配生成逼真点云,解决恶劣天气、稀有场景数据不足。

  • Action Forecaster :Copilot4D、ViDAR 把“历史点云 + 未来轨迹”映射到未来点云,实现 点云级别的动作推演

  • Autoregressive Simulator :LiDARCrafter、LidarDM 支持 4D 点云序列闭环生成 ,可直接喂给下游检测/规划网络做训练。

关键挑战:保持扫描线结构、处理点云稀疏性、跨模态与图像语义对齐。
统一评测体系——不再“各玩各的”

表 14:五类评测指标总表(来源:论文 Table 14) |

  1. Generation Quality :FID/FVD、FRD/FPD、Consistency、Controllability、Human Preference

  2. Forecasting Quality :IoU@1s/2s/3s、Chamfer Distance、Temporal Consistency

  3. Planning-Centric :Open-Loop L2/碰撞率、Closed-Loop PDMS/ADS

  4. Reconstruction Quality :PSNR/SSIM/LPIPS、Novel-View IoU

  5. Downstream :3D Det mAP、BEV 分割 mIoU、VQA Top-1

https://arxiv.org/pdf/2509.07996
3D and 4D World Modeling: A Survey
https://github.com/worldbench/survey

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

大鱼简科
2025-09-02 19:34:00
在美最擅长的领域打败美国,美媒:中国核航母正安装反应堆安全壳

在美最擅长的领域打败美国,美媒:中国核航母正安装反应堆安全壳

啸鹰评
2025-11-13 16:53:21
这下让印度说对了,福建舰电磁弹射存在设计问题,但依然全球最强

这下让印度说对了,福建舰电磁弹射存在设计问题,但依然全球最强

胖福的小木屋
2025-11-13 23:16:05
济南市全市暂停办理户口、居民身份证、居住证业务

济南市全市暂停办理户口、居民身份证、居住证业务

钢城零距离
2025-11-13 20:41:46
满分?38岁梅西新发型引热议,球迷:清闲小梅,梅开二度的节奏

满分?38岁梅西新发型引热议,球迷:清闲小梅,梅开二度的节奏

侧身凌空斩
2025-11-13 09:40:22
日本记者:必须驱逐薛剑,要在100多年前,我们就直接打过去了

日本记者:必须驱逐薛剑,要在100多年前,我们就直接打过去了

历史有些冷
2025-11-12 20:20:03
美股存储芯片股下跌,闪迪下跌7%

美股存储芯片股下跌,闪迪下跌7%

每日经济新闻
2025-11-13 22:50:16
福建舰正式服役后,美媒感叹中国武器突飞猛进,美情报界沉默了

福建舰正式服役后,美媒感叹中国武器突飞猛进,美情报界沉默了

通文知史
2025-11-12 21:10:03
北京退休老教授在家养病整整10年,民警破门后,直接愣在原地

北京退休老教授在家养病整整10年,民警破门后,直接愣在原地

罪案洞察者
2025-05-09 09:52:30
工信部指引动力电池发展路径:支持换电、V2G试点 固态电池成长期技术方向

工信部指引动力电池发展路径:支持换电、V2G试点 固态电池成长期技术方向

财联社
2025-11-13 15:24:04
你见过分了以后死缠烂打的,哭着求复合的!但你没见过鹿晗这样的

你见过分了以后死缠烂打的,哭着求复合的!但你没见过鹿晗这样的

乡野小珥
2025-11-12 08:52:22
陈伟霆妈妈到北京看孙子儿媳,何穗晒产后美照,哺乳期特征很明显

陈伟霆妈妈到北京看孙子儿媳,何穗晒产后美照,哺乳期特征很明显

阅识
2025-11-12 14:24:18
4-0!姆巴佩独造3球,9500万神锋建功,法国提前晋级世界杯

4-0!姆巴佩独造3球,9500万神锋建功,法国提前晋级世界杯

我的护球最独特
2025-11-14 05:48:12
特务头子谷正文晚年忏悔:吴石那份供词,我看了一辈子没看懂!

特务头子谷正文晚年忏悔:吴石那份供词,我看了一辈子没看懂!

老呶侃史
2025-11-02 07:02:14
悲催!姐姐清华硕士,工作一年去世,荣誉证书、学士服被爸藏起来

悲催!姐姐清华硕士,工作一年去世,荣誉证书、学士服被爸藏起来

火山诗话
2025-11-12 06:45:05
妇产科的八卦到底有多离谱?网友:上班就喜欢看这种帖子

妇产科的八卦到底有多离谱?网友:上班就喜欢看这种帖子

解读热点事件
2025-11-11 00:05:03
浙江瑞安“荒野求生”挑战赛被曝投喂选手、内定获奖者等问题 主办方回应|封面头条

浙江瑞安“荒野求生”挑战赛被曝投喂选手、内定获奖者等问题 主办方回应|封面头条

封面新闻
2025-11-13 20:21:13
漂亮女生不好养!43岁男子从月入5万沦为外卖小哥:钱被妻子花了

漂亮女生不好养!43岁男子从月入5万沦为外卖小哥:钱被妻子花了

诗意世界
2025-11-12 21:07:31
盘点:10位进入联盟时并未被大肆宣传的NBA球星

盘点:10位进入联盟时并未被大肆宣传的NBA球星

好火子
2025-11-14 05:29:32
欧盟中国商会发布问卷及访谈报告:八成中企认为欧盟当前营商环境不确定性上升

欧盟中国商会发布问卷及访谈报告:八成中企认为欧盟当前营商环境不确定性上升

环球网资讯
2025-11-14 06:45:34
2025-11-14 07:32:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5232文章数 64596关注度
往期回顾 全部

科技要闻

月产能突破百万片,中芯国际Q3净利增43.1%

头条要闻

外交部召见日本驻华大使:高市涉台言论极为危险

头条要闻

外交部召见日本驻华大使:高市涉台言论极为危险

体育要闻

跟豪门传了十年绯闻,他却偏要“择一队终老”

娱乐要闻

王鹤棣孟子义真要搭?

财经要闻

源峰25亿赌局!汉堡王中国"卖身"求生

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

本地
旅游
数码
公开课
军事航空

本地新闻

云游安徽 | 江声浩荡阅千年,文脉相承看芜湖

旅游要闻

爱琴海畔的文明曙光(旅人心语)

数码要闻

三星 Galaxy Book6 Pro 成绩又现,确认 X7 358H 搭载 B390 核显

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国在委内瑞拉海岸动用无人机和F-35

无障碍浏览 进入关怀版