网易首页 > 网易号 > 正文 申请入驻

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果

0
分享至

机器之心发布

机器之心编辑部

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。

  • 论文链接:https://arxiv.org/abs/2410.13571
  • 项目主页:https://drivedreamer4d.github.io/
  • 代码地址:https://github.com/GigaAI-research/DriveDreamer4D

闭环仿真技术是推动端到端自动驾驶系统发展的关键。目前的传感器仿真方法,如 NeRF 与 3DGS,主要依赖于训练数据分布,若训练数据不足,则这些方法在复杂驾驶操作(例如变道、加速或减速)的重建效果不佳。近来,自动驾驶世界模型(World Model)证明其可以生成丰富驾驶数据。在此背景下,本文提出了 DriveDreamer4D,是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。

DriveDreamer4D 可以为驾驶场景提供丰富多样的视角(包括变道、加速和减速等)数据,以增加动态驾驶场景下的闭环仿真能力。

DriveDreamer4D 利用世界模型作为数据引擎,基于真实世界的驾驶数据合成新轨迹视频(例如变道场景)。如下图所示,DriveDreamer4D 不仅可以提升多种重建算法(PVG,S3Gaussian,Deformable-GS)的图像渲染质量,还可以提升驾驶前景(车辆)和背景(车道线)的时空一致性。

DriveDreamer4D 的总体结构框图如下所示,轨迹生成模块(NTGM)用于调整原始轨迹动作,如转向角度和速度,以生成新的轨迹。这些新轨迹为提取结构化信息(如车辆 3D 框和背景车道线细节)提供了全新的视角。随后,基于世界模型的视频生成能力,并利用更新轨迹后得到的结构化信息作为控制条件,可以合成新轨迹的视频。最后,原始轨迹视频与新轨迹视频相结合,进行 4DGS 模型的优化。

在实验中,多种传统算法(PVG, S3Gaussian,Deformable-GS )在变道场景下的车道线、天空、车辆都会模糊,甚至出现 “鬼影” 现象。而 DriveDreamer4D 可以提升多种重建算法在复杂变道场景下的视频渲染效果,不仅消除了 “鬼影”,而且提升了交通元素的渲染质量,车辆和车道线都更加清晰。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

除了变道,在车辆变速场景下,传统算法(PVG,S3Gaussian,Deformable-GS)的表现能力也受到限制,如下第一列视频所示,这些算法在自车加速时,前方的车辆都出现了 “拖影” 现象。而经过 DriveDreamer4D 提升后,渲染的车辆的时空一致性更高。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

在定量实验中,本文证明了 DriveDreamer4D 不仅可以提升多种重建算法 (PVG, S3Gaussian,Deformable-GS)的图像渲染质量 (如表 2),还可以提升车辆和车道线渲染的时空一致性(如表 1)。此外,本文还通过 user study(表 3)证明用户更加偏好 DriveDreamer4D 的渲染效果,获得了超过 80% 的投票率。

表 1 DriveDreamer4D 提升了车辆和车道线重建渲染的时空一致性

表 2 DriveDreamer4D 提升了图像重建渲染质量

表 3 User study 证明用户更加偏好 DriveDreamer4D 的渲染效果

本项 DriveDreamer4D 工作是极佳科技研究团队之前 DriveDreamer 和 DriveDreamer-2 工作的延续。

DriveDreamer 是首个面向真实驾驶场景的世界模型,可以根据不同的控制条件生成自动驾驶周视视频,有效提升了 BEV 感知的性能;DriveDreamer-2 在此基础上,引入大语言模型,可以生成用户自定义的驾驶数据,进一步提升了长尾和 corner case 场景下的数据生成能力。针对端到端自动驾驶和闭环仿真对于场景重建的迫切需求,DriveDreamer4D 利用 DriveDreamer 系列工作的能力,用以生成新轨迹视频(例如变道、加减速),从而大幅提升了多种 4DGS 算法的重建效果。

本篇论文的牵头完成单位为极佳科技,是一家空间智能公司,致力于将视频生成提升到 4D 世界模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生成和认知推理能力,都有巨大的价值和作用。极佳科技是国内最早开始探索和布局世界模型和空间智能方向的公司,在物理空间和虚拟空间两方面都已取得显著的技术和商业进展,获得了行业广泛的认可。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
以色列对乌克兰举动表示“遗憾”

以色列对乌克兰举动表示“遗憾”

环球时报国际
2026-05-26 21:44:34
47.98 万元起!新一代问界 M9 上市,余承东:地球上最强的 SUV

47.98 万元起!新一代问界 M9 上市,余承东:地球上最强的 SUV

爱范儿
2026-05-28 00:25:31
896线激光雷达+三腔空气悬架,新车上市,29.29万起!

896线激光雷达+三腔空气悬架,新车上市,29.29万起!

科技堡垒
2026-05-26 10:53:48
户籍制度改革,可能真的要来了

户籍制度改革,可能真的要来了

黑噪音
2026-05-27 22:26:33
罗生门!怀特塞德是否涉兴奋剂问题?上海不吭声,名记给出新说法

罗生门!怀特塞德是否涉兴奋剂问题?上海不吭声,名记给出新说法

萌兰聊个球
2026-05-27 20:35:27
打脸经济学家!300万以下的老破小突然卖疯了,这是什么骚操作?

打脸经济学家!300万以下的老破小突然卖疯了,这是什么骚操作?

菁菁子衿
2026-05-26 21:27:30
离谱!切尔西 1 亿强挖利物浦头号水货!阿隆索要毁了蓝军

离谱!切尔西 1 亿强挖利物浦头号水货!阿隆索要毁了蓝军

澜归序
2026-05-28 05:54:54
橄榄球巨星吐槽:和霉霉恋爱,最受不了的是这个

橄榄球巨星吐槽:和霉霉恋爱,最受不了的是这个

浅遇时光
2026-05-27 00:15:24
福建三钢招标被指人为操控:弄虚作假企业中标10亿工程

福建三钢招标被指人为操控:弄虚作假企业中标10亿工程

真相解密
2026-05-26 18:27:52
苹果向用户推送iOS26.6,电池续航巨好,信号很完美

苹果向用户推送iOS26.6,电池续航巨好,信号很完美

库克啥都聊
2026-05-27 16:27:07
小里弗斯带家人度假,带伤复出,亿元合同稳了,老婆是美丽校花

小里弗斯带家人度假,带伤复出,亿元合同稳了,老婆是美丽校花

大西体育
2026-05-27 23:43:57
中储粮集团西安分公司党委书记、总经理戴中文被查

中储粮集团西安分公司党委书记、总经理戴中文被查

新京报
2026-05-27 10:23:40
这腿真是太美,太绝了!

这腿真是太美,太绝了!

疾跑的小蜗牛
2026-05-27 22:52:29
从年赚358亿到巨亏234亿,美团为啥沦落至此,难怪国家禁外卖大战

从年赚358亿到巨亏234亿,美团为啥沦落至此,难怪国家禁外卖大战

阿丰聊娱
2026-04-03 14:51:31
被央媒怒批,目不识丁,洋相百出,这 5 位 “绝望的文盲” 凭啥

被央媒怒批,目不识丁,洋相百出,这 5 位 “绝望的文盲” 凭啥

介知
2026-05-28 03:27:46
马办家变再曝猛料:张若彤手握关键录音 廖继斌更揭马英九真实目

马办家变再曝猛料:张若彤手握关键录音 廖继斌更揭马英九真实目

闻识
2026-05-27 19:37:27
蔚来ES9正式上市:49.8万元起,租电购买39万元起,姚明现身发布会

蔚来ES9正式上市:49.8万元起,租电购买39万元起,姚明现身发布会

新浪财经
2026-05-27 22:01:00
被馆长追问野心!张雪:争取这周末昙花七现 钱够的话拿遍世界上所有冠军

被馆长追问野心!张雪:争取这周末昙花七现 钱够的话拿遍世界上所有冠军

快科技
2026-05-27 08:41:10
划清界限?李显龙访华后公开表态:中国和新加坡不是“共同族群”

划清界限?李显龙访华后公开表态:中国和新加坡不是“共同族群”

麓谷隐士
2026-05-28 00:11:21
官媒专访这次,张帅只字不提郑钦文,却用1句话给郑钦文提了个醒

官媒专访这次,张帅只字不提郑钦文,却用1句话给郑钦文提了个醒

以茶带书
2026-05-27 12:04:27
2026-05-28 07:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13097文章数 142653关注度
往期回顾 全部

科技要闻

Meta首推AI付费服务 股价应声涨超3.7%

头条要闻

媒体:日本情报体系迎来根本性重构 威胁的不止东亚

头条要闻

媒体:日本情报体系迎来根本性重构 威胁的不止东亚

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

时尚
手机
数码
教育
房产

这几件单品太火了,今年流行的风格都离不开它

手机要闻

苹果iPhone Fold折叠屏手机首批第三方保护壳亮相

数码要闻

别盲目跟风!今年618买笔记本,认准这6款就够了

教育要闻

数轴动点第1讲,一个视频学会!

房产要闻

合生创展前总裁被查!直指房企违规放贷、利益输送等问题

无障碍浏览 进入关怀版