网易首页 > 网易号 > 正文 申请入驻

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果

0
分享至

机器之心发布

机器之心编辑部

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。

  • 论文链接:https://arxiv.org/abs/2410.13571
  • 项目主页:https://drivedreamer4d.github.io/
  • 代码地址:https://github.com/GigaAI-research/DriveDreamer4D

闭环仿真技术是推动端到端自动驾驶系统发展的关键。目前的传感器仿真方法,如 NeRF 与 3DGS,主要依赖于训练数据分布,若训练数据不足,则这些方法在复杂驾驶操作(例如变道、加速或减速)的重建效果不佳。近来,自动驾驶世界模型(World Model)证明其可以生成丰富驾驶数据。在此背景下,本文提出了 DriveDreamer4D,是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。

DriveDreamer4D 可以为驾驶场景提供丰富多样的视角(包括变道、加速和减速等)数据,以增加动态驾驶场景下的闭环仿真能力。

DriveDreamer4D 利用世界模型作为数据引擎,基于真实世界的驾驶数据合成新轨迹视频(例如变道场景)。如下图所示,DriveDreamer4D 不仅可以提升多种重建算法(PVG,S3Gaussian,Deformable-GS)的图像渲染质量,还可以提升驾驶前景(车辆)和背景(车道线)的时空一致性。

DriveDreamer4D 的总体结构框图如下所示,轨迹生成模块(NTGM)用于调整原始轨迹动作,如转向角度和速度,以生成新的轨迹。这些新轨迹为提取结构化信息(如车辆 3D 框和背景车道线细节)提供了全新的视角。随后,基于世界模型的视频生成能力,并利用更新轨迹后得到的结构化信息作为控制条件,可以合成新轨迹的视频。最后,原始轨迹视频与新轨迹视频相结合,进行 4DGS 模型的优化。

在实验中,多种传统算法(PVG, S3Gaussian,Deformable-GS )在变道场景下的车道线、天空、车辆都会模糊,甚至出现 “鬼影” 现象。而 DriveDreamer4D 可以提升多种重建算法在复杂变道场景下的视频渲染效果,不仅消除了 “鬼影”,而且提升了交通元素的渲染质量,车辆和车道线都更加清晰。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

除了变道,在车辆变速场景下,传统算法(PVG,S3Gaussian,Deformable-GS)的表现能力也受到限制,如下第一列视频所示,这些算法在自车加速时,前方的车辆都出现了 “拖影” 现象。而经过 DriveDreamer4D 提升后,渲染的车辆的时空一致性更高。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

在定量实验中,本文证明了 DriveDreamer4D 不仅可以提升多种重建算法 (PVG, S3Gaussian,Deformable-GS)的图像渲染质量 (如表 2),还可以提升车辆和车道线渲染的时空一致性(如表 1)。此外,本文还通过 user study(表 3)证明用户更加偏好 DriveDreamer4D 的渲染效果,获得了超过 80% 的投票率。

表 1 DriveDreamer4D 提升了车辆和车道线重建渲染的时空一致性

表 2 DriveDreamer4D 提升了图像重建渲染质量

表 3 User study 证明用户更加偏好 DriveDreamer4D 的渲染效果

本项 DriveDreamer4D 工作是极佳科技研究团队之前 DriveDreamer 和 DriveDreamer-2 工作的延续。

DriveDreamer 是首个面向真实驾驶场景的世界模型,可以根据不同的控制条件生成自动驾驶周视视频,有效提升了 BEV 感知的性能;DriveDreamer-2 在此基础上,引入大语言模型,可以生成用户自定义的驾驶数据,进一步提升了长尾和 corner case 场景下的数据生成能力。针对端到端自动驾驶和闭环仿真对于场景重建的迫切需求,DriveDreamer4D 利用 DriveDreamer 系列工作的能力,用以生成新轨迹视频(例如变道、加减速),从而大幅提升了多种 4DGS 算法的重建效果。

本篇论文的牵头完成单位为极佳科技,是一家空间智能公司,致力于将视频生成提升到 4D 世界模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生成和认知推理能力,都有巨大的价值和作用。极佳科技是国内最早开始探索和布局世界模型和空间智能方向的公司,在物理空间和虚拟空间两方面都已取得显著的技术和商业进展,获得了行业广泛的认可。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
平顶山再通报“夫妻殴打15岁女生”:如此嚣张,离不开这三个原因

平顶山再通报“夫妻殴打15岁女生”:如此嚣张,离不开这三个原因

英军眼
2026-02-25 10:53:41
美媒灵光一闪:“尼米兹”号退役太可惜,不如改成10万吨无人母舰

美媒灵光一闪:“尼米兹”号退役太可惜,不如改成10万吨无人母舰

晨枫老苑
2026-02-24 11:23:06
热播短剧被指出现男演员揩油女演员镜头,目前争议镜头已删除,剧方尚未回应

热播短剧被指出现男演员揩油女演员镜头,目前争议镜头已删除,剧方尚未回应

潇湘晨报
2026-02-25 17:55:25
气质软绵绵别演大侠,《镖人》谢霆锋吴京告诉你啥才叫尊重观众!

气质软绵绵别演大侠,《镖人》谢霆锋吴京告诉你啥才叫尊重观众!

娱乐圈笔娱君
2026-02-24 18:16:13
看CPTPP契约精神与WTO诚信原则解读东西社会文化的差异

看CPTPP契约精神与WTO诚信原则解读东西社会文化的差异

诗意世界
2026-01-05 07:00:03
我国战斗机刚摒弃的“腹鳍”,美国却在六代机F-47上又捡起来了

我国战斗机刚摒弃的“腹鳍”,美国却在六代机F-47上又捡起来了

科普大世界
2026-02-26 09:39:13
新加坡这比赛,简直成了王曼昱的个人秀,

新加坡这比赛,简直成了王曼昱的个人秀,

小光侃娱乐
2026-02-26 06:50:06
冯小刚养女徐朵:在北京住500平豪宅,一双拖鞋999,还给徐帆甩脸

冯小刚养女徐朵:在北京住500平豪宅,一双拖鞋999,还给徐帆甩脸

银河史记
2026-02-25 23:45:03
刘强东称已接到5条大型游艇订单,每艘平均卖6000万欧元

刘强东称已接到5条大型游艇订单,每艘平均卖6000万欧元

第一财经资讯
2026-02-25 18:38:04
欧冠附加赛皇马2-1险胜本菲卡,赛后不得不承认的三大事实!

欧冠附加赛皇马2-1险胜本菲卡,赛后不得不承认的三大事实!

田先生篮球
2026-02-26 09:43:43
党主席干不过地头蛇,郑丽文干不过“南霸天”

党主席干不过地头蛇,郑丽文干不过“南霸天”

雪中风车
2026-02-25 20:54:12
手里有钱的,偷着乐吧!2026年,存款才是真正的“香饽饽”!

手里有钱的,偷着乐吧!2026年,存款才是真正的“香饽饽”!

奇思妙想生活家
2026-02-25 19:15:57
湖南“杀猪盘同学会”曝光,整个事件的真相让人不寒而栗

湖南“杀猪盘同学会”曝光,整个事件的真相让人不寒而栗

趣味萌宠的日常
2026-02-25 05:03:22
紫牛头条 | 全家出游老人服务区内被狗扑咬骨折,犬主付千元后驾车离开,警方已立案

紫牛头条 | 全家出游老人服务区内被狗扑咬骨折,犬主付千元后驾车离开,警方已立案

扬子晚报
2026-02-24 23:56:16
趴在中国仁爱礁9000多天的菲律宾军舰,如今已经再也拖不走了

趴在中国仁爱礁9000多天的菲律宾军舰,如今已经再也拖不走了

小小科普员
2025-11-21 20:23:24
《镖人》逆跌,4人零差评,4人升咖,2人翻红,只有他被骂惨!

《镖人》逆跌,4人零差评,4人升咖,2人翻红,只有他被骂惨!

白日追梦人
2026-02-24 04:04:34
为什么欧洲人喜欢种大麦,而中国人喜欢种小麦?有啥科学解释?

为什么欧洲人喜欢种大麦,而中国人喜欢种小麦?有啥科学解释?

向航说
2026-02-25 00:55:03
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

极客公园
2026-02-24 12:13:10
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
2026-02-26 10:59:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12362文章数 142569关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

雷克萨斯ES双色特别版上市 售30.79万元起

态度原创

健康
艺术
家居
手机
公开课

转头就晕的耳石症,能开车上班吗?

艺术要闻

谁能认出这幅14字草书的真正作者?

家居要闻

归隐于都市 慢享自由

手机要闻

想买抓紧!2026年中国手机市场迎全面普涨:3月后新机至少涨千元 老款机也提价

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版