网易首页 > 网易号 > 正文 申请入驻

清华赵昊最新力作:0.4 秒完成4D高斯重建,自驾仿真新SOTA丨GAIR 2025

0
分享至

雷峰网讯 从工厂、矿区的封闭路段到更加开放的世界,自动驾驶技术面临着来自真实交通环境的多重挑战。变道超车的车辆、突然打开的车门、横穿马路的行人……当自动驾驶系统学着给这些动态对象进行4D建模、重建和再仿真时,大多数解决方案仍然依赖于每场景优化、已知的相机校准或短帧窗口,这使得它们变得缓慢且不实用。

能否快速、低成本获得动态驾驶场景下的仿真数据,决定了自动驾驶系统在开放世界中的进化速度。在这一背景下,长期深耕神经渲染与仿真技术的赵昊老师团队,提出了首个面向大型动态驾驶场景的无姿态(pose-free) 前馈三维重建框架——DGGT(Driving Gaussian Grounded Transformer)。

赵昊现任清华大学智能产业研究院(AIR)助理教授,智源学者(BAAI Scholar)。他的研究聚焦计算机视觉领域,在三维场景理解、生成式仿真与神经渲染等方向深耕多年,研究成果对于自动驾驶及具身智能仿真具有重要意义。

值得关注的是,赵昊老师将以组委会主席的身份,出席2025年GAIR全球人工智能与机器人大会,并主持世界模型分论坛,分享他在世界模型方面的最新探索。

GAIR大会聚焦人工智能的核心技术、前沿趋势与产业落地,长期吸引来自全球的技术领袖和科研人士。本届大会将于2025年12月12-13日在深圳·博林天瑞喜来登酒店举行,与产业界和学术界的嘉宾共同研讨人工智能的下一步发展。


论文地址:https://arxiv.org/abs/2512.03004

01自动驾驶仿真新 SOTA

DGGT最大的突破,是摆脱了传统方案对逐场景优化、相机标定以及短帧窗口的依赖。通过多头联合预测结构,DGGT只需稀疏、无标定图像,单次前向即可同时输出相机位姿、深度、动态实例与场景表示,重建长序列三维场景。

且该场景表示可直接在Gaussian层面进行编辑,如移除或移动车辆,插入其他场景的新汽车或骑行者等实例。DGGT的高度可编辑性支持扩散精修自动补洞,输出可用于仿真与数据合成。

实验结果表明,DGGT在Waymo上达到了 27.41 PSNR,每场景推断 0.39 秒(3 个视角,20 帧),超过了作为优化基线的EmerNeRF、DeformableGS方案和前馈方法,同时保持了速度竞争力。换言之,DGGT比优化类方案更迅速,比前馈方案更保真。

同样令人惊喜的还有泛化性。DGGT将相机位姿从输入转为模型输出,通过端到端预测内外参并融入场景表示的方法,打破了跨数据集部署的校准壁垒。DGGT模型在 Waymo 上训练,却能在 nuScenes 与 Argoverse2 上实现强劲的零样本泛化,在关键感知指标上相比STORM提升超过50%。如在nuScenes上LPIPS从0.394降至0.152(下降 61.4%),在 Argoverse2上从0.326降至0.155(下降52.5%)。

值得注意的是,研究团队在nuScenes 和 Argoverse2 数据集上分别进行了零样本和从头训练两种设置的实验评估。在这两种情况下,DGGT均表现出了SOTA级性能。

此外,系统通过lifespan head建模场景随时间的外观演变,并配合单步扩散精修,可有效抑制运动插值伪影,提升时空一致性与渲染自然度。在保证仿真质量的前提下,DGGT为自动驾驶仿真推开了一扇迈向高速、可扩展新阶段的大门。

02一次前向,完整 4D 场景

DGGT的核心设计理念,是一次性预测完整的4D场景状态,同时清晰地将静态背景与动态实体分离,并保持时间上的连贯性。

具体来说,研究团队将相机位姿从输入转为模型输出,每帧生成像素对齐的高斯映射,并添加一个寿命参数,随时间调制可见性以捕捉变化的外观,随后使用动态头生成密集动态映射,使用运动头估计三维运动,用于稀疏时间戳间插值,同时插入单步扩散细化,抑制重影/遮蔽伪影并恢复细节。

这产生了单遍、无姿态的算法,能够从未摆拍图像重建动态驱动场景,自然支持高斯层级的实例级编辑。

在系统结构上,DGGT 采用 ViT 编码器融合 DINO 先验,通过交替注意力得到共享特征,再由多个预测头并行输出:

相机头估计每一帧内外参数;

Gaussian 头给出逐像素颜色/位置/旋转/尺度/不透明度参数;

lifespan 头控制时间可见度;

动态头输出运动遮罩;

运动头显式估计动态物体的三维位移;

天空头稳定建模远景背景。

03动态驾驶场景仿真新路径

长期以来,高精度标定设备和固定路线采集方案,一直限制着动态驾驶场景训练数据的成本和采集效率,DGGT则提出了一种规避上述限制的全新方案。

将相机位姿转为模型输出的设计使DGGT具有了在真实、开放世界中的高度灵活性,同时其多头联合预测结构支持任意数量的输入视图和长序列处理,克服了现有前馈方法在时序扩展性上的瓶颈,为处理大规模自动驾驶日志提供了可行路径。

更可贵的是,DGGT能在Waymo、nuScenes等大规模数据集上实现SOTA级重建质量的同时,仍然保持亚秒级的推理速度。这种既快又好的特性,平衡满足了工业界对速度与质量的双重需求,使其具有作为实时的预处理模块,集成到自动驾驶系统的训练、仿真与评估流程中的潜力。

总体来看,0.4秒即可完成支持实例级编辑的4D重建,速度与质量兼顾的动态场景建模,以及对跨数据集泛化瓶颈的突破,无一不意味着低成本生成动态驾驶场景训练数据的新范式,已经距离我们更近一步。

雷峰网文章

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
皇马的痛:5-2,19岁恩德里克闪耀法甲:上演帽子戏法,率队逼近前三

皇马的痛:5-2,19岁恩德里克闪耀法甲:上演帽子戏法,率队逼近前三

侧身凌空斩
2026-01-26 04:46:43
不管你信不信,男性过了61岁后,基本都有这7个现状,要坦然接受

不管你信不信,男性过了61岁后,基本都有这7个现状,要坦然接受

健康之光
2026-01-11 12:40:02
人形机器人量产前夜,确定性最大的环节,是这4家减速器厂商!

人形机器人量产前夜,确定性最大的环节,是这4家减速器厂商!

小白鸽财经
2026-01-25 20:30:02
3-0!马竞主场横扫,落后皇马7分,30岁锋霸爆发:3轮轰3球

3-0!马竞主场横扫,落后皇马7分,30岁锋霸爆发:3轮轰3球

足球狗说
2026-01-25 22:54:38
全球矿业股狂飙 或开启新一轮超级周期

全球矿业股狂飙 或开启新一轮超级周期

财联社
2026-01-25 20:38:01
回顾:广东16岁女儿不避父,母亲失控将女儿砍死,真相令人窒息

回顾:广东16岁女儿不避父,母亲失控将女儿砍死,真相令人窒息

兰姐说故事
2025-01-22 20:00:02
美联储,即将重磅来袭!

美联储,即将重磅来袭!

证券时报
2026-01-25 21:22:08
中国队丢冠仅1夜,队长赴英超!王钰栋遭批:态度有问题 基本废了

中国队丢冠仅1夜,队长赴英超!王钰栋遭批:态度有问题 基本废了

侃球熊弟
2026-01-25 10:37:48
《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

诗词中国
2026-01-23 18:47:36
新车买来6天,4S店销售员一个没注意撞了!车主协商未果把车卖了,贬值3.5万

新车买来6天,4S店销售员一个没注意撞了!车主协商未果把车卖了,贬值3.5万

都市快报橙柿互动
2026-01-25 11:35:05
致死率75%!无药可救!印度突发人传人病毒!WHO拉响最高警报……

致死率75%!无药可救!印度突发人传人病毒!WHO拉响最高警报……

趣味探索
2026-01-25 22:08:12
西甲第1易主!亚马尔侧钩破门,巴萨3-0夺主场10连胜傲视五大联赛

西甲第1易主!亚马尔侧钩破门,巴萨3-0夺主场10连胜傲视五大联赛

钉钉陌上花开
2026-01-26 05:03:44
巴克利认为除雷霆队外,只有一支球队有能力赢得2026年NBA总冠军

巴克利认为除雷霆队外,只有一支球队有能力赢得2026年NBA总冠军

好火子
2026-01-26 03:28:53
范元甄:曾是红极一时的“延安四美”,却因“太聪明”输掉了一生

范元甄:曾是红极一时的“延安四美”,却因“太聪明”输掉了一生

干史人
2026-01-23 11:48:39
贝克汉姆14岁女儿家庭风波中首次发声,大布被曝,只想跟妹妹联系

贝克汉姆14岁女儿家庭风波中首次发声,大布被曝,只想跟妹妹联系

译言
2026-01-25 06:53:17
重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

科普100克克
2026-01-24 18:11:51
大V曝李湘因洗钱遭禁言!与黄有龙交集被扒,王诗龄的画成证据!

大V曝李湘因洗钱遭禁言!与黄有龙交集被扒,王诗龄的画成证据!

古希腊掌管月桂的神
2026-01-25 18:31:59
“为什么骗我?我真的失望了!”公益演出竟被卖门票,歌手黄霄雲怒怼 ,当地文旅局:执行公司已退款,应免费

“为什么骗我?我真的失望了!”公益演出竟被卖门票,歌手黄霄雲怒怼 ,当地文旅局:执行公司已退款,应免费

扬子晚报
2026-01-24 21:48:07
国安“点名”75岁张艺谋,释放三个强烈信号,巩俐的话真没说错

国安“点名”75岁张艺谋,释放三个强烈信号,巩俐的话真没说错

素衣读史
2026-01-24 17:59:32
伟大的3-0!德约解锁大满贯新成就,追平费德勒纪录,1幕引发争议

伟大的3-0!德约解锁大满贯新成就,追平费德勒纪录,1幕引发争议

刘姚尧的文字城堡
2026-01-25 08:04:47
2026-01-26 06:40:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68407文章数 656059关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

游戏
旅游
教育
时尚
本地

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

旅游要闻

构建世界级长城大景区 加强文物资源活化利用

教育要闻

2026高考突破1400万?权威解读来了!

看了鲁豫对章小蕙的采访,最大感触是这一点

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

无障碍浏览 进入关怀版