网易首页 > 网易号 > 正文 申请入驻

清华赵昊最新力作:0.4 秒完成4D高斯重建,自驾仿真新SOTA丨GAIR 2025

0
分享至



性能较现有 SOTA 提升 50%。

作者丨梁丙鉴

编辑丨马晓宁


从工厂、矿区的封闭路段到更加开放的世界,自动驾驶技术面临着来自真实交通环境的多重挑战。变道超车的车辆、突然打开的车门、横穿马路的行人……当自动驾驶系统学着给这些动态对象进行4D建模、重建和再仿真时,大多数解决方案仍然依赖于每场景优化、已知的相机校准或短帧窗口,这使得它们变得缓慢且不实用。

能否快速、低成本获得动态驾驶场景下的仿真数据,决定了自动驾驶系统在开放世界中的进化速度。在这一背景下,长期深耕神经渲染与仿真技术的赵昊老师团队,提出了首个面向大型动态驾驶场景的无姿态(pose-free) 前馈三维重建框架——DGGT(Driving Gaussian Grounded Transformer)。

赵昊现任清华大学智能产业研究院(AIR)助理教授,智源学者(BAAI Scholar)。他的研究聚焦计算机视觉领域,在三维场景理解、生成式仿真与神经渲染等方向深耕多年,研究成果对于自动驾驶及具身智能仿真具有重要意义。

值得关注的是,赵昊老师将以组委会主席的身份,出席2025年GAIR全球人工智能与机器人大会,并主持世界模型分论坛,分享他在世界模型方面的最新探索。

GAIR大会聚焦人工智能的核心技术、前沿趋势与产业落地,长期吸引来自全球的技术领袖和科研人士。本届大会将于2025年12月12-13日在深圳·博林天瑞喜来登酒店举行,与产业界和学术界的嘉宾共同研讨人工智能的下一步发展。



论文地址:
https://arxiv.org/abs/2512.03004

01

自动驾驶仿真新 SOTA

DGGT最大的突破,是摆脱了传统方案对逐场景优化、相机标定以及短帧窗口的依赖。通过多头联合预测结构,DGGT只需稀疏、无标定图像,单次前向即可同时输出相机位姿、深度、动态实例与场景表示,重建长序列三维场景。

且该场景表示可直接在Gaussian层面进行编辑,如移除或移动车辆,插入其他场景的新汽车或骑行者等实例。DGGT的高度可编辑性支持扩散精修自动补洞,输出可用于仿真与数据合成。

实验结果表明,DGGT在Waymo上达到了 27.41 PSNR,每场景推断 0.39 秒(3 个视角,20 帧),超过了作为优化基线的EmerNeRF、DeformableGS方案和前馈方法,同时保持了速度竞争力。换言之,DGGT比优化类方案更迅速,比前馈方案更保真。


同样令人惊喜的还有泛化性。DGGT将相机位姿从输入转为模型输出,通过端到端预测内外参并融入场景表示的方法,打破了跨数据集部署的校准壁垒。DGGT模型在 Waymo 上训练,却能在 nuScenes 与 Argoverse2 上实现强劲的零样本泛化,在关键感知指标上相比STORM提升超过50%。如在nuScenes上LPIPS从0.394降至0.152(下降 61.4%),在 Argoverse2上从0.326降至0.155(下降52.5%)。

值得注意的是,研究团队在nuScenes 和 Argoverse2 数据集上分别进行了零样本和从头训练两种设置的实验评估。在这两种情况下,DGGT均表现出了SOTA级性能。


此外,系统通过lifespan head建模场景随时间的外观演变,并配合单步扩散精修,可有效抑制运动插值伪影,提升时空一致性与渲染自然度。在保证仿真质量的前提下,DGGT为自动驾驶仿真推开了一扇迈向高速、可扩展新阶段的大门。

02

一次前向,完整 4D 场景

DGGT的核心设计理念,是一次性预测完整的4D场景状态,同时清晰地将静态背景与动态实体分离,并保持时间上的连贯性。

具体来说,研究团队将相机位姿从输入转为模型输出,每帧生成像素对齐的高斯映射,并添加一个寿命参数,随时间调制可见性以捕捉变化的外观,随后使用动态头生成密集动态映射,使用运动头估计三维运动,用于稀疏时间戳间插值,同时插入单步扩散细化,抑制重影/遮蔽伪影并恢复细节。

这产生了单遍、无姿态的算法,能够从未摆拍图像重建动态驱动场景,自然支持高斯层级的实例级编辑。

在系统结构上,DGGT 采用 ViT 编码器融合 DINO 先验,通过交替注意力得到共享特征,再由多个预测头并行输出:

  • 相机头估计每一帧内外参数;

  • Gaussian 头给出逐像素颜色/位置/旋转/尺度/不透明度参数;

  • lifespan 头控制时间可见度;

  • 动态头输出运动遮罩;

  • 运动头显式估计动态物体的三维位移;

  • 天空头稳定建模远景背景。

03

动态驾驶场景仿真新路径

长期以来,高精度标定设备和固定路线采集方案,一直限制着动态驾驶场景训练数据的成本和采集效率,DGGT则提出了一种规避上述限制的全新方案。

将相机位姿转为模型输出的设计使DGGT具有了在真实、开放世界中的高度灵活性,同时其多头联合预测结构支持任意数量的输入视图和长序列处理,克服了现有前馈方法在时序扩展性上的瓶颈,为处理大规模自动驾驶日志提供了可行路径。

更可贵的是,DGGT能在Waymo、nuScenes等大规模数据集上实现SOTA级重建质量的同时,仍然保持亚秒级的推理速度。这种既快又好的特性,平衡满足了工业界对速度与质量的双重需求,使其具有作为实时的预处理模块,集成到自动驾驶系统的训练、仿真与评估流程中的潜力。

总体来看,0.4秒即可完成支持实例级编辑的4D重建,速度与质量兼顾的动态场景建模,以及对跨数据集泛化瓶颈的突破,无一不意味着低成本生成动态驾驶场景训练数据的新范式,已经距离我们更近一步。

首批 GAIR 2025 重磅大咖名单正式揭晓,还有更多行业领军者将齐聚现场,共探智能的未来。


未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赵心童10-3横扫小特!7次决赛全夺冠,最新世界排名:丁俊晖第16

赵心童10-3横扫小特!7次决赛全夺冠,最新世界排名:丁俊晖第16

球场没跑道
2026-04-06 04:49:22
不怪国内那么多人想娶她,确实漂亮。

不怪国内那么多人想娶她,确实漂亮。

情感大头说说
2026-04-05 18:05:23
别吃,寄生虫达上千条,近期正大量出现

别吃,寄生虫达上千条,近期正大量出现

番禺台
2026-04-05 08:11:02
北京警方紧急提醒苹果用户

北京警方紧急提醒苹果用户

第一财经资讯
2026-04-05 20:26:27
毕业生破1270万!2026下半年开始,大部分家庭将直面“4大难题”

毕业生破1270万!2026下半年开始,大部分家庭将直面“4大难题”

复转这些年
2026-04-05 18:00:42
院士罕见发话:别再叫北斗“中国版GPS”了!差距大到离谱!

院士罕见发话:别再叫北斗“中国版GPS”了!差距大到离谱!

小兰聊历史
2026-04-05 05:34:48
你专业还是我专业!王铸和张雪吵架事件,再次被扒,评论区沸腾了

你专业还是我专业!王铸和张雪吵架事件,再次被扒,评论区沸腾了

火山詩话
2026-04-05 12:09:37
卢比奥下令驱逐苏莱曼尼侄女全家,“应以欧洲为戒”

卢比奥下令驱逐苏莱曼尼侄女全家,“应以欧洲为戒”

移光幻影
2026-04-05 12:04:48
战满7局!王楚钦4-3险胜日本新星,首次加冕世界杯男单冠军

战满7局!王楚钦4-3险胜日本新星,首次加冕世界杯男单冠军

全景体育V
2026-04-05 22:12:53
托马斯·弗里德曼:特朗普该如何退出伊朗战争?

托马斯·弗里德曼:特朗普该如何退出伊朗战争?

参考消息
2026-04-05 20:36:11
毛新宇被搀扶着回乡祭祖:高颜值妻女照片流出,墓前讲话内容披露

毛新宇被搀扶着回乡祭祖:高颜值妻女照片流出,墓前讲话内容披露

温柔看世界
2026-04-05 11:45:50
深圳超大医院遇冷,8万张床位空着,媒体着急,当地市民吐槽!

深圳超大医院遇冷,8万张床位空着,媒体着急,当地市民吐槽!

另子维爱读史
2026-04-05 22:37:12
深圳超大医院遇冷,8万张床位空着,媒体着急,当地市民吐槽!

深圳超大医院遇冷,8万张床位空着,媒体着急,当地市民吐槽!

眼光很亮
2026-04-05 09:37:32
周杰伦塌房!什么原创王子,他的这么多歌竟然都是抄来的

周杰伦塌房!什么原创王子,他的这么多歌竟然都是抄来的

可达鸭面面观
2026-04-05 16:59:56
伊朗搜捕人员距飞行员藏身地不到3公里!美军营救代价惨烈,损失飞机价值超4亿美元

伊朗搜捕人员距飞行员藏身地不到3公里!美军营救代价惨烈,损失飞机价值超4亿美元

红星新闻
2026-04-05 18:49:42
高市早苗麻烦大了!3艘船刚放行,一伊朗人就被日本人活活打死

高市早苗麻烦大了!3艘船刚放行,一伊朗人就被日本人活活打死

潮鹿逐梦
2026-04-05 12:27:24
突然拉升!美联储、鲍威尔,突发!降息,大消息!

突然拉升!美联储、鲍威尔,突发!降息,大消息!

证券时报e公司
2026-04-04 22:12:45
4亿美元,灰飞烟灭

4亿美元,灰飞烟灭

中国新闻周刊
2026-04-05 18:06:30
研究显示:我国男性阴茎疲软状态下的均值是6.5厘米,你达标了吗

研究显示:我国男性阴茎疲软状态下的均值是6.5厘米,你达标了吗

黯泉
2026-04-05 19:00:47
广州数学天才少女,斯坦福辍学创业,25岁拿下超14亿融资,公司估值110亿

广州数学天才少女,斯坦福辍学创业,25岁拿下超14亿融资,公司估值110亿

21世纪经济报道
2026-04-05 20:00:37
2026-04-06 07:03:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7170文章数 20743关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗军方:过去两天击落美军12架战机

头条要闻

伊朗军方:过去两天击落美军12架战机

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

数码
房产
本地
公开课
军事航空

数码要闻

大胆复古美学,海盗船推出原子紫配色K65 PLUS WIRELESS机械键盘

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版