网易首页 > 网易号 > 正文 申请入驻

清华赵昊最新力作:0.4 秒完成4D高斯重建,自驾仿真新SOTA丨GAIR 2025

0
分享至


性能较现有 SOTA 提升 50%。

作者丨梁丙鉴

编辑丨马晓宁


从工厂、矿区的封闭路段到更加开放的世界,自动驾驶技术面临着来自真实交通环境的多重挑战。变道超车的车辆、突然打开的车门、横穿马路的行人……当自动驾驶系统学着给这些动态对象进行4D建模、重建和再仿真时,大多数解决方案仍然依赖于每场景优化、已知的相机校准或短帧窗口,这使得它们变得缓慢且不实用。

能否快速、低成本获得动态驾驶场景下的仿真数据,决定了自动驾驶系统在开放世界中的进化速度。在这一背景下,长期深耕神经渲染与仿真技术的赵昊老师团队,提出了首个面向大型动态驾驶场景的无姿态(pose-free) 前馈三维重建框架——DGGT(Driving Gaussian Grounded Transformer)。

赵昊现任清华大学智能产业研究院(AIR)助理教授,智源学者(BAAI Scholar)。他的研究聚焦计算机视觉领域,在三维场景理解、生成式仿真与神经渲染等方向深耕多年,研究成果对于自动驾驶及具身智能仿真具有重要意义。

值得关注的是,赵昊老师将以组委会主席的身份,出席2025年GAIR全球人工智能与机器人大会,并主持世界模型分论坛,分享他在世界模型方面的最新探索。

GAIR大会聚焦人工智能的核心技术、前沿趋势与产业落地,长期吸引来自全球的技术领袖和科研人士。本届大会将于2025年12月12-13日在深圳·博林天瑞喜来登酒店举行,与产业界和学术界的嘉宾共同研讨人工智能的下一步发展。


论文地址:
https://arxiv.org/abs/2512.03004

01

自动驾驶仿真新 SOTA

DGGT最大的突破,是摆脱了传统方案对逐场景优化、相机标定以及短帧窗口的依赖。通过多头联合预测结构,DGGT只需稀疏、无标定图像,单次前向即可同时输出相机位姿、深度、动态实例与场景表示,重建长序列三维场景。

且该场景表示可直接在Gaussian层面进行编辑,如移除或移动车辆,插入其他场景的新汽车或骑行者等实例。DGGT的高度可编辑性支持扩散精修自动补洞,输出可用于仿真与数据合成。

实验结果表明,DGGT在Waymo上达到了 27.41 PSNR,每场景推断 0.39 秒(3 个视角,20 帧),超过了作为优化基线的EmerNeRF、DeformableGS方案和前馈方法,同时保持了速度竞争力。换言之,DGGT比优化类方案更迅速,比前馈方案更保真。

同样令人惊喜的还有泛化性。DGGT将相机位姿从输入转为模型输出,通过端到端预测内外参并融入场景表示的方法,打破了跨数据集部署的校准壁垒。DGGT模型在 Waymo 上训练,却能在 nuScenes 与 Argoverse2 上实现强劲的零样本泛化,在关键感知指标上相比STORM提升超过50%。如在nuScenes上LPIPS从0.394降至0.152(下降 61.4%),在 Argoverse2上从0.326降至0.155(下降52.5%)。

值得注意的是,研究团队在nuScenes 和 Argoverse2 数据集上分别进行了零样本和从头训练两种设置的实验评估。在这两种情况下,DGGT均表现出了SOTA级性能。

此外,系统通过lifespan head建模场景随时间的外观演变,并配合单步扩散精修,可有效抑制运动插值伪影,提升时空一致性与渲染自然度。在保证仿真质量的前提下,DGGT为自动驾驶仿真推开了一扇迈向高速、可扩展新阶段的大门。

02

一次前向,完整 4D 场景

DGGT的核心设计理念,是一次性预测完整的4D场景状态,同时清晰地将静态背景与动态实体分离,并保持时间上的连贯性。

具体来说,研究团队将相机位姿从输入转为模型输出,每帧生成像素对齐的高斯映射,并添加一个寿命参数,随时间调制可见性以捕捉变化的外观,随后使用动态头生成密集动态映射,使用运动头估计三维运动,用于稀疏时间戳间插值,同时插入单步扩散细化,抑制重影/遮蔽伪影并恢复细节。

这产生了单遍、无姿态的算法,能够从未摆拍图像重建动态驱动场景,自然支持高斯层级的实例级编辑。

在系统结构上,DGGT 采用 ViT 编码器融合 DINO 先验,通过交替注意力得到共享特征,再由多个预测头并行输出:

  • 相机头估计每一帧内外参数;

  • Gaussian 头给出逐像素颜色/位置/旋转/尺度/不透明度参数;

  • lifespan 头控制时间可见度;

  • 动态头输出运动遮罩;

  • 运动头显式估计动态物体的三维位移;

  • 天空头稳定建模远景背景。

03

动态驾驶场景仿真新路径

长期以来,高精度标定设备和固定路线采集方案,一直限制着动态驾驶场景训练数据的成本和采集效率,DGGT则提出了一种规避上述限制的全新方案。

将相机位姿转为模型输出的设计使DGGT具有了在真实、开放世界中的高度灵活性,同时其多头联合预测结构支持任意数量的输入视图和长序列处理,克服了现有前馈方法在时序扩展性上的瓶颈,为处理大规模自动驾驶日志提供了可行路径。

更可贵的是,DGGT能在Waymo、nuScenes等大规模数据集上实现SOTA级重建质量的同时,仍然保持亚秒级的推理速度。这种既快又好的特性,平衡满足了工业界对速度与质量的双重需求,使其具有作为实时的预处理模块,集成到自动驾驶系统的训练、仿真与评估流程中的潜力。

总体来看,0.4秒即可完成支持实例级编辑的4D重建,速度与质量兼顾的动态场景建模,以及对跨数据集泛化瓶颈的突破,无一不意味着低成本生成动态驾驶场景训练数据的新范式,已经距离我们更近一步。

首批 GAIR 2025 重磅大咖名单正式揭晓,还有更多行业领军者将齐聚现场,共探智能的未来。

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!1换3交易!湖人动刀!状元被甩!值得吗?

突发!1换3交易!湖人动刀!状元被甩!值得吗?

篮球盛世
2026-07-04 14:08:07
张继科看了两眼哈兰德跑步,丢下一句话,直接把整个直播间干沉默

张继科看了两眼哈兰德跑步,丢下一句话,直接把整个直播间干沉默

童叔不飙车
2026-06-23 01:17:32
老板娘问我她身材好不好?我该怎么回答?

老板娘问我她身材好不好?我该怎么回答?

太急张三疯
2026-07-04 14:35:07
以总理:“我想停止接受美国的援助”

以总理:“我想停止接受美国的援助”

环球时报国际
2026-07-03 08:15:11
唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

清衣渡a
2026-06-30 13:42:14
都说女儿像爸,董勇女儿和他如复制粘贴,今长这么大了,漂亮可爱

都说女儿像爸,董勇女儿和他如复制粘贴,今长这么大了,漂亮可爱

娱人细品
2026-07-03 16:01:29
7-11起诉耐克,指控其新鞋配色抄袭7-11标志性颜色,还选在7月11日发售

7-11起诉耐克,指控其新鞋配色抄袭7-11标志性颜色,还选在7月11日发售

第一财经资讯
2026-07-04 11:51:13
“上帝之手”该还了?英格兰队主帅图赫尔放话:复仇时间已到

“上帝之手”该还了?英格兰队主帅图赫尔放话:复仇时间已到

画夕
2026-07-04 00:31:44
完全是另一番景象!如果阿根廷和法国再交锋,阿根廷无取胜机会?

完全是另一番景象!如果阿根廷和法国再交锋,阿根廷无取胜机会?

闻香阁
2026-07-04 11:43:39
丑模吕燕嫁老外,14岁儿子帅气,本人气质渐佳

丑模吕燕嫁老外,14岁儿子帅气,本人气质渐佳

青杉依旧啊啊
2026-07-04 14:19:44
员工入职4天就被公司以“不胜任工作”为由辞退,收到400元工资,将公司告上法庭,广州白云法院:公司违法解约,赔偿10000元

员工入职4天就被公司以“不胜任工作”为由辞退,收到400元工资,将公司告上法庭,广州白云法院:公司违法解约,赔偿10000元

环球网资讯
2026-07-03 14:55:11
老板你穿成这样,生意不好是不可能的!有那味了

老板你穿成这样,生意不好是不可能的!有那味了

舞指飞扬
2026-07-04 09:15:07
中纪委再出大招!公务员这4类行为将被大数据盯死,沾上就完蛋!

中纪委再出大招!公务员这4类行为将被大数据盯死,沾上就完蛋!

职场资深秘书
2026-07-03 13:55:55
巴蒂:我在球场上并不享受,不像马拉多纳那样天生为足球而生

巴蒂:我在球场上并不享受,不像马拉多纳那样天生为足球而生

懂球帝
2026-07-03 18:17:24
四登世界杯的夏奇拉,把兰博基尼随手送,身价3亿竟没有超跑?

四登世界杯的夏奇拉,把兰博基尼随手送,身价3亿竟没有超跑?

HerCar
2026-07-04 11:21:54
1979年,党中央抓捕许世友儿子,许世友得知后:抓得好,抓得妙

1979年,党中央抓捕许世友儿子,许世友得知后:抓得好,抓得妙

大海的诺言
2024-10-04 08:55:11
农业网红诋毁杂交水稻,媒体:一些人还是吃得太饱了!

农业网红诋毁杂交水稻,媒体:一些人还是吃得太饱了!

齐鲁壹点
2026-06-28 17:17:09
39岁!33岁!阿根廷队世界杯疯狂“啃老”,1.8亿组合成“摆设”

39岁!33岁!阿根廷队世界杯疯狂“啃老”,1.8亿组合成“摆设”

小秦哥聊体育
2026-07-04 14:04:54
罗马诺发文致敬佛得角:你们没有被淘汰,你们赢得了我们的心

罗马诺发文致敬佛得角:你们没有被淘汰,你们赢得了我们的心

懂球帝
2026-07-04 14:04:05
台风“美莎克”将再次登陆 最新路径公布

台风“美莎克”将再次登陆 最新路径公布

极目新闻
2026-07-04 07:32:12
2026-07-04 15:19:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7428文章数 20761关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

美大使装无辜:好失望 你们在中国肯定不自由

头条要闻

美大使装无辜:好失望 你们在中国肯定不自由

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

最富女歌手霉霉完婚 在纽约设宴庆贺

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

家居
旅游
房产
艺术
数码

家居要闻

传奇筑 日常诗

旅游要闻

迎旅发!兴凯湖畔备好 “醉美” 风景

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

艺术要闻

16位当代画家,23幅风景与人物作品

数码要闻

史上第一次!苹果Apple Watch S12表带将内置传感器

无障碍浏览 进入关怀版