网易首页 > 网易号 > 正文 申请入驻

清华赵昊最新力作:0.4 秒完成4D高斯重建,自驾仿真新SOTA丨GAIR 2025

0
分享至



性能较现有 SOTA 提升 50%。

作者丨梁丙鉴

编辑丨马晓宁


从工厂、矿区的封闭路段到更加开放的世界,自动驾驶技术面临着来自真实交通环境的多重挑战。变道超车的车辆、突然打开的车门、横穿马路的行人……当自动驾驶系统学着给这些动态对象进行4D建模、重建和再仿真时,大多数解决方案仍然依赖于每场景优化、已知的相机校准或短帧窗口,这使得它们变得缓慢且不实用。

能否快速、低成本获得动态驾驶场景下的仿真数据,决定了自动驾驶系统在开放世界中的进化速度。在这一背景下,长期深耕神经渲染与仿真技术的赵昊老师团队,提出了首个面向大型动态驾驶场景的无姿态(pose-free) 前馈三维重建框架——DGGT(Driving Gaussian Grounded Transformer)。

赵昊现任清华大学智能产业研究院(AIR)助理教授,智源学者(BAAI Scholar)。他的研究聚焦计算机视觉领域,在三维场景理解、生成式仿真与神经渲染等方向深耕多年,研究成果对于自动驾驶及具身智能仿真具有重要意义。

值得关注的是,赵昊老师将以组委会主席的身份,出席2025年GAIR全球人工智能与机器人大会,并主持世界模型分论坛,分享他在世界模型方面的最新探索。

GAIR大会聚焦人工智能的核心技术、前沿趋势与产业落地,长期吸引来自全球的技术领袖和科研人士。本届大会将于2025年12月12-13日在深圳·博林天瑞喜来登酒店举行,与产业界和学术界的嘉宾共同研讨人工智能的下一步发展。



论文地址:
https://arxiv.org/abs/2512.03004

01

自动驾驶仿真新 SOTA

DGGT最大的突破,是摆脱了传统方案对逐场景优化、相机标定以及短帧窗口的依赖。通过多头联合预测结构,DGGT只需稀疏、无标定图像,单次前向即可同时输出相机位姿、深度、动态实例与场景表示,重建长序列三维场景。

且该场景表示可直接在Gaussian层面进行编辑,如移除或移动车辆,插入其他场景的新汽车或骑行者等实例。DGGT的高度可编辑性支持扩散精修自动补洞,输出可用于仿真与数据合成。

实验结果表明,DGGT在Waymo上达到了 27.41 PSNR,每场景推断 0.39 秒(3 个视角,20 帧),超过了作为优化基线的EmerNeRF、DeformableGS方案和前馈方法,同时保持了速度竞争力。换言之,DGGT比优化类方案更迅速,比前馈方案更保真。


同样令人惊喜的还有泛化性。DGGT将相机位姿从输入转为模型输出,通过端到端预测内外参并融入场景表示的方法,打破了跨数据集部署的校准壁垒。DGGT模型在 Waymo 上训练,却能在 nuScenes 与 Argoverse2 上实现强劲的零样本泛化,在关键感知指标上相比STORM提升超过50%。如在nuScenes上LPIPS从0.394降至0.152(下降 61.4%),在 Argoverse2上从0.326降至0.155(下降52.5%)。

值得注意的是,研究团队在nuScenes 和 Argoverse2 数据集上分别进行了零样本和从头训练两种设置的实验评估。在这两种情况下,DGGT均表现出了SOTA级性能。


此外,系统通过lifespan head建模场景随时间的外观演变,并配合单步扩散精修,可有效抑制运动插值伪影,提升时空一致性与渲染自然度。在保证仿真质量的前提下,DGGT为自动驾驶仿真推开了一扇迈向高速、可扩展新阶段的大门。

02

一次前向,完整 4D 场景

DGGT的核心设计理念,是一次性预测完整的4D场景状态,同时清晰地将静态背景与动态实体分离,并保持时间上的连贯性。

具体来说,研究团队将相机位姿从输入转为模型输出,每帧生成像素对齐的高斯映射,并添加一个寿命参数,随时间调制可见性以捕捉变化的外观,随后使用动态头生成密集动态映射,使用运动头估计三维运动,用于稀疏时间戳间插值,同时插入单步扩散细化,抑制重影/遮蔽伪影并恢复细节。

这产生了单遍、无姿态的算法,能够从未摆拍图像重建动态驱动场景,自然支持高斯层级的实例级编辑。

在系统结构上,DGGT 采用 ViT 编码器融合 DINO 先验,通过交替注意力得到共享特征,再由多个预测头并行输出:

  • 相机头估计每一帧内外参数;

  • Gaussian 头给出逐像素颜色/位置/旋转/尺度/不透明度参数;

  • lifespan 头控制时间可见度;

  • 动态头输出运动遮罩;

  • 运动头显式估计动态物体的三维位移;

  • 天空头稳定建模远景背景。

03

动态驾驶场景仿真新路径

长期以来,高精度标定设备和固定路线采集方案,一直限制着动态驾驶场景训练数据的成本和采集效率,DGGT则提出了一种规避上述限制的全新方案。

将相机位姿转为模型输出的设计使DGGT具有了在真实、开放世界中的高度灵活性,同时其多头联合预测结构支持任意数量的输入视图和长序列处理,克服了现有前馈方法在时序扩展性上的瓶颈,为处理大规模自动驾驶日志提供了可行路径。

更可贵的是,DGGT能在Waymo、nuScenes等大规模数据集上实现SOTA级重建质量的同时,仍然保持亚秒级的推理速度。这种既快又好的特性,平衡满足了工业界对速度与质量的双重需求,使其具有作为实时的预处理模块,集成到自动驾驶系统的训练、仿真与评估流程中的潜力。

总体来看,0.4秒即可完成支持实例级编辑的4D重建,速度与质量兼顾的动态场景建模,以及对跨数据集泛化瓶颈的突破,无一不意味着低成本生成动态驾驶场景训练数据的新范式,已经距离我们更近一步。

首批 GAIR 2025 重磅大咖名单正式揭晓,还有更多行业领军者将齐聚现场,共探智能的未来。


未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海过江隧道突遭超高运输车闯入!隧道因大型风机坠落、多种设备损坏连夜封闭!官方连发通报

上海过江隧道突遭超高运输车闯入!隧道因大型风机坠落、多种设备损坏连夜封闭!官方连发通报

环球网资讯
2026-01-25 19:08:15
辽篮为何末节仅4分吞下4连败?杨鸣给出答案,一句话令人心灰意冷

辽篮为何末节仅4分吞下4连败?杨鸣给出答案,一句话令人心灰意冷

萌兰聊个球
2026-01-25 23:03:11
女子实名举报短剧演员何健麒涉毒,工作室严正声明:已报案!

女子实名举报短剧演员何健麒涉毒,工作室严正声明:已报案!

极目新闻
2026-01-25 21:49:23
盆满钵满!拜仁成绩出色财政收入优,豪门底气底蕴正是由此而来

盆满钵满!拜仁成绩出色财政收入优,豪门底气底蕴正是由此而来

里芃芃体育
2026-01-26 00:10:06
特朗普向阵亡英军道歉,移民探员又射杀美国公民!说说昨天的文章

特朗普向阵亡英军道歉,移民探员又射杀美国公民!说说昨天的文章

鹰眼Defence
2026-01-25 18:06:31
历史如此巧合?杨开慧雕像缺失的石料,竟是主席像的“另一半”!

历史如此巧合?杨开慧雕像缺失的石料,竟是主席像的“另一半”!

鹤羽说个事
2026-01-23 16:07:42
一名乞丐被冻死前,写了一首流传后世的绝命诗,让无数士大夫惭愧

一名乞丐被冻死前,写了一首流传后世的绝命诗,让无数士大夫惭愧

铭记历史呀
2026-01-19 02:37:27
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

泛舟碧波湖水
2026-01-25 20:56:07
特朗普宣布,委内瑞拉出口中国石油加价2美元,中方:一桶也不买

特朗普宣布,委内瑞拉出口中国石油加价2美元,中方:一桶也不买

兴史兴谈
2026-01-24 23:27:37
不惯特朗普这套!特朗普禁止全球抛美债,中国手握6830亿:不奉陪

不惯特朗普这套!特朗普禁止全球抛美债,中国手握6830亿:不奉陪

今墨缘
2026-01-25 23:55:46
再见了,沈腾,再见了,贾玲,2026年春晚“新小品演员”来势汹汹

再见了,沈腾,再见了,贾玲,2026年春晚“新小品演员”来势汹汹

真的八卦小学弟
2026-01-24 19:00:06
18次登上春晚给观众带来笑声,喜剧演员孙涛却因无端网暴落泪:我没有“力挺闫学晶”!

18次登上春晚给观众带来笑声,喜剧演员孙涛却因无端网暴落泪:我没有“力挺闫学晶”!

极目新闻
2026-01-23 18:38:01
内蒙古一乐园冰上运动项目旋转时铁链断裂,游客被甩出去多人受伤

内蒙古一乐园冰上运动项目旋转时铁链断裂,游客被甩出去多人受伤

大风新闻
2026-01-25 13:39:03
先发中锋再次打出灾难表现,但湖人替补中锋又一次挺身而出了?

先发中锋再次打出灾难表现,但湖人替补中锋又一次挺身而出了?

稻谷与小麦
2026-01-26 00:02:57
美军压境,中央司令已到,全面战争要开打?中方在联合国先发制人

美军压境,中央司令已到,全面战争要开打?中方在联合国先发制人

梁岱爱玩车
2026-01-25 23:25:17
陈百祥称自己每场直播收入超8位数,“这简直是天文数字,就站在那里说四五句话”

陈百祥称自己每场直播收入超8位数,“这简直是天文数字,就站在那里说四五句话”

潇湘晨报
2026-01-23 12:09:10
出大事了,高市破了日本60年规矩,立下军令状后,成败全看这一步

出大事了,高市破了日本60年规矩,立下军令状后,成败全看这一步

近史博览
2026-01-26 00:03:34
美媒爆料:白宫请求内塔尼亚胡允许以总统出席“和平委员会”启动仪式,但遭拒绝

美媒爆料:白宫请求内塔尼亚胡允许以总统出席“和平委员会”启动仪式,但遭拒绝

环球网资讯
2026-01-25 11:01:57
原来他已去世19年,患病下肢截瘫,赵本山为他立下的规矩打破没?

原来他已去世19年,患病下肢截瘫,赵本山为他立下的规矩打破没?

白面书誏
2026-01-25 20:22:11
“后劲”太大!挥泪辟谣后,孙涛摊牌:没公司、不带货,放弃春晚

“后劲”太大!挥泪辟谣后,孙涛摊牌:没公司、不带货,放弃春晚

削桐作琴
2026-01-26 00:34:34
2026-01-26 01:12:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7054文章数 20726关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

教育
时尚
手机
游戏
房产

教育要闻

留学生的父母,有些话一直没说!

看了鲁豫对章小蕙的采访,最大感触是这一点

手机要闻

荣耀泡泡玛特联名手机开售,后续新机再曝

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

房产要闻

正式官宣!三亚又一所名校要来了!

无障碍浏览 进入关怀版