网易首页 > 网易号 > 正文 申请入驻

无论真实还是AI视频,「摩斯卡」都能重建恢复4D动态可渲染场景

0
分享至

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

雷嘉晖,美国宾夕法尼亚大学计算机系博士生 (2020 - 今), 导师为 Kostas Daniilidis 教授,目前主要研究方向为四维动态场景几何的建模表示和算法以及应用。他在计算机视觉和机器学习顶会 (CVPR、NeurIPS、ICML、ECCV) 以第一或共一作者身份发表文章 7 篇。此前他本科 (2016-2020) 以专业第一名的成绩毕业于浙江大学控制系,竺可桢学院混合班。

从任意单目视频重建可渲染的动态场景是计算机视觉研究领域的一个圣杯。本文中,宾夕法尼亚大学和斯坦福大学研究团队尝试向这一目标迈进一小步。

互联网上有海量单目视频,其中蕴含了大量物理世界的信息,但三维视觉仍缺乏行之有效的手段,将三维动态信息从这些视频中提取出来,从而支撑未来三维大模型建模及理解动态物理世界。尽管重要,这个反问题极具挑战性。

其一,真实拍摄的二维视频往往缺乏多视角信息,因此不能利用多视角几何进行三维重建,甚至在很多情况下无法通过已有软件(如 COLMAP)求解相机位姿和内参。

其二,动态场景的自由度极高,其变形和长时间信息融合的四维表示仍然不成熟,使这一困难的反问题更加复杂。

本文提出了一种新颖的神经信息处理系统 —— 摩斯卡 (MoSca),只需提供一连串视频帧图片,无需任何额外信息,即可从 SORA 生成的视频、电影电视剧片段、互联网视频和公开数据集的单目野生 (in-the-wild) 视频中重建可渲染的动态场景。



ArXiv地址:https://arxiv.org/pdf/2405.17421

代码 (近期将开源):www.github.com/JiahuiLei/MoSca

项目网站: www.cis.upenn.edu/~leijh/projects/mosca/

视频 (bilibili): www.bilibili.com/video/BV1uU411o75P/?vd_source=177d8c87be5e898a43e8937dbef9bed4

方法概览

为了克服上述的困难,摩斯卡首先利用了存储在计算机视觉基石模型 (foundation models) 中的强先验知识将问题解空间缩小。



具体而言,摩斯卡利用了单目有尺度的深度估计 (mono metric-depth) 模型 UniDepth、 视频任一点长时间跟踪 (track any point) 模型 CoTracker、光流估计 (optical flow) 模型 RAFT 计算出的对极几何误差 (epipolar error), 以及预训练语义模型 DINO-v2 提供的语义特征。详参论文 3.1 章节.

我们观察到,大多数真实世界的动态变形本质上都是紧凑和稀疏的,其复杂度往往远低于真实几何结构的复杂度。比如,一个硬物体的运动可以用旋转和平移表示,一个人的运动大致可以用多个关节的旋转平移近似。

基于这一观察,本文提出了一种新颖的紧凑动态场景表示 —— 四维运动脚手架 (4D Motion Scaffold),将上述基石模型输出从二维提升至四维并进行融合,同时也融入物理启发的变形正则化 (ARAP) 。

四维运动脚手架是一个图,图的每一个节点是一串刚体运动 (SE (3)) 轨迹,图的拓扑结构是全局考虑刚体运动轨迹曲线距离而构建的最近邻边。通过使用对偶四元数 (dual-quaternion) 在时空中平滑插值图上节点的刚体轨迹,可表示空间中任意一点的变形。这一表示大大简化了需解的运动参数。(详见论文 3.2 章节)。

,时长00:06

四维运动脚手架的另一个巨大优势在于可以直接被单目深度和视频二维点跟踪初始化,再通过高效的物理正则项优化求解出未知的遮挡点位置以及局部坐标系方向。详参论文 3.3 章节.

有了四维运动脚手架,任何时刻的任何一点都可以被变形到任意目标时刻,这让全局融合观测信息变得可能。具体而言,视频每一帧都可以利用估计的深度图反投影到三维空间并初始化三维高斯 (3DGS)。这些高斯被「绑定」在四维运动脚手架上,自由穿梭于任何时刻。想要渲染某一时刻的场景,只需将全局所有其他时刻的高斯通过四维脚手架传送到当前时刻融合即可。这一基于四维运动脚手架和高斯的动态场景表示可高效地被高斯渲染器优化(详见论文 3.4 章节)。

最后值得一提的是,摩斯卡是一个无需相机内外参的系统。通过利用上述基石模型输出的对极几何误差确定静态背景掩码,利用基石模型输出的深度和点跟踪,摩斯卡可以高效地优化重投影误差,求解全局集束优化 (bundle adjustment),从而直接输出相机内参和位姿,并通过后续的渲染持续优化相机(详见论文 3.5 章节)。

实验结果

摩斯卡可以在 DAVIS 数据集视频中重建动态场景。值得注意的是,摩斯卡可灵活支持多种基于高斯的渲染器。除了原生的 3DGS 渲染器,本文还测试了近期的高斯表面重建渲染器 GOF (Gaussian Opacity Field),如图中最右列的火车,GOF 可渲染出更高质量的 normal 和 depth。



摩斯卡在极具挑战性的 IPhone DyCheck 数据集上取得了显著提升,同时也在广泛对比的 Nvidia 数据集上对比了其他方法。









特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘亦菲宝格丽之夜,小腹赘肉突出,白臀丰满性感,膀大腰圆引热议

刘亦菲宝格丽之夜,小腹赘肉突出,白臀丰满性感,膀大腰圆引热议

红大娘娱乐
2024-07-20 17:53:03
赶在解放军动手前,赖清德两路人马逃离台湾,大陆或获得收台机会

赶在解放军动手前,赖清德两路人马逃离台湾,大陆或获得收台机会

说天说地说实事
2024-07-19 20:24:57
封了不到半个月,千万粉丝账号“一莎”解封!细数那些与他合作的品牌

封了不到半个月,千万粉丝账号“一莎”解封!细数那些与他合作的品牌

深蓝财经
2024-07-19 16:07:32
女大学生买20粒避孕药,磨粉放入室友碗里:“这是送她们的毕业礼物…”

女大学生买20粒避孕药,磨粉放入室友碗里:“这是送她们的毕业礼物…”

灰产圈
2024-07-20 00:54:04
越南人感慨:要是广东广西没有失守,现在越南已是“发达国家”

越南人感慨:要是广东广西没有失守,现在越南已是“发达国家”

布拉旅游说
2024-07-16 07:15:02
校园霸凌!男孩被同学打致脑出血,打人者满不在乎:我爸是局长!

校园霸凌!男孩被同学打致脑出血,打人者满不在乎:我爸是局长!

拍案说奇
2024-07-20 20:58:45
深夜23点!周琦去向悬念提前终结,广东队最后赢家,剑指第12冠

深夜23点!周琦去向悬念提前终结,广东队最后赢家,剑指第12冠

负角度的球
2024-07-19 20:37:01
遭民生银行追债,祥生杭州总部将被法拍

遭民生银行追债,祥生杭州总部将被法拍

界面新闻
2024-07-20 12:20:39
笑喷!大S发布最新自拍,回应网友疯传的丑照,依旧是美容大王!

笑喷!大S发布最新自拍,回应网友疯传的丑照,依旧是美容大王!

娱乐八卦木木子
2024-07-20 16:30:02
甩锅给下雨?11人遇难30余人失联的柞水大桥,建成通车才不到2年

甩锅给下雨?11人遇难30余人失联的柞水大桥,建成通车才不到2年

谭公子
2024-07-20 19:08:03
第一次知道有钱人的支付宝是黑色,果然贫穷限制了想象力,冒昧了

第一次知道有钱人的支付宝是黑色,果然贫穷限制了想象力,冒昧了

热闹的河马
2024-07-08 10:17:41
李晟医生被砍身亡后续:个人履历曝光好优秀,目击者曝他最后遗言

李晟医生被砍身亡后续:个人履历曝光好优秀,目击者曝他最后遗言

缘浅娱深
2024-07-20 10:40:06
李语蔚拿到培训结业证书,此后或将转正,目前还在杭州指挥交通

李语蔚拿到培训结业证书,此后或将转正,目前还在杭州指挥交通

花小萌和你聊情感
2024-07-20 15:55:56
俞敏洪被绑架细节:被注入兽用麻醉剂,抢走220万,7人仅他幸存…

俞敏洪被绑架细节:被注入兽用麻醉剂,抢走220万,7人仅他幸存…

极品小牛肉
2023-12-29 11:56:11
非洲唯一没有黑人的国家:经济发达美女泛滥,还对中国免签

非洲唯一没有黑人的国家:经济发达美女泛滥,还对中国免签

日风的故事屋
2024-07-18 17:21:43
解气!卡米拉77岁生日英国王室再掀风波 威廉:我就是故意的

解气!卡米拉77岁生日英国王室再掀风波 威廉:我就是故意的

王室叨B叨
2024-07-20 12:04:31
中央宣传部副部长、国务院新闻办公室主任莫高义主持新闻发布会

中央宣传部副部长、国务院新闻办公室主任莫高义主持新闻发布会

金台资讯
2024-07-19 12:09:10
心酸!男子抱怨老婆乱花钱,45块一斤的虾买了3斤,没想到挨批了

心酸!男子抱怨老婆乱花钱,45块一斤的虾买了3斤,没想到挨批了

有趣的火烈鸟
2024-07-19 23:49:12
50岁儿子每天骑10公里去老家拿菜,不去的话父母会很失落:很幸福

50岁儿子每天骑10公里去老家拿菜,不去的话父母会很失落:很幸福

老王侃趣闻
2024-07-19 16:59:15
中国最排面的婴儿:出生时军队保护产房,国家鸣13响礼炮为他庆生

中国最排面的婴儿:出生时军队保护产房,国家鸣13响礼炮为他庆生

杨哥历史
2024-07-17 13:42:46
2024-07-20 22:08:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
9219文章数 141963关注度
往期回顾 全部

科技要闻

特斯拉因"蓝屏事件"部分停工 马斯克"发火"

头条要闻

上任仅一年 唐山遵化副市长李伟任上被拿下

头条要闻

上任仅一年 唐山遵化副市长李伟任上被拿下

体育要闻

说威少不好,不如先看看掘金啥水平?

娱乐要闻

著名女演员郑佩佩因病离世,享年78岁

财经要闻

微软"蓝屏事件"波及特斯拉工厂

汽车要闻

1548匹! 小米SU7 Ultra原型车10月份挑战纽北

态度原创

艺术
本地
旅游
家居
健康

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

本地新闻

换个城市过夏天 | 青岛夏日记,一场与海的邂逅

旅游要闻

上海古埃及文明展“堪比迪士尼”

家居要闻

传统碰撞现代 呈现艺术质感

人类为何至今无法攻克渐冻症?

无障碍浏览 进入关怀版