网易首页 > 网易号 > 正文 申请入驻

清华与咪咕发布ImViD沉浸式体积视频数据集,让VR极限接近真实!

0
分享至

文/ YZX&WSQ

引言:最近什么让VR圈沸腾?不是Vision Pro上新,也不是Meta的元宇宙裁员潮,而是“体积视频技术”让大众看到了元宇宙的曙光。一秒穿越!留住时空的技术已经来了?

当Meta用天价堆砌「元宇宙」却困在卡通画风,当Vision Pro用户为3-DoF的“电子橱窗”眩晕买单,当影视巨头砸千万搭建穹顶摄影棚却只能产出“人像手办”……我们猛然发现——没有高保真体积视频的元宇宙,不过是高清版的《我的世界》。

今天为大家带来清华大学-咪咕团队发表于CVPR 2025的最新工作《ImViD:ImmersiveVolumetric Videosfor Enhanced VR Engagement》。作者用360°真实光场+多模态6-DoF自由漫游,将VR体验从“隔着玻璃看展”推向“穿越时空的在场感”。

背景与挑战:我们距离高逼真的数字世界还有多远?

随着Meta Quest和Apple Vision Pro等VR头显的兴起,人们对沉浸式体验的需求愈发强烈。然而,传统2D视频或静态3D模型始终难以突破“真实感”的桎梏,最新的技术也面临着“形似神离”的困境:

2019年Google提出沉浸式光场(Immersive Light Field),虽支持6-DoF交互,但受限于固定机位的拍摄方式,仅覆盖场景的正面视角,交互范围有限,且缺乏多模态数据;

2022年 Apple提出沉浸式视频(Immersive Video),虽以高分辨率和环绕式立体声著称,但仅提供3-DoF的观看体验,缺少空间位置的交互自由度。此外,这种呈现方式无法提供真实场景的深度感知,导致视觉系统与前庭感知的冲突,用户在长时间观看后易产生眩晕和疲劳;

2024年 Infinite Reality推出的空间捕获技术(Spatial Capture),通过穹顶式“由外向内(Outside-looking-in)”的采集方案实现了高分辨率、高真实感的动态场景建模。然而,受限于封闭式硬件架构,仅能针对狭小空间内以人或物体为中心的局部场景进行捕捉,缺乏复杂背景细节与自然光照,且设备部署复杂、成本高昂,难以拓展至开放环境或大规模商业应用。

沉浸式媒体形式的分类及发展方向示意图:体积视频是顺应时代信息升维的产物,有望成为未来的主流媒体形式。

如何打破瓶颈?

清华-咪咕团队联合推出“沉浸式体积视频(Immersive Volumetric Video)”概念,从四个维度突破传统体积视频的局限:

1.全视角:360°真实场景。团队实现动态前景+复杂背景完整覆盖,突破固定空间拍摄限制;

2.大空间:大范围6-DoF交互。可移动拍摄车扩大采集范围,支持用户六自由度自由探索每一处细节;

3.多模态:光声同步采集。5K@60FPS视频+同步音频采集,高保真光声场融合重建,视听反馈随动无延迟;

4.长时长:长时间高帧率内容。1-5分钟高清动态光场内容告别“片段式”体验!

该工作构建了一套完整的生产管线:从系统搭建、采集策略设计、光/声场融合重建,到最终高保真实时渲染交互。为下一代 VR 沉浸内容提供基准数据与方法参考。

相关成果发表于国际计算机视觉顶级会议IEEE CVPR 2025并入选为Highlight(亮点工作)。

[CVPR 2025 Highlight] ImViD:Immersive Volumetric Videos for Enhanced VR Engagement

核心贡献:ImViD——沉浸式体积视频全流程制作管线

团队推出全球首个面向大空间的多模态体积视频数据集ImViD以支持用户可自由移动的完全沉浸式体验,为体积视频的研究和应用提供了新的路径:

硬件革新:自搭建46台GoPro相机阵列+可移动拍摄车,模拟人类视角的观看习惯,高效高密度覆盖采集空间;

数据规模:7大开放世界真实室内外场景(歌剧、会议、教学等),5K分辨率+60FPS,总时长超38分钟,13万帧

动态捕捉:支持静态定点动态移动双模式拍摄,首次实现“边走边拍”的多视角高密度时空光场采集;

开放挑战:所有动态场景数据公开,推动沉浸式体积视频算法与应用突破!

ImViD系统搭建与数据采集

团队设计并搭建了一个可远程控制的移动式平台,搭载 46 台GoPro 摄像机同步触发,可实现高效光、声场采集:

  • 多视角同步音视频采集(分辨率 5312×2988, 60FPS, 1-5 min);
  • 定点采集 + 移动轨迹拍摄模式(支持背景重建与动态前景追踪);
  • 毫米级相机阵列时间同步机制。

数据集中包括了各式各样的生活常见室内外动态场景,具有丰富的前背景,涵盖了慢速运动和快速运动的内容,对当前重建算法提出了更高的要求,能进一步挖掘算法的瓶颈,促进社区的进步。

ImViD光声场融合重建

动态光场重建:

作者在 Spacetime Gaussian (STG) 的基础上,提出了时空一致性更强的改进方法 STG++,解决了原方法在动态场景下的漂移与色差问题。

为了消除多相机之间的色彩差异,STG++ 为每个相机引入仿射颜色变换:

该变换在渲染损失中被联合优化,以确保多视角颜色对齐。此外,作者还在重建过程中对时间维度执行了致密化操作,让高斯在时间维度上也可控。

自由声场重建:

作者提出一种不依赖神经网络训练的几何驱动声场建模方法,基于 HRTF(头相关传递函数)和 RIR(房间脉冲响应)进行空间音频渲染。具体步骤如下:

(1)声源定位:通过麦克风阵列获取声源位置与用户耳朵位置;

(2)距离衰减建模:计算声源到用户耳朵的距离衰减;

(3)空间音频渲染:基于 HRTF 和 RIR 进行空间音频渲染。

从多个同步相机采集的音视频数据构建声场的方案在国内外鲜有团队尝试,但这类采集方式非常贴近人们日常拍摄生活场景的习惯,因此该团队提出的方案具有极大的推广价值。

实验结果:STG++领跑,声场融合,沉浸感拉满!

光场重建:改进算法STG++以31.24 PSNR、110 FPS刷新性能,解决色彩闪烁与运动断层难题;

声场合成:用户研究显示,61.9%专家认为空间音频感知“优秀”,90%认可沉浸感;

实时交互:单卡3090实现6-DoF多模态VR体验,60FPS丝滑渲染,视听反馈随动无延迟!

未来展望:打开数字孪生与元宇宙的大门

ImViD不仅为学术界提供全新基准,更在影视、教育、医疗等领域展现潜力:

●动态光场重建:推动长时复杂场景的高效建模;

●声场合成:无需训练数据,支持移动声源定位,非常适合日常记录(Causal Capture);

●产业落地:助力智慧医疗、教育、远程协作,智慧文旅如虚拟演唱会、景点游览等应用场景。同时将支持移动端交互渲染,让4D视频具有更多可能。

项目主页:

https://yzxqh.github.io/ImViD/

论文地址:

https://arxiv.org/pdf/2503.14359

论文/代码/数据:全面开源,欢迎挑战!(持续更新中)

致谢:本研究获国家重点研发计划、国家自然科学基金、清华-咪咕智能光场与交互技术联合研究中心和北京市光场共性技术平台支持。

*声明:企业通稿非VR陀螺官方稿,法律问题一律与VR陀螺无关。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

安安说
2026-03-28 11:54:14
教师大势已明朗:不出意外,2026年中国教师队伍,会迎来4大变化

教师大势已明朗:不出意外,2026年中国教师队伍,会迎来4大变化

小谈食刻美食
2026-04-02 08:46:43
篮球巨星深陷嫖娼风波,对方特殊身份令人咋舌,到底真相几何?

篮球巨星深陷嫖娼风波,对方特殊身份令人咋舌,到底真相几何?

干史人
2026-03-30 22:05:03
足坛悲喜夜:拜仁超级逆转绝杀,皇马掉链子遭绝杀

足坛悲喜夜:拜仁超级逆转绝杀,皇马掉链子遭绝杀

墨史轩
2026-04-05 01:52:15
慌了!部分央国企校招,已经开始卡学历卡出身了!

慌了!部分央国企校招,已经开始卡学历卡出身了!

金哥说新能源车
2026-04-05 03:56:46
浑身都是“寄生虫”的3种鱼,卖鱼商贩都不敢吃,白送也千万别要

浑身都是“寄生虫”的3种鱼,卖鱼商贩都不敢吃,白送也千万别要

哄动一时啊
2026-02-27 23:35:44
血战85分钟!王曼昱4-2桥本团灭日本女乒!评论区却一片嘲讽

血战85分钟!王曼昱4-2桥本团灭日本女乒!评论区却一片嘲讽

罗纳尔说个球
2026-04-05 02:13:27
特鲁姆普创造历史,没想到赛后他会这么说,赵心童压力很大

特鲁姆普创造历史,没想到赛后他会这么说,赵心童压力很大

生活新鲜市
2026-04-04 09:57:25
退休人员也要缴费了!4月起执行,每月扣多少、谁能免,一次说清

退休人员也要缴费了!4月起执行,每月扣多少、谁能免,一次说清

原梦叁生
2026-04-04 12:59:46
女人要是想出轨找野男人,那真是花样百出!

女人要是想出轨找野男人,那真是花样百出!

黯泉
2026-03-12 19:22:36
大牌又闹脾气消极罢工!上海或爆重大危机,沪迷:真把自己当爷了

大牌又闹脾气消极罢工!上海或爆重大危机,沪迷:真把自己当爷了

后仰大风车
2026-04-04 07:05:11
郭富城五个月小女儿白得抢镜,继承爸妈神基因,三个女儿都好美

郭富城五个月小女儿白得抢镜,继承爸妈神基因,三个女儿都好美

情感大头说说
2026-04-05 00:02:12
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

今日养生之道
2026-03-23 11:46:39
真牛!10公斤残骸砸中Model Y车顶没击穿,特斯拉又被讨论疯了

真牛!10公斤残骸砸中Model Y车顶没击穿,特斯拉又被讨论疯了

华人生活网
2026-04-05 04:13:12
四强全部诞生!国乒3胜2负,王曼昱4-2,王楚钦、孙颖莎赢得艰难

四强全部诞生!国乒3胜2负,王曼昱4-2,王楚钦、孙颖莎赢得艰难

郝小小看体育
2026-04-05 03:22:30
终于谈完,王毅连接20多个电话,美伊战局突变,最后一击近在眼前

终于谈完,王毅连接20多个电话,美伊战局突变,最后一击近在眼前

起喜电影
2026-04-05 04:48:22
国家一级演员陈丽云被捕

国家一级演员陈丽云被捕

桑未落
2026-03-28 22:50:25
叶檀迎来今年第一次复查,直言自己害怕死,即使拥有肿瘤顶级团队

叶檀迎来今年第一次复查,直言自己害怕死,即使拥有肿瘤顶级团队

白面书誏
2026-04-03 16:39:03
清明前夕!卸下伪装,翁帆坦然发声,21年陪伴究竟图什么?

清明前夕!卸下伪装,翁帆坦然发声,21年陪伴究竟图什么?

秋姐居
2026-04-04 14:38:03
同样给蔚小理代工,为什么江淮活了,海马、力帆却掉队了?

同样给蔚小理代工,为什么江淮活了,海马、力帆却掉队了?

雷科技
2026-04-03 15:04:02
2026-04-05 06:08:49
VR陀螺 incentive-icons
VR陀螺
关注VR行业热点、趣闻、产业
4724文章数 5849关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

特朗普发布视频宣称“打死多名伊朗军事领导人”

头条要闻

特朗普发布视频宣称“打死多名伊朗军事领导人”

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

亲子
本地
手机
数码
教育

亲子要闻

我这个00后舅舅怎么这么会带娃

本地新闻

跟着歌声游安徽,听古村回响

手机要闻

华为新机再曝,旗舰、阔折叠、常规折叠都有!

数码要闻

今年新款AirPods Pro、Apple TV值得等吗?升级方向曝光

教育要闻

中考五五分流成历史,各省大幅扩招普高

无障碍浏览 进入关怀版