网易首页 > 网易号 > 正文 申请入驻

中科院用百万手机视频打造活4D世界,超越李飞飞

0
分享至

哈喽,大家好,我是小今。这篇来聊聊AI界的大突破!之前4D建模非要多镜头贵设备,中科院偏用普通视频搞定,直接打破行业困局。

还在为AI建模要花大价钱买多镜头设备发愁?中科院自动化所和CreateAI联手推出的NeoVerse,用100 万段普通手机拍的单目视频,就搭起了能理解动态世界的4D模型。这一下,把过去只能靠昂贵设备采集数据的4D技术,拉到了普通人也能接触的范围内。





曾经,AI的“动态盲区”



这时候,就得4D模型出马了。4D模型比3D多了一个“时间”维度,它不仅知道物体在哪里,长什么样,更关键的是,它还知道这些物体“怎么动”“什么时候动”,以及它们运动的规律。

你想啊,游戏里的人物要跑跳,自动驾驶的汽车要在路上穿梭,这些都离不开对动态世界的精确理解。所以,4D模型在游戏、电影特效、机器人、自动驾驶模拟这些领域,简直就是“圣杯”一样的存在。

可过去,要造这个“圣杯”的代价实在太高了!这主要卡在数据上。





第一道坎:数据,贵到离谱

想象一下,如果你想让AI看懂一个复杂的动态场景,比如街上的车流、公园里的人群,你不能只用一个摄像头拍,因为一个摄像头总会有盲区。

你得用好多个摄像头,从不同角度同时拍同一个场景,而且每个摄像头都要精准地同步,才能捕捉到完整的动态信息。这种“多镜头”拍摄,专业术语叫“成对视频”,一个视频作为输入,其他视频作为参考,互相印证。



但你想想,光是一个专业级相机就价格不菲,要是来一套动辄几十万甚至上百万的多镜头设备,还只能在固定场景下拍,比如拍个实验室里的人体动作,或者某个工厂的流水线。你让它去拍街上的车水马龙,拍公园里熙熙攘攘的人群?那简直是天方夜谭,设备根本就带不动,也布设不了。

有人说,拿手机拍的单目视频不行吗?就一个镜头,不是更方便吗?想法是好的,但现实很骨感。以前的技术,如果你只用一个手机镜头,想让AI从中提取出动态信息,就得先花好几天,把视频一帧一帧地拆开,然后费力地计算每帧画面的深度信息、物体位置,再把这些碎片化的信息拼凑起来。

这个过程不仅慢得让人抓狂,而且对海量的手机视频来说,根本无法高效处理。这就形成了一个死循环:4D模型前景广阔,但数据采集又贵又慢,成了制约其发展的最大瓶颈。





NeoVerse的奇迹:手机视频也能“活”起来

正当大家对着这个难题一筹莫展的时候,NeoVerse横空出世了。它的厉害之处在于,彻底跳出了“必须多镜头、必须慢处理”的传统思维。

它能干啥?你只需要随手用手机拍一段普通的视频,不管是拍猫跑来跑去,还是拍汽车在路上行驶,把这段视频“喂”给NeoVerse,短短几秒钟,它就能给你生成一个活生生的、能理解动态世界的4D模型!





核心秘密:双向追踪与运动高斯点

NeoVerse之所以能化腐朽为神奇,背后藏着两个特别聪明的核心技术。

咱们人看东西是很有趣的,我们不光能看到物体现在在哪儿,我们还会下意识地回想它刚刚是怎么动的,甚至预测它下一秒可能会往哪儿去。NeoVerse也学会了这招。

它拿到一段视频后,会把视频帧分成两部分来处理:一部分是“往前看”,分析物体从过去到现在的运动规律。另一部分是“往后看”,逆向推导物体从现在到过去的变化轨迹。通过这种双向的推算和校正,它就能超级精准地算出视频里每一个物体移动的速度和转动的方向。

举个例子,你拍一辆行驶中的汽车,NeoVerse不仅知道它现在在哪里,还能准确判断它下一秒会往前挪多远,甚至会不会打方向盘转弯。这样,即使它后续要生成这辆车的其他视角视频,也不会出现那种突然跑偏或者消失的尴尬情况。



以前的3D建模,就像是用无数个小方块或者小三角形去搭建一个物体。NeoVerse则更精细,它把整个动态场景拆解成无数个微小、带有特殊属性的“高斯点”。你可以想象成无数个带有魔法的小粒子。

这些粒子可不简单,它们每个点都带着丰富的“基因信息”:它在三维空间里的精确位置、它的大小、它的颜色,这还不够!最关键的是,每个高斯点还自带了“运动属性”,比如这个点每秒钟会移动多少米,每分钟会旋转多少度,甚至它能“存在多久”都会被记录下来。

这样一来,不管是视频里行人悠闲地散步,还是风吹树叶轻微地摇摆,这些带有动态信息的高斯点都能将其精准无误地还原出来。它们就像拥有了生命一样,共同构建出一个活生生的44D动态世界。





没有“多镜头”?NeoVerse自己“造”!

更让人拍案叫绝的是,NeoVerse还解决了另一个老大难问题:没有多视角数据怎么训练?前面说了,最好的训练数据是多镜头同时拍的,可咱们手机哪有那本事?NeoVerse可不会傻等着,它非常“聪明”,自己就能“造”出训练数据!

它是这么干的:先拿一段普通的手机视频,快速地挑出几个关键的帧,快速地搭建一个初步的4D模型。然后,它会利用这个初步的模型,自己“渲染”出从不同角度看这段视频的画面,就好像给这段视频瞬间加了无数个“虚拟摄像头”一样。这样,就有了大量的“多视角”数据来训练自己。

不仅如此,NeoVerse还特别“狡猾”,它在训练的时候,会故意模拟咱们手机视频经常出现的“缺陷”。比如,视频里有物体被挡住了一部分,或者运动太快导致画面边缘模糊不清。NeoVerse会特意去模拟这些“不完美”,让模型在训练时就学会怎么去处理这些“脏数据”。

所以,即使咱们用的是普通得不能再普通的手机视频,它也能学习得非常扎实,最终生成高质量的新视角内容。这种“自给自足”还能“自找麻烦”的训练方式,让NeoVerse对各种真实世界场景的适应性大大增强。





性能惊艳:快,准,稳!

光说不练假把式,NeoVerse在实际测试中的表现,简直是“惊艳”两个字都无法完全形容。

先说速度。它在单张A800显卡上,处理一段81帧的视频,最快只要短短20秒!这速度比之前那些需要耗费大量时间去逐帧计算的老技术,快了何止好几倍?效率简直是质的飞跃。



再说质量。NeoVerse生成的新视角视频,无论是画面的主体稳定性,还是背景的连贯性,亦或是物体运动的流畅度,都比现有的大多数方法要好得多。

比如,如果你用它来模拟自动驾驶时的视角切换,它能精准地还原路边的建筑,行驶中的车辆,不会出现物体突然消失不见,或者画面扭曲变形那种“穿帮”的情况。你看到的,就是一个真实且平滑过渡的动态世界。这种“快、准、稳”的结合,让NeoVerse在实用性上迈出了一大步。





未来已来:4D技术走进寻常百姓家

想象一下,在游戏制作里,设计师们不用再费劲巴拉地去搭建复杂的静态场景,然后手动给每个物体添加动画。有了NeoVerse,他们可以快速生成各种可交互的动态地图,玩家可以在里面自由探索,体验感瞬间拉满。

在自动驾驶模拟领域,更是如虎添翼。以前为了训练AI,需要投入巨大的人力物力去采集各种路况数据,而且场景是有限的。现在,NeoVerse能够无限生成不同路况、不同天气条件下的训练数据,让自动驾驶的AI在虚拟世界里“身经百战”,更快、更安全地走向现实。



有了NeoVerse,你就有可能把这段视频“加工”成从侧面、甚至是从高空俯瞰的效果,就像你当时坐在VIP专属视角一样!这简直是把普通人的手机视频,瞬间提升到了专业级的制作水平。



这项不用昂贵设备,只靠咱们手里的普通手机视频就能搭建4D模型的技术,正在悄悄地改变AI理解真实世界的方式。它不仅会大幅降低4D技术的门槛和成本,更会推动各行各业的创新,让“AI看懂动态世界”的未来,比我们想象中来得更快,更触手可及。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
研究:亚马逊联网卫星亮度过高,足以干扰天文研究

研究:亚马逊联网卫星亮度过高,足以干扰天文研究

IT之家
2026-01-25 19:50:18
起底嫣然医院8位创始人,除了李亚鹏王菲,还有两位医美大佬

起底嫣然医院8位创始人,除了李亚鹏王菲,还有两位医美大佬

数字财经智库
2026-01-25 18:18:57
成都、青岛、厦门、福州、广州等城市相继宣布:中小学取消非毕业年级“期末统考”

成都、青岛、厦门、福州、广州等城市相继宣布:中小学取消非毕业年级“期末统考”

鲁中晨报
2026-01-23 15:39:03
浙江包工头多器官衰竭,医院一直没找出病因,母亲煮饺子察觉蹊跷

浙江包工头多器官衰竭,医院一直没找出病因,母亲煮饺子察觉蹊跷

二十一号故事铺
2024-10-18 19:35:03
生姜立大功?美国研究发现:生姜能在36小时清除60%老化细胞?

生姜立大功?美国研究发现:生姜能在36小时清除60%老化细胞?

蜉蝣说
2026-01-24 16:45:07
张本美和成功夺冠!4:3击败早田希娜,喜极而泣,登上最高领奖台

张本美和成功夺冠!4:3击败早田希娜,喜极而泣,登上最高领奖台

国乒二三事
2026-01-25 13:29:04
印尼一巫师为炼就通天法力,连杀42名女子:我的目标是70个

印尼一巫师为炼就通天法力,连杀42名女子:我的目标是70个

有书
2026-01-24 23:05:03
释永信塌房后,被曝为女明星开光,除了李湘外,多名女星被拉下水

释永信塌房后,被曝为女明星开光,除了李湘外,多名女星被拉下水

阿器谈史
2026-01-08 13:16:09
早干嘛去了?荷兰又气急败坏,称中方已读不回,被中欧踢出谈判桌

早干嘛去了?荷兰又气急败坏,称中方已读不回,被中欧踢出谈判桌

军机Talk
2026-01-24 14:55:50
Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

930老友记
2026-01-24 21:55:17
华西村的金牛,现在看来真是一次成功的投资

华西村的金牛,现在看来真是一次成功的投资

次元君情感
2026-01-25 02:45:28
数钱手势讽刺裁判!迪亚洛:我这辈子从未经历过这样的事情 真无语

数钱手势讽刺裁判!迪亚洛:我这辈子从未经历过这样的事情 真无语

狼叔评论
2026-01-25 01:50:08
中国大陆最北端宜家即将闭店,清仓商品遭大量顾客争抢,官方客服:人流量很大

中国大陆最北端宜家即将闭店,清仓商品遭大量顾客争抢,官方客服:人流量很大

齐鲁壹点
2026-01-25 20:14:24
坏!《黑神话》破解版再获重大进展:已支持Intel CPU

坏!《黑神话》破解版再获重大进展:已支持Intel CPU

游民星空
2026-01-25 16:59:45
“留学一年嘴都变大了”,女学生面相变化图走红,牢A果然权威

“留学一年嘴都变大了”,女学生面相变化图走红,牢A果然权威

泽泽先生
2026-01-25 21:55:27
3男3女出租屋性交易:价格曝光,被抓画面流出,事发全过程披露

3男3女出租屋性交易:价格曝光,被抓画面流出,事发全过程披露

博士观察
2026-01-25 21:18:06
张伯鑫生日许愿,喊话郭德纲希望能帮帮他,怀念从前“南郭北张”

张伯鑫生日许愿,喊话郭德纲希望能帮帮他,怀念从前“南郭北张”

杨仔述
2026-01-25 20:00:13
美媒:2030年中国将有1000架歼-20;歼-20上千没问题,2030不好说

美媒:2030年中国将有1000架歼-20;歼-20上千没问题,2030不好说

啸鹰评
2026-01-24 23:06:57
33次扑救!李昊留洋欧洲最新消息传来,中国队大换血:12人要离队

33次扑救!李昊留洋欧洲最新消息传来,中国队大换血:12人要离队

侃球熊弟
2026-01-26 00:00:42
重磅!官方宣布:禁止房子大降价,“限跌令”重出江湖!

重磅!官方宣布:禁止房子大降价,“限跌令”重出江湖!

常州壹楼市
2026-01-17 23:59:54
2026-01-26 00:52:49
少女心盗梦贼
少女心盗梦贼
少女盗梦贼
219文章数 100关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

时尚
本地
教育
手机
数码

看了鲁豫对章小蕙的采访,最大感触是这一点

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

教育要闻

留学生的父母,有些话一直没说!

手机要闻

荣耀泡泡玛特联名手机开售,后续新机再曝

数码要闻

AMD最强APU更新!锐龙AI Max+ 400详细规格曝光:5.2GHz CPU、3.0GHz GPU

无障碍浏览 进入关怀版