网易首页 > 网易号 > 正文 申请入驻

95后浙大博士生开发全新视图合成系统Neural Body,稀疏视角输入即可合成360°人体视图|专访

0
分享至

  回想一下你曾经玩过的 3D 游戏:游戏场景可随鼠标前后左右任意角度移动,玩家也可获得完全沉浸式的体验感受。

  与此相同,假如未来 3D 观球方式普及,你也可以用手指移动任意角度,清楚地观看球赛中的扣篮和进球。

  图 | 用 4 个 RGB 相机实现自由视点(来源:受访者)

  近日,浙江大学计算机辅助设计与图形学国家重点实验室的 “百人计划” 研究员、博士生导师周晓巍团队的论文,发表在计算机视觉顶会 CVPR 2021 上(IEEE Conference on Computer Vision and Pattern Recognition)。其中,周晓巍担任通讯作者,其学生彭思达为第一作者。

  图 | 相关论文(来源:受访者)

  研究主要成果是一款名为 Neural Body 的新型视图合成技术的实现与发展。综合来看,Neural Body 在使用时,其选取的输入视点较少,还能更好地捕捉人物的动作,高效完成 3D 立体成像。

  这也意味着,将来的某一天,使用更少的摄影机,就可为全球各地观众带来一场亲临现场般的沉浸式观球体验。

  图 | 从单个视频实现人体重建与视图合成(来源:受访者)

  少量角度拍摄,合成 360° 人体 3D 视图

  传统的 3D 视图合成技术一般比较依赖于 3D 重建,这种技术主要有两大限制 :一个是重建质量有限,导致视觉真实感较差;另一个是没办法处理一些反光表面或者透明区域。

  随着技术的推进,近年来基于神经网络实现三维场景表示与渲染的技术逐步发展,以谷歌的 2D 图像转 3D 模型 NeRF 为代表,它能较好地解决上述问题中的一部分。

  图 | Neural Body 的基本概念,Neural Body 可以基于神经网络从一组隐编码生成人体在不同帧的三维影像(来源:受访者)

  但是,周晓巍表示:“我们意识到,还有一个问题没有解决,那就是动态场景的视图合成。” 他说,当场景是随着时间而变化时,我们需要能够建模这种变化,NeRF 作为针对静态场景的技术对此束手无策,而这正是该团队研发 Neural Body 技术的初衷。

  图 | 和其他模型的对比(来源:受访者)

  如果沿用静态视图合成的思路,一种方法是采用多视点的拍摄,当输入的图像角度足够多,理论上就能实现每一时刻单独去学习 3D 表示及渲染图像的目的。

  但这需要大量相机对同一个人进行不同视角的拍摄,成本非常之高。“所以我们想的是怎样才能降低采集的成本,用非常稀疏的视角输入,比如三四个 RGB 相机就可以完成视图采集。今天,Neural Body 真的做到了。”周晓巍说。

  图 | 隐式神经表示与结构化隐编码(来源:受访者)

  概括来说,Neural Body 的贡献主要有以下几点:

  •   能从稀疏的多视图视频合成动态人体的新视图,无需预先扫描人体模板;

  •   提出了一种新的动态人体隐式表示,使研究人员能更有效地利用视频中所有帧的信息来学习人体的 3D 表示;

  •   极大地提升了动态人体 3D 视图合成的效果。

  渲染出各个视角的图像

  上文提到的 NeRF 是基于一个叫辐射场(radiance field)的 3D 表示方式来完成视图合成。那么,什么是辐射场?

  “你可以把辐射场理解成 3D 空间内每个点所发出光线的集合,记录了每个点的光线颜色及密度,基于辐射场就可以渲染出各个视角的图像。” 周晓巍表示。

  对静态视图合成技术来说如 NeRF,当处理动态场景的时候,它需要针对不同时刻去学习不同的辐射场,而这些辐射场之间没有关联,因此学习效率很低。

  图 | 视图合成技术的对比(来源:受访者)

  Neural Body 与众不同的地方就在于,其假设不同时刻的辐射场都由同一组隐编码来生成,这一组隐编码附着在人体模型上,会随着人体运动。这样就可建立起不同时刻辐射场之间的联系,从而充分利用视频中所有时刻的信息,来学习人体的 3D 表示。

  针对此方法,他们创建了一个多视图数据集来进行评估,该数据集使用一个有 21 个同步摄像头的多摄像头系统,共捕获 9 个动态人体视频,并选择 4 个均匀分布的摄像机进行训练,使用剩余的摄像机进行测试。

  所有序列的长度都在 60 到 300 帧之间。结果表明,当人物进行复杂的运动,包括旋转、太极、手臂摆动、跳舞、拳击和踢腿等动作时,都能实现较好的重建与视图合成。

  图 | 呈现各种动作的人的 3D 表示(来源:受访者)

  通过对比可以发现,本次方法相比其他方法,能呈现出更多人物外观细节,特别是对于穿着宽松服装的实验者来说,Neural Body 可以精确地进行渲染,以下图女士为例,使用其他方法出来的效果图,其衣服和身体紧贴,而 Neural Body 出来的效果中,可明显看出衣服的轮廓。

  图 | Neural Body 渲染的衬衫不会与人体紧密相连(来源:受访者)

  未来有望大规模应用于电商直播和 VR 看房

  随着 Neural Body 的不断迭代,周晓巍下一步会逐步优化技术。目前有几个地方亟待优化:

  •   改进计算效率;

  •   生成可驱动的人体模型;

  •   实现重光照。

  Neural Body 目前依赖于对人体动作的捕捉。在运动捕捉稳定性上,该团队近两年正在逐步提高。随着算法的不断迭代、以及硬件设备的改善,当 Neural Body 效率能够稳步提升到一个更高的层次后,实现商用将会指日可待。

  对于未来的应用场景,周晓巍表示:“随着 3D 技术的发展,VR 产业正在迅速崛起。无论是对物品进行 360° 展示,还是体育比赛的自由视点观赛,或者说全息的沉浸式远程会议,都是 VR 将来的重要应用领域。而这些应用背后的关键技术正是视图合成。”

  周晓巍认为,视图合成技术在短期内可能很快实现大规模应用领域为:电商领域、场景浏览如 VR 看房等。

  从长远看,该技术的最大刚需是在“人人交互”上,如今天我们已经习以为常的语音连线和视频连线。可以想象,当 Neural Body 的技术更成熟后,开会就能以 3D 形式呈现,从而实现真正的远程零距离交流,就像坐在一起一样自然真实。

  目前,该研究的相关代码已经在 GitHub 上开源,主要使用 Python 编程,少量代码使用 Shell 编程。该工作的合作者,还包括浙江大学的鲍虎军教授、张远青、帅青,香港中文大学的徐英豪,以及康奈尔大学的王倩倩。

  坚定学术生涯,选择回国发展

  周晓巍属于实打实的“学习他人,为我所用”,2008 年其本科毕业于浙江大学,2013 年获得香港科技大学博士学位,随后三年间,他在美国宾夕法尼亚大学 GRASP 机器人实验室从事博士后研究。

  图 | 周晓巍(来源:受访者)

  正是这三年的博后研究,才使他坚定了 3D 视觉的研究方向。随后,他带着热忱与梦想踏上了回国归途。

  谈及回国原因,周晓巍觉得这是一个正确的选择,他看好国内的发展,认为国内相比国外在某些方面具有优势。

  他说:“我个人感触比较大的是产学研的合作机会比较多。比如目前我们跟商汤、华为都有非常紧密的合作,通过这种产学研的结合,我们的研究成果既有对学术前沿的探索,又能根据实际需求去攻克一些技术瓶颈。与此同时,国内的 3D 视觉领域还处于新兴发展阶段,也需要我们回来一起把这个方向给发展壮大起来,不断缩短与国际领先水平之间的差距。

  而之所以没有选择进入业界,是因为他更喜欢学校的氛围。他觉得,从研究方向和周期上来说,在学校的自由度会大一些。

  另一方面,在学校有机会接触到一些新萌发的想法和智慧 —— 这里往往聚集着一些最聪明,最有才华和想法的学生。通过和他们一起讨论与合作,可以把好的想法快速落地变成现实。

  并且,浙大本身也有很多优秀学生。比如,本次研究中的彭思达虽然才 25 岁,但实战经验已经相对颇丰。

  他目前是浙江大学 CAD&CG 国家重点实验室三年级博士研究生,研究三维重建与物体位姿检测。2019 年,彭思达参加中国研究生人工智能创新大赛,在一千多支参赛队伍中获得第一名。2020 年曾获评 CCF-CV 学术新锐奖,该奖项每年由中国计算机协会视觉专委会在前三年的领域内博士中评选三人,相关论文开源到 GitHub 后,已获得 Star 数 2000 余次。

  图 | 彭思达(来源:受访者)

  谈及研究过程,彭思达告诉 DeepTech:“一开始周老师让我做这个研究时,我几乎没有头绪。当时他给我看了 NeRF 和 DynamicFusion(此前动态三维重建的一个经典工作)这两篇文章。仔细研究后,我发现可以利用统计人体模型来整合时序信息,于是就有了 Neural Body 这篇文章。在此之前,我对统计人体模型一点了解都没有,多亏了组里帅青同学的帮助。全部做下来,最大的感触是:个人的知识总是有限的,要利用好实验室的资源,才能做出扎实的工作。

  -End-

  http://xzhou.me/

  https://arxiv.org/pdf/2012.15838.pdf

  https://github.com/zju3dv/neuralbody

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宁波大学研究生录取通知书英文单词少字母,学校:将重新制作

宁波大学研究生录取通知书英文单词少字母,学校:将重新制作

澎湃新闻
2024-06-17 13:24:27
电磁脉冲弹?三大国都捂得紧紧的,怎么会让黎巴嫩在沙瀑里捡到?

电磁脉冲弹?三大国都捂得紧紧的,怎么会让黎巴嫩在沙瀑里捡到?

客馆游国
2024-06-17 14:40:42
英媒奉劝美国:与其把精力放在压制中国科学上,不如放在推动自己进步上

英媒奉劝美国:与其把精力放在压制中国科学上,不如放在推动自己进步上

参考消息
2024-06-15 14:03:26
罗马尼亚队史第二次在欧洲杯单场进3球,上一次是2000年3-2英格兰

罗马尼亚队史第二次在欧洲杯单场进3球,上一次是2000年3-2英格兰

直播吧
2024-06-17 22:32:04
新型卖淫方式,让人预想不到,但却真实存在!

新型卖淫方式,让人预想不到,但却真实存在!

雪影的情感
2023-11-18 11:51:16
马伊琍16岁女儿为爸爸过父亲节,文章配合女儿歪头卖萌画风超有爱

马伊琍16岁女儿为爸爸过父亲节,文章配合女儿歪头卖萌画风超有爱

娱絮
2024-06-17 10:13:10
尴尬,塔图姆是21世纪唯一一位在多场总决赛正负值-30的球员

尴尬,塔图姆是21世纪唯一一位在多场总决赛正负值-30的球员

懂球帝
2024-06-17 18:16:11
搞政治攀附,参加迷信活动!落马省委书记下属陈丽萍被公诉

搞政治攀附,参加迷信活动!落马省委书记下属陈丽萍被公诉

鲁中晨报
2024-06-17 16:28:04
白酒为什么不能冰镇之后喝?网友:在医院门口喝都赶不上趟

白酒为什么不能冰镇之后喝?网友:在医院门口喝都赶不上趟

奇特短尾矮袋鼠
2024-06-15 14:31:42
一高校院长,拟任成都市市管正局级领导职务

一高校院长,拟任成都市市管正局级领导职务

鲁中晨报
2024-06-17 20:39:02
不雅作品流出,百万粉丝马姐被实名举报,网友:丢河南人的脸

不雅作品流出,百万粉丝马姐被实名举报,网友:丢河南人的脸

三月柳
2024-06-17 12:05:28
缅北女魔头魏榕怪癖,活剥“肉灵芝”是小事,最恐怖的是“驴耳”

缅北女魔头魏榕怪癖,活剥“肉灵芝”是小事,最恐怖的是“驴耳”

马尔科故事会
2024-06-15 11:10:21
人社部发布一则通知,事关养老金调整机制,蛮重要的,一起看看

人社部发布一则通知,事关养老金调整机制,蛮重要的,一起看看

小强财艺
2024-06-16 21:24:47
上雷霆手段:中国海警登菲船!菲媒沉默一整天,仍持续失联中

上雷霆手段:中国海警登菲船!菲媒沉默一整天,仍持续失联中

笔墨V
2024-06-17 21:14:30
2024年养老金调整比例3%,退休人员每月3000元,还能涨100元吗?

2024年养老金调整比例3%,退休人员每月3000元,还能涨100元吗?

碎月导师
2024-06-17 18:01:24
倒戈!男篮国手坚持参加NBA选秀 排名跌出前100 被媒体冷嘲热讽

倒戈!男篮国手坚持参加NBA选秀 排名跌出前100 被媒体冷嘲热讽

林小湜体育频道
2024-06-17 17:50:45
“哥哥硬吗”,女儿国国王满嘴虎狼之词,这谁顶得住

“哥哥硬吗”,女儿国国王满嘴虎狼之词,这谁顶得住

一个岛岛
2024-06-16 16:37:59
严明党的政治纪律 坚决维护党中央权威和集中统一领导

严明党的政治纪律 坚决维护党中央权威和集中统一领导

人民资讯
2024-06-17 06:08:10
沈阳地头蛇看上加代媳妇,趁拍戏对她侵犯,加代用尽力量复仇杀红眼

沈阳地头蛇看上加代媳妇,趁拍戏对她侵犯,加代用尽力量复仇杀红眼

古今档案
2024-05-20 16:03:56
镜报:哈兰德在西班牙度假时遇防爆警察突击检查,被要求掏身份证

镜报:哈兰德在西班牙度假时遇防爆警察突击检查,被要求掏身份证

直播吧
2024-06-17 19:09:11
2024-06-17 23:16:49
DeepTech深科技
DeepTech深科技
麻省理工科技评论独家合作
13932文章数 512011关注度
往期回顾 全部

科技要闻

为什么你的iPhone,肯定用不上"苹果AI"?

头条要闻

北约秘书长称正讨论将核武器置于待命状态 俄方回应

头条要闻

北约秘书长称正讨论将核武器置于待命状态 俄方回应

体育要闻

豪华阵容,原始战术 英格兰10亿天团就这?

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

人均养老金上调3% 怎么年轻人吵翻了?

汽车要闻

传奇新篇章 全新一代大众迈腾来了

态度原创

时尚
家居
旅游
数码
教育

永不过时的高级感,这个风格已经美了20年了

家居要闻

研己实景 古典与现代的交融

旅游要闻

游客放狗进赛里木湖追天鹅,景区回应!

数码要闻

ILOVBEE B87 客制化三模键盘知速轴开售,299 元

教育要闻

今年高考评卷情况怎么样?带你直击阅卷现场!

无障碍浏览 进入关怀版