网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2019 Spotlight | 超清还不够,商汤插帧算法让视频顺滑如丝

0
分享至

机器之心发布

机器之心编辑部

摄影爱好者无疑想要拍出更高画质、更清晰的视频,因而要求相机能够提供更高的分辨率和帧率。但是利用相机的硬件更迭来提升帧率似乎满足不了人们的需求,这就需要算法来加持了。商汤移动智能研究总监孙文秀团队提出了一种新的视频插帧算法,其可以感知到视频中的运动加速度,从而拍出顺滑如丝的高画质视频。
自相机被发明以来,人们对更高画质视频的追求就没有停止过。

分辨率从 480p,720p,再到 1080p,现在有了 2K、4K;帧率也从 25FPS 到 60FPS,再到 240FPS,960FPS 甚至更高……

如果仅靠相机的硬件迭代来提升帧率,存在局限性,因为相机传感器在单位时间内捕捉到的光有局限。而且相机硬件迭代的周期长,成本高。

最近,商汤移动智能研究总监孙文秀的团队提出了一种可以感知视频中运动加速度的视频插帧算法(Quadratic Video Interpolation),打破了之前插帧方法的线性模型,将二次方光流预测和深度卷积网络进行融合,让你的视频顺滑如丝。

这种方法有多厉害?来看一个对比:


如果把视频放慢就能明显感觉到,未经过插帧的慢放视频(左)会明显卡顿,而经过商汤 Quadratic(二次方)视频插帧方法处理的视频(右)播放流畅。

这个方法的论文被 NeurIPS 2019 接收为 Spotlight 论文,该方法还在 ICCV AIM 2019 VideoTemporal Super-Resolution Challenge 比赛中获得了冠军。

之前的视频插帧方法(包括 Phase[1]、DVF[2]、SepConv[3] 和 SuperSloMo[4] 等)是假设相邻帧之间的运动是匀速的,即沿直线以恒定速度移动。然而,真实场景中的运动通常是复杂的、非线性的,传统线性模型会导致插帧的结果不准确。

以抛橄榄球的运动视频为例(如下图 1),真实运动中的轨迹是一条抛物线,如果在第 0 帧和第 1 帧之间进行插帧,线性模型方法模拟出来轨迹是线性轨迹(右二),与真实运动轨迹(右三)相差较大。

图 1 传统线性模型与商汤二次方视频插帧结果对比

但通过商汤二次方视频插帧模型模拟出来的运动轨迹是抛物线形(图 1 右一),更逼近真实轨迹。也就是说,它能够更准确地估计视频相邻帧之间的运动并合成中间帧,从而获得更精准的插帧结果

二次方插帧是怎样「炼」成的?
商汤研究团队构建了一个可以感知视频运动加速度的网络模型。与传统线性插帧模型利用两帧输入不同,它利用了相邻四帧图像来预测输入帧到中间帧的光流,简易的流程图如下:

图 2 二次方插帧模型的流程

、、 和 是输入视频连续的四帧。给定任意时刻 t(0<t<1),该模型将最终生成 t 时刻的中间帧。而要得到,就需要更深入了解其中的两个关键技术:二次方光流预测和光流逆转

其中,二次方光流预测,就是中学物里面常讲到的求匀变速运动位移的过程:假设在 [-1, 1] 时刻的运动是匀加速运动,那么可以利用位移推测出 0 时刻的速度和区间内的加速度,即可以计算出 0 时刻到任意 t 时刻的位移:

图 3:视频中物体运动的示意图。 , , , 分别表示物体 , , 和 中的位置。
通过以上方法,对称地我们可以计算出 。此时,我们得到了含有加速度信息 和 。

为了生成高质量的中间帧,我们需要得到反向光流 和 。

为此商汤研究团队提出一个可微分的「光流逆转层」来预测 和 。 通过以下转换公式可以高效的将 和 转化为 和 ,但是可能会造成逆转的光流在运动边界处出现强烈的振铃效应(见图 4)。

为了消除这些强烈震荡的部分,商汤研究团队提出了一种基于深度神经网络的、能够对逆转后光流进行自适应采样的滤波器(Adaptive Flow Filter)

实验证明,自适应滤波器(ada.)能够明显削弱光流逆转造成的振铃效应,从而改善最终合成帧的质量。

图 4 自适应滤波器能够改善逆转的光流和合成的中间帧的质量

实验结果

商汤研究团队在 GOPRO、Adobe240、UCF101 和 DAVIS 四个知名视频数据集上对提出的方法进行测评,并与业界前沿的插帧方法 Phase、DVF、SepConv 和 SuperSloMo 进行比较。在每个数据集上,商汤二次视频插针方法都大幅超过现有的方法 (见表 1、表 2)。

表 1 商汤提出的方法和业界前沿方法在 GOPRO 和 Adobe240 数据集上的比较

表 2 商汤提出的方法和业界前沿方法在 UCF101 和 DAVIS 数据集上的比较

除此之外,商汤研究团队还对各种方法生成中间帧进行了关键点跟踪并进行可视化,从图 5 中两个案例的视频运动轨迹可以看出,用真实慢动作相机采集的中间帧(GT)的运动轨迹是曲线的。线性模型(SepConv、SuperSloMo、Oursw/o qua)生成的中间帧的运动轨迹都是直线,相反,商汤的模型 (Ours) 能够更精准的预测出非线性轨迹,获得更好的插帧结果。

图 5 对不同方法的插帧结果进行可视化。 第一行和第三行是每种方法的插帧结果和真实图像中间帧 (GT) 的平均。 第二行和第四行对每种方法的插帧结果进行关键点跟踪。

综上,商汤提出的能够感知视频中运动加速度的插帧方法相比已有的线性插帧算法,能够过更好地预测中间帧。

[1] S.Meyer, O.Wang, H. Zimmer, M. Grosse, and A. Sorkine-Hornung. Phase-based frameinterpolation forvideo.In CVPR, 2015 [2]Z. Liu,R. Yeh, X. Tang, Y. Liu, and A. Agarwala. Video frame synthesis using deepvoxel flow. In ICCV,2017. [3] S. Niklaus, L. Mai, and F. Liu. Video frame interpolationvia adaptive separable convolution. In ICCV,2017 [4] H.Jiang, D. Sun, V. Jampani, M. Yang, E. G. Learned-Miller, and J. Kautz. Superslomo: High quality estimationof multiple intermediate frames for video interpolation. In CVPR, 2018.

文为机器之心发布,转载请联系本公众号获得授权
------------------------------------------------加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或寻求报道:content@jiqizhixin.combd@jiqizhixin.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
皇马武斗细节曝光:巴尔韦德3次恶铲,欲废楚阿梅尼

皇马武斗细节曝光:巴尔韦德3次恶铲,欲废楚阿梅尼

体坛周报
2026-05-10 15:57:53
中纪委连发禁令:机关事业单位职工注意,这7种饭局一参加就出局

中纪委连发禁令:机关事业单位职工注意,这7种饭局一参加就出局

细说职场
2026-05-10 09:55:02
红场阅兵结束!普京感谢中国,特朗普最不愿意看到的一幕发生

红场阅兵结束!普京感谢中国,特朗普最不愿意看到的一幕发生

书纪文谭
2026-05-10 21:14:35
中国首款定制癌症疫苗落地!11大癌种可申请,晚期患者绝处逢生

中国首款定制癌症疫苗落地!11大癌种可申请,晚期患者绝处逢生

新时代的两性情感
2026-05-10 09:40:15
孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

澎湃新闻
2026-05-10 21:38:28
紫牛头条|儿子车祸受伤生存希望不足0.1%仍绝不放弃!这位母亲生死守护已620天

紫牛头条|儿子车祸受伤生存希望不足0.1%仍绝不放弃!这位母亲生死守护已620天

扬子晚报
2026-05-10 20:20:42
46岁女星自曝"私处整形":只因觉得"不对称"

46岁女星自曝"私处整形":只因觉得"不对称"

追星雷达站
2026-05-09 10:36:38
原本只是想压价,舆论让央视进退两难!不买版权或造成更大损失

原本只是想压价,舆论让央视进退两难!不买版权或造成更大损失

中国足球的那些事儿
2026-05-09 17:34:11
马琳落泪!中国女团3-2逆转日本夺冠:孙颖莎轰2个3-0 王曼昱救赎

马琳落泪!中国女团3-2逆转日本夺冠:孙颖莎轰2个3-0 王曼昱救赎

风过乡
2026-05-10 21:59:08
2-0领先遭拖入抢五拒逆转!17岁张本美和破魔咒:王曼昱仰天长啸

2-0领先遭拖入抢五拒逆转!17岁张本美和破魔咒:王曼昱仰天长啸

颜小白的篮球梦
2026-05-10 19:01:48
不跟风、不妥协:212如何用“野”字对抗行业的“卷”?

不跟风、不妥协:212如何用“野”字对抗行业的“卷”?

大众侃车
2026-05-10 17:27:19
实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

史政先锋
2026-05-10 21:05:57
1984年叶剑英病危,追悼会花圈已备好,35岁才当医生的钟南山凭什么临危受命救回元帅?

1984年叶剑英病危,追悼会花圈已备好,35岁才当医生的钟南山凭什么临危受命救回元帅?

史海孤雁
2026-05-09 19:13:11
张本智和:中国队时代将落幕 接下来会是日本时代 要夺世乒赛5连冠

张本智和:中国队时代将落幕 接下来会是日本时代 要夺世乒赛5连冠

风过乡
2026-05-10 11:09:20
54犯65罚!前板被抢爆,鬼才潘江错换大刘,成全广厦1-1夺回主动

54犯65罚!前板被抢爆,鬼才潘江错换大刘,成全广厦1-1夺回主动

后仰大风车
2026-05-10 22:09:44
31岁乌克兰女数学家23页证明,一周内连解两大世纪谜题!

31岁乌克兰女数学家23页证明,一周内连解两大世纪谜题!

補懂事的孩紙
2026-05-10 11:44:50
考比伦杯七连冠!孙颖莎独得2分力挽狂澜,国乒3-2险胜日本

考比伦杯七连冠!孙颖莎独得2分力挽狂澜,国乒3-2险胜日本

全景体育V
2026-05-10 21:38:35
交管大队长否认违规:在KTV喝的是茶水,女子主动靠近我反应不及

交管大队长否认违规:在KTV喝的是茶水,女子主动靠近我反应不及

映射生活的身影
2026-05-10 15:28:16
29岁中国工程师背叛马斯克,套现700万,偷走核心代码投奔死对头

29岁中国工程师背叛马斯克,套现700万,偷走核心代码投奔死对头

阿器谈史
2026-05-10 04:03:40
正等待开火命令!周一开盘或将掀起惊天风浪

正等待开火命令!周一开盘或将掀起惊天风浪

魏家东
2026-05-10 14:09:12
2026-05-10 23:12:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12957文章数 142647关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

房产
旅游
教育
游戏
本地

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

旅游要闻

一路向前,自在骑行!田园社骑行驿站成为庆云打卡新地标

教育要闻

请教会你的孩子有能力分辨和说不!

《流放之路2》有望在5月底获得Steam Deck认证

本地新闻

用苏绣的方式,打开江西婺源

无障碍浏览 进入关怀版