网易首页 > 网易号 > 正文 申请入驻

清华&旷视:让VGG再次伟大!

0
分享至

CNN经典模型VGG自2014年诞生以来,由于相比于各种多分支架构(如ResNet)性能不佳,已渐“没落”……

但来自清华大学和旷视科技等机构的研究人员,他们居然只用3x3卷积和ReLU激活函数的超级简单架构,通过结构重参数化(structural re-parameterization),就让这个7年前的老架构再次“容光焕发”!Great Again!

简单到什么程度?研究人员表示:

下午5点看完文章,晚饭前就能写完代码开始训练,第二天就能看到结果。如果没时间看完这篇文章,只要点开GitHub上的代码,看完前100行就可以完全搞明白。

新架构RepVGG结合了多分支架构和单路架构的优点,在速度和性能上直达SOTA,在ImageNet上精度超过80%!

相关论文已被CVPR 2021接收,开源预训练模型和代码在GitHub上也已收获1700+ 标星!

兼顾多分支和单路架构的优点

一个已经快要“没落”的老模型,为什么还要重新捡起利用?

研究人员介绍道,因为简单的VGG式模型(单路架构、仅使用3x3卷积和ReLU激活函数)有五大现实优势:

1、3x3卷积非常快。在GPU上,3x3卷积的计算密度(理论运算量除以所用时间)可达1x1和5x5卷积的四倍。
2、单路架构因为并行度高也非常快。同样的计算量,“大而整”的运算效率远超“小而碎”的运算。
3、单路架构省内存。例如,ResNet的shortcut虽然不占计算量,却增加了一倍的显存占用。
4、单路架构灵活性更好,容易改变各层的宽度(如剪枝)。
5、RepVGG主体部分只有一种算子:3x3卷积接ReLU。在设计专用芯片时,给定芯片尺寸或造价,我们可以集成海量的3x3卷积-ReLU计算单元来达到很高的效率。别忘了,单路架构省内存的特性也可以帮我们少做存储单元。

由于多分支架构性能更好,为了让新架构RepVGG兼顾两者优点,他们提出一个新的做法:先训练一个多分支模型,然后将多分支模型等价转换为单路模型,最后部署这个单路模型。

具体来说,首先借鉴ResNet的做法,在训练时为每一个3x3卷积层添加平行的1x1卷积分支和恒等映射分支,构成一个RepVGG Block。

然后需将RepVGG Block转换为一个卷积,也就是将训练好的模型等价转换为只有3x3卷积的单路模型。

怎么转换?结构重参数化

如上图,利用卷积的相加性,需经过两次变换。

示例中,输入输出通道数都是2,那3x3卷积核所对应的参数矩阵为2x2x3x3,也就是4个3x3矩阵,1x1卷积核对应的参数矩阵为2x2x1x1,也就是4个1x1矩阵,为了画图方便换成1个2x2矩阵。

把1x1卷积等价转换为3x3卷积,只要用0填充一下就行了。

而恒等映射是一个特殊(以单位矩阵为卷积核)的1x1卷积,因此也是一个特殊的3x3卷积。

以上三个分支都有BN(batch normalization)层,推理时的卷积层和其后的BN层可转换为一个带bias的卷积层。

最后,将三分支得到的卷积核和bias分别相加,完成等价转换为只有3x3卷积的单路模型。

从这一转换过程中,我们看到了“结构重参数化”的实质:训练时的结构对应一组参数,推理时我们想要的结构对应另一组参数;只要能把前者的参数等价转换为后者,就可以将前者的结构等价转换为后者。

不少人都称赞这篇论文的思路非常有意思,简单易懂,让人眼前一亮!

效果确实也非常不错——

速度和精度达SOTA

RepVGG这样只用3x3卷积和ReLU激活函数的简单架构,特别适用于GPU和特殊推理芯片(inference chips)。

研究人员在1080Ti上对RepVGG进行了测试。在公平的训练设定下,同精度的RepVGG速度是ResNet-50的183%,ResNet-101的201%,EfficientNet的259%,RegNet的131%。

在Cityscapes上的语义分割实验表明,在速度更快的情况下,RepVGG模型比ResNet系列高约1%到1.7%的mIoU,或在mIoU高0.37%的情况下速度快62%。

通过结构重参数化,RepVGG在ImageNet上达到了80.57%的top1精度,与最先进的复杂模型相比,速度-精度都非常出色。

关于作者

论文一作:丁霄汉,清华大学计算机视觉博士生,研究方向是计算机视觉和机器学习。在CVPR、ICML、ICCV、NeurIPS作为第一作者发表论文5篇。曾获得第七届百度奖学金荣誉——“十位顶尖 AI 学子”之一。

论文二作:张详雨,旷视科技旷视研究院base model组负责人,西安交大博士生。曾在微软亚洲研究院实习,是ResNet的主要作者之一。

论文三作:马宁宁,香港科技大学与旷视联合培养博士,主要研究方向为计算机视觉和高性能卷积神经网络。

论文地址:https://arxiv.org/abs/2101.03697
GitHub地址:https://github.com/DingXiaoH/RepVGG

[1]https://www.reddit.com/r/MachineLearning/comments/nqflsp/rrepvgg_making_vggstyle_convnets_great_again/
[2]https://zhuanlan.zhihu.com/p/344324470

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
U17国足队长说真话!坦言亚洲杯和日本差距巨大,传接球没自信

U17国足队长说真话!坦言亚洲杯和日本差距巨大,传接球没自信

丁蓳解说
2026-05-10 20:32:26
王楚钦被表白了?女神身份曝光,18岁,长相甜美,孙颖莎一句话耐人寻味

王楚钦被表白了?女神身份曝光,18岁,长相甜美,孙颖莎一句话耐人寻味

乒乓网国球汇
2026-01-31 00:11:25
光纤行业迎重大利好,外资悄然布局3家低价标的

光纤行业迎重大利好,外资悄然布局3家低价标的

王二哥老搞笑
2026-05-10 13:08:16
硬核设计!美国海豹突击队博物馆方案揭晓

硬核设计!美国海豹突击队博物馆方案揭晓

GA环球建筑
2026-05-10 19:18:21
VS Code正在变成比专业工具更好用的效率软件

VS Code正在变成比专业工具更好用的效率软件

算力游侠
2026-05-10 18:26:59
终身告别胰岛素?央视点赞糖尿病新疗法,干细胞开启“根治”时代

终身告别胰岛素?央视点赞糖尿病新疗法,干细胞开启“根治”时代

科学认识论
2026-05-08 16:00:31
全球军队研究印巴507空战,发现最震撼细节,难怪印度不想打了

全球军队研究印巴507空战,发现最震撼细节,难怪印度不想打了

琴音似君语
2026-05-10 17:56:21
婆婆寿宴上,老公要过户房子,我爸笑着问:房贷剩余48万找谁填?

婆婆寿宴上,老公要过户房子,我爸笑着问:房贷剩余48万找谁填?

二十一号故事铺
2026-05-10 23:05:03
未来一年偏财运最旺的三个生肖!悟性高、人灵活,奇思妙想不断!

未来一年偏财运最旺的三个生肖!悟性高、人灵活,奇思妙想不断!

毅谈生肖
2026-05-08 10:54:18
国安3粒进球被取消,海港客场收获平局

国安3粒进球被取消,海港客场收获平局

五星体育
2026-05-10 22:08:13
江青书信曝光!钢笔字竟暗藏惊人秘密,书法之争谁胜出?

江青书信曝光!钢笔字竟暗藏惊人秘密,书法之争谁胜出?

书画相约
2026-04-14 07:21:03
“子孙有本事,祖先会显灵”:家中有这些信号,多半暗示后代兴盛

“子孙有本事,祖先会显灵”:家中有这些信号,多半暗示后代兴盛

朗威谈星座
2026-05-10 10:24:40
2.0T回来了!奔驰新车上市:29.99万起

2.0T回来了!奔驰新车上市:29.99万起

高科技爱好者
2026-05-08 23:09:31
血管清道夫找到了!这3种食物,帮你把“坏胆固醇”降下去

血管清道夫找到了!这3种食物,帮你把“坏胆固醇”降下去

慈铭体检
2026-03-30 16:59:15
别再被抗战剧骗了!一名日军摄影师,拍下真正的“鬼子进村”照片

别再被抗战剧骗了!一名日军摄影师,拍下真正的“鬼子进村”照片

历史甄有趣
2026-05-04 08:10:22
Lisa被驴老三抛弃,寻找新金主!

Lisa被驴老三抛弃,寻找新金主!

八卦疯叔
2026-05-10 10:00:07
孩子是来报恩还是讨债,出生时四个行为就能看出,万不可忽视

孩子是来报恩还是讨债,出生时四个行为就能看出,万不可忽视

阿郑的读书日常
2025-05-07 14:51:32
CNN创始人去世,28亿家产没给儿女,全给了野牛和草地

CNN创始人去世,28亿家产没给儿女,全给了野牛和草地

纪中百大事
2026-05-10 09:31:51
伊朗没想到:打了一仗没曾灭掉以色列,反在自家门口造一个更狠的

伊朗没想到:打了一仗没曾灭掉以色列,反在自家门口造一个更狠的

小蔑谈事
2026-05-09 22:00:46
广厦G2半场压制山西!胡金秋+替补回暖,三分精准,山西2小外低迷

广厦G2半场压制山西!胡金秋+替补回暖,三分精准,山西2小外低迷

篮球资讯达人
2026-05-10 20:35:37
2026-05-11 03:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
12599文章数 176461关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

手机
教育
数码
时尚
本地

手机要闻

OPPO Reno16系列参数全曝光,就差价格了

教育要闻

高考地理中的共享经济

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

本地新闻

用苏绣的方式,打开江西婺源

无障碍浏览 进入关怀版