网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

RepVGG：极简架构，SOTA性能，让VGG式模型再次伟大！

2021-01-16 13:53:36　来源: AI科技评论举报

0

分享至

　　2020年B站年度弹幕是“爷青回”。一定有很多瞬间，让你感觉“爷的青春回来了”。在这个卷积网络各种超参精确到小数点后三位的时代，你是否还记得五六年前的田园时代，堆几个卷积层就能涨点的快乐？

　　我们最近的工作RepVGG，用结构重参数化（structural re-parameterization）实现VGG式单路极简架构，一路3x3卷到底，在速度和性能上达到SOTA水平，在ImageNet上超过80%正确率。

　　不用NAS，不用attention，不用各种新颖的激活函数，甚至不用分支结构，只用3x3卷积和ReLU，也能达到SOTA性能？

　　论文：https://arxiv.org/abs/2101.03697

　　开源预训练模型和代码（PyTorch版）：

　　https://github.com/DingXiaoH/RepVGG

　　放出两天已有300 star，模型已被下载数百次，据同行反馈在真实业务上效果很好。

　　（MegEngine版）：

　　https://github.com/megvii-model/RepVGG

　　太长不看版

　　方法有多简单呢？下午5点看完文章，晚饭前就能写完代码开始训练，第二天就能看到结果。如果没时间看完这篇文章，只要点开下面的代码，看完前100行就可以完全搞明白。

　　https://github.com/DingXiaoH/RepVGG/blob/main/repvgg.py

　　下面是详细介绍。

　　1

　　模型定义

　　我们所说的“VGG式”指的是：

　　1. 没有任何分支结构。即通常所说的plain或feed-forward架构。

　　2. 仅使用3x3卷积。

　　3. 仅使用ReLU作为激活函数。

　　下面用一句话介绍RepVGG模型的基本架构：将20多层3x3卷积堆起来，分成5个stage，每个stage的第一层是stride=2的降采样，每个卷积层用ReLU作为激活函数。

　　再用一句话介绍RepVGG模型的详细结构：RepVGG-A的5个stage分别有[1, 2, 4, 14, 1]层，RepVGG-B的5个stage分别有[1, 4, 6, 16, 1]层，宽度是[64, 128, 256, 512]的若干倍。这里的倍数是随意指定的诸如1.5,2.5这样的“工整”的数字，没有经过细调。

　　再用一句话介绍训练设定：ImageNet上120 epochs，不用trick，甚至直接用PyTorch官方示例的训练代码就能训出来！

　　为什么要设计这种极简模型，这么简单的纯手工设计模型又是如何在ImageNet上达到SOTA水平的呢？

　　2

　　为什么要用VGG模型？

　　除了我们相信简单就是美以外，VGG式极简模型至少还有五大现实的优势（详见论文）。

　　1. 3x3卷积非常快。在GPU上，3x3卷积的计算密度（理论运算量除以所用时间）可达1x1和5x5卷积的四倍。

　　2. 单路架构非常快，因为并行度高。同样的计算量，“大而整”的运算效率远超“小而碎”的运算。

　　3. 单路架构省内存。例如，ResNet的shortcut虽然不占计算量，却增加了一倍的显存占用。

　　4. 单路架构灵活性更好，容易改变各层的宽度（如剪枝）。

　　5. RepVGG主体部分只有一种算子：3x3卷积接ReLU。在设计专用芯片时，给定芯片尺寸或造价，我们可以集成海量的3x3卷积-ReLU计算单元来达到很高的效率。别忘了，单路架构省内存的特性也可以帮我们少做存储单元。

　　3

　　结构重参数化让VGG再次伟大

　　相比于各种多分支架构（如ResNet，Inception，DenseNet，各种NAS架构），近年来VGG式模型鲜有关注，主要自然是因为性能差。例如，有研究[1]认为，ResNet性能好的一种解释是ResNet的分支结构（shortcut）产生了一个大量子模型的隐式ensemble（因为每遇到一次分支，总的路径就变成两倍），单路架构显然不具备这种特点。

　　既然多分支架构是对训练有益的，而我们想要部署的模型是单路架构，我们提出解耦训练时和推理时架构。我们通常使用模型的方式是：

　　1. 训练一个模型

　　2. 部署这个模型

　　但在这里，我们提出一个新的做法：

　　1. 训练一个多分支模型

　　2. 将多分支模型等价转换为单路模型

　　3. 部署单路模型

　　这样就可以同时利用多分支模型训练时的优势（性能高）和单路模型推理时的好处（速度快、省内存）。这里的关键显然在于这种多分支模型的构造形式和转换的方式。

　　我们的实现方式是在训练时，为每一个3x3卷积层添加平行的1x1卷积分支和恒等映射分支，构成一个RepVGG Block。这种设计是借鉴ResNet的做法，区别在于ResNet是每隔两层或三层加一分支，而我们是每层都加。

　　训练完成后，我们对模型做等价转换，得到部署模型。这一转换也非常简单，因为1x1卷积是一个特殊（卷积核中有很多0）的3x3卷积，而恒等映射是一个特殊（以单位矩阵为卷积核）的1x1卷积！根据卷积的线性（具体来说是可加性），每个RepVGG Block的三个分支可以合并为一个3x3卷积。

　　下图描述了这一转换过程。在这一示例中，输入和输出通道都是2，故3x3卷积的参数是4个3x3矩阵，1x1卷积的参数是一个2x2矩阵。注意三个分支都有BN（batch normalization）层，其参数包括累积得到的均值及标准差和学得的缩放因子及bias。这并不会妨碍转换的可行性，因为推理时的卷积层和其后的BN层可以等价转换为一个带bias的卷积层（也就是通常所谓的“吸BN”）。

　　对三分支分别“吸BN”之后（注意恒等映射可以看成一个“卷积层”，其参数是一个2x2单位矩阵！），将得到的1x1卷积核用0给pad成3x3。最后，三分支得到的卷积核和bias分别相加即可。这样，每个RepVGG Block转换前后的输出完全相同，因而训练好的模型可以等价转换为只有3x3卷积的单路模型。

　　从这一转换过程中，我们看到了“结构重参数化”的实质：训练时的结构对应一组参数，推理时我们想要的结构对应另一组参数；只要能把前者的参数等价转换为后者，就可以将前者的结构等价转换为后者。

　　4

　　实验结果

　　在1080Ti上测试，RepVGG模型的速度-精度相当出色。在公平的训练设定下，同精度的RepVGG速度是ResNet-50的183%，ResNet-101的201%，EfficientNet的259%，RegNet的131%。注意，RepVGG取得超过EfficientNet和RegNet并没有使用任何的NAS或繁重的人工迭代设计。

　　这也说明，在不同的架构之间用FLOPs来衡量其真实速度是欠妥的。例如，RepVGG-B2的FLOPs是EfficientNet-B3的10倍，但1080Ti上的速度是后者的2倍，这说明前者的计算密度是后者的20余倍。

　　在Cityscapes上的语义分割实验表明，在速度更快的情况下，RepVGG模型比ResNet系列高约1%到1.7%的mIoU，或在mIoU高0.37%的情况下速度快62%。

　　另外一系列ablation studies和对比实验表明，结构重参数化是RepVGG模型性能出色的关键（详见论文）。

　　最后需要注明的是，RepVGG是为GPU和专用硬件设计的高效模型，追求高速度、省内存，较少关注参数量和理论计算量。在低算力设备上，可能不如MobileNet和ShuffleNet系列适用。

　　参考文献

　　[1] Andreas Veit, Michael J Wilber, and Serge Belongie. Residual networks behave like ensembles of relatively shallow networks. In Advances in neural information processing systems, pages 550–558, 2016. 2, 4, 8

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

美媒：白宫下令暂缓推进对台军售

环球网资讯 2026-03-02 06:27:47
82 跟贴 82
上海浦东机场多架航班返航！中国旅客：我已经哭过了，感到后怕；中东机场改签排队数百米，国内三大航可免费退改签

大象新闻 2026-03-01 14:45:10
12 跟贴 12

再现逆转！中国男篮击败中国台北男篮，世预赛赛场斩获连胜

澎湃新闻 2026-03-01 17:52:27
4929 跟贴 4929

年前100多元一斤，年后价格腰斩！有湖北人已迫不及待下单

环球网资讯 2026-02-27 09:52:19
526 跟贴 526
男子爬到何仙姑雕像头顶拍照，山东蓬莱阁景区回应：“八仙过海”石雕属于公共区域无人值守，后续会加强巡逻

三湘都市报 2026-02-28 13:37:39
1188 跟贴 1188

极氪公布春节十大猎装旅行路线，揭秘深度自驾游版图

鲁中晨报 2026-02-26 12:29:41
15583 跟贴 15583

“沪七条”新政首周末显效，申城楼市迎来看房热潮

上观新闻 2026-03-02 09:57:07
34 跟贴 34
新华时评：当炸弹落在校园，文明底线何在

澎湃新闻 2026-03-01 22:32:48
1911 跟贴 1911

首次、首创、新突破！上周，我国科技发展再添新成果

环球网资讯 2026-03-02 09:07:41
100 跟贴 100
2名小学生因寒假作业未完成离家出走，30余人搜寻14小时，找到时孩子冻得脸色发青、嘴唇发白

观威海 2026-03-02 12:08:05
0 跟贴 0
面对面丨金牌夫妻约定再战法国冬奥会专访徐梦桃王心迪

海外网 2026-03-02 07:46:07
22 跟贴 22
又是熟悉的配方！新赛季，海港准备好了吗？

新民晚报 2026-03-02 10:12:00
36 跟贴 36
中国军号：我们不期待，但绝不惧怕

上观新闻 2026-03-02 06:59:20
155 跟贴 155
县政府投书人民日报称“读者反映情况不属实”，记者两赴调查：自来水确实时有时无

上观新闻 2026-03-02 09:40:04
142 跟贴 142
月月315｜男子花52.5万全款购买婚房，5年多未等来房产证，湖南岳阳县住建局：房款未进入开发商账户，正全力推动解决

大风新闻 2026-03-01 14:34:03
197 跟贴 197
热闻|B费一传一射，谢什科三连杀！曼联2-1逆转水晶宫杀入英超前三

齐鲁壹点 2026-03-02 06:58:19
98 跟贴 98
促进民间资本敢投愿投

经济日报 2026-03-02 06:38:05
6 跟贴 6
中国造！全球首款机器人手机亮相，荣耀CEO李健：手机不是无趣黑色方块，我们决定赋予它大脑，更要赋予它手脚

齐鲁壹点 2026-03-02 11:00:23
6 跟贴 6
“太恐怖，iPhone半夜自己给陌生人打47分钟电话！”

都市快报橙柿互动 2026-02-25 11:28:41
78 跟贴 78
“手机将全面涨价”，冲上热搜

南方都市报 2026-02-27 14:31:12
0 跟贴 0
男子2元机选中752万元大奖：意识到中奖后没太多实感，仍然会以平常心继续生活

洪观新闻 2026-03-02 13:50:34
5 跟贴 5
天津凌晨发暴雪预警！降雪持续！

潇湘晨报 2026-03-02 10:05:14
0 跟贴 0
女子怀抱五个多月的婴儿在扶梯上被身后玩具车撞倒，怀中婴儿也被摔倒在地！已报警

环球网资讯 2026-03-02 14:18:08
0 跟贴 0

5000万砸金球！皇马疯抢曼城核心，这笔豪赌真能稳赢？

5000万砸金球！皇马疯抢曼城核心，这笔豪赌真能稳赢？

卿子书

2026-03-02 09:12:51

法国美女嫁到中国后，直言：钱可以借中国婆婆却不会给父母，为何

法国美女嫁到中国后，直言：钱可以借中国婆婆却不会给父母，为何

哄动一时啊

2026-02-15 11:28:54

伊朗的投降王牌：只要美国松绑，出卖中国利益绝不会有半点犹豫

伊朗的投降王牌：只要美国松绑，出卖中国利益绝不会有半点犹豫

老范谈史

2026-02-28 06:45:51

阿莫林助手谈曼联：我不太满意的是我们的理念没得到充分落实

阿莫林助手谈曼联：我不太满意的是我们的理念没得到充分落实

懂球帝

2026-03-02 11:33:50

小猫坐15小时车回家过年，下车时面相老10岁！网友笑疯：直接孙子变爷爷哈哈

小猫坐15小时车回家过年，下车时面相老10岁！网友笑疯：直接孙子变爷爷哈哈

拜见喵主子

2026-03-01 12:23:37

燃爆跑圈！丰配友破国家纪录，奖励超200万！何杰发文暖心祝贺

燃爆跑圈！丰配友破国家纪录，奖励超200万！何杰发文暖心祝贺

马拉松跑步健身

2026-03-01 22:00:29

大跳水！暴跌40%，又土又贵还开遍机场，中产的标配，卖不动了

大跳水！暴跌40%，又土又贵还开遍机场，中产的标配，卖不动了

毒sir财经

2025-11-16 23:08:08

江西女硕士失踪，被发现时已在教授实验室待6年，魔鬼真的存在

江西女硕士失踪，被发现时已在教授实验室待6年，魔鬼真的存在

灿烂夏天

2025-02-10 20:20:13

【李国豪】南京长江大桥设计时，他主张6车道，当地政府坚持4车道

【李国豪】南京长江大桥设计时，他主张6车道，当地政府坚持4车道

年之父

2026-02-23 09:10:06

总台记者获悉：伊朗前总统内贾德的死亡消息被其家属否认

总台记者获悉：伊朗前总统内贾德的死亡消息被其家属否认

极目新闻

2026-03-02 13:29:09

他请辞红军师长，没当358旅长，出于无奈？离开之后，张宗逊接替

他请辞红军师长，没当358旅长，出于无奈？离开之后，张宗逊接替

大运河时空

2026-03-01 12:50:03

中美联合国激烈交锋，美逼中国买单，中方拒绝接受，对美反将三军

中美联合国激烈交锋，美逼中国买单，中方拒绝接受，对美反将三军

boss外传

2026-03-02 14:00:03

稳中求进每月看|春潮澎湃启新元——2月全国各地经济社会发展观察

稳中求进每月看|春潮澎湃启新元——2月全国各地经济社会发展观察

新华社

2026-02-28 22:33:50

小区楼上天天晚上都有女的大声叫。。。

小区楼上天天晚上都有女的大声叫。。。

微微热评

2025-12-24 00:26:04

比赛还没开打，巴萨先迎一个致命坏消息，国王杯晋级决赛基本没戏

比赛还没开打，巴萨先迎一个致命坏消息，国王杯晋级决赛基本没戏

零度眼看球

2026-03-02 13:58:36

医生提醒：无论多坏的肺，只要常吃这5样，肺一天比一天好

医生提醒：无论多坏的肺，只要常吃这5样，肺一天比一天好

路医生健康科普

2026-02-28 23:20:03

向太不再隐瞒！坦言刘德华和朱丽倩的真实状况，原来我们都被骗了

向太不再隐瞒！坦言刘德华和朱丽倩的真实状况，原来我们都被骗了

春风笑语

2026-02-26 22:52:44

上海发布2026年为民办实事项目

上海发布2026年为民办实事项目

中国网

2026-03-02 09:48:15

伊朗局势走到了十字路口，中国到底应不应该出手？取决一个条件

伊朗局势走到了十字路口，中国到底应不应该出手？取决一个条件

阿胡

2025-06-18 19:55:53

哈梅内伊一死，普京急召全体高层，防空系统全失灵，俄这次背大锅

哈梅内伊一死，普京急召全体高层，防空系统全失灵，俄这次背大锅

不似少年游

2026-03-02 09:22:12

点评学术，服务AI

7098文章数 20733关注度

往期回顾全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛给世界5个深刻教训

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛给世界5个深刻教训

体育要闻

卡里克主场5连胜！队史第2人通过最大考验

娱乐要闻

美伊以冲突爆发，多位明星被困中东

财经要闻

中东局势影响如何？十大券商策略来了

汽车要闻

预售11.28万起狐全新阿尔法S5标配宁德时代

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

亲子

手机

公开课

旅游要闻

【花Young贵阳】南明区永乐乡万亩桃花竞相绽放

本地新闻

津南好·四时总相宜

亲子要闻

小时候“不合群”的孩子，长大后更有出息？3个优势普通人比不了

手机要闻

最高暴涨3000元！史上最猛安卓涨价潮来了 2026年手机出货量将创13年来新低

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版