网易首页 > 网易号 > 正文 申请入驻

CVPR 2020 |商汤提出基于贪心超网络的One-Shot NAS方法

0
分享至

本文介绍的是CVPR2020论文《GreedyNAS: Towards Fast One-Shot NAS withGreedy Supernet》,作者来自商汤。

作者 | 商 汤

编辑 | 丛 末

论地址:https://arxiv.org/abs/2003.11236

1

导读

在CVPR 2020上,商汤移动智能事业群-3DAR-身份认证与视频感知组提出了基于贪心超网络的One-Shot NAS方法,显著提升了超网络直接在大规模数据集上的搜索训练效率,并在标准ImageNet数据集上取得了300M FLOPs量级的SOTA。GreedyNAS论文通过提出一种贪心的超网络结构采样训练方法,改善了训练得到的超网络对结构的评估能力,进而帮助搜索算法得到精度更高的结构。

2

动机与背景

在目前的神经结构搜索领域中,One-ShotNAS方法由于其搜索开销小被广泛应用,这些方法使用一个权重共享的超网络(supernet)作为不同网络结构的性能评估器,因此,supernet的训练对搜索结果的好坏至关重要。然而,目前的方法一般采用了一个基本的假设,即supernet中每一个结构是同等重要的,supernet应该对每个结构进行准确评估或相对排序。然而,supernet中所包含的结构量级(搜索空间的size)是非常巨大的(如7^{21} ),因此准确的评估对于supernet来说是非常困难的,导致supernet中结构的表现与其真实表现相关性很差 [1]。

在本篇论文中,我们提出一种贪心超网络来减轻supernet的评估压力,使得supernet更加贪心地注重于有潜力的好结构,而不是全体。具体而言,在supernet训练过程中,我们提出了一种多路径拒绝式采样方法(multi-path sampling with rejection)来进行路径滤波 (path filtering),使得有潜力的好结构得到训练。通过这种方法,supernet的训练从整个搜索空间贪心地缩小到了有潜力的结构组成的空间中,因此训练的效率得到了提升。同时,为了进一步增大有潜力结构的采样概率与提高训练效率,我们基于exploration and exploitation准则,使用一个经验池存储评估过的“好”结构,用来加强贪心度并为后续的搜索提供好的初始点。本论文搜索出的结构在ImageNet(mobile setting) 下取得了SOTA(state-of-the-art) 的结果。

3

主要思路

巨大的搜索空间带来的评估压力使supernet难以准确地区分结构的好坏,由于所有结构的权重都是在supernet中高度共享的,如果一个差的结构被训练到了,好的结构的权重也会受到干扰。这样的干扰会削弱好网络的最终评估精度,影响网络的搜索结果。同时,对差的结构进行训练相当于对权重进行了没有必要的更新,降低supernet的训练效率。

1、多路径拒绝式采样

针对上述问题,一个直接的想法就是基于贪心策略,在训练过程中只训练好的结构。但很显然,我们并不知道一个随机初始化的搜索空间中哪些结构是好的。假设对于一个supernet,我们考虑其搜索空间A的一个完备划分,即:

搜索空间可以如上划分为好的空间与差的空间,且好空间中每一个结构的ACC均大于差空间,即

于是,一个理想的采样策略是直接在好空间中进行采样即可。然而根据上面的不等式,确定所有结构中哪些是来自好空间需要遍历整个搜索空间,计算开销是无法接受的。为了解决这个问题,我们首先考虑从全空间中进行的一个均匀采样,那么每个path来自好空间的概率为:

为了得到需要的来自于好空间的结构,我们进一步考虑一个多维的Bernoulli实验,那么有如下的结论:

我们取m = 10和m = 20,对定理1的概率进行绘制,如Figure 2所示,可见这种采样下得到来自好空间中的path的概率是很高的。

于是,我们可以对采样到的多个结构进行评估筛选的方法提升采样到“好”结构的概率,即每次采样m个结构,从中选取评估指标最高的k个结构进行训练。但是,对结构进行评估需要在验证集上计算其ACC,这样会增加非常多计算量(我们的ImageNet验证集大小为50k)。为了减少评估网络的消耗,我们从验证集中随机选取了一小部分(如1000张图)组成小验证集,并使用在小验证集上的loss作为结构的排序指标。使用小验证集进行评估,在保证评估准确性的前提下,相较uniformsampling方法只增加了很少的计算代价,详见论文实验部分。

2、基于exploration and exploitation策略的路径候选池

在前面提到的路径滤波中,我们通过评估可以区分出较好的结构,为了进一步提升训练效率,受蒙特卡洛树搜索(Monte Carlo tree search)[4] 和 deep Q-learning[5] 中常用的exploration and exploitation策略启发,我们提出使用一个路径候选池用于存放训练过程中评估过的“好”结构,并进行重复利用。具体而言,候选池可以看作是一个固定大小的有序队列,其只会存储所有评估过结构中得分前n(候选池大小) 的结构。

有了候选池的帮助,我们可以选择从搜索空间中或候选池中采样结构。从候选池中采样的结构是好结构的概率更高,但可能会牺牲结构的多样性。为了平衡exploration与exploitation,我们采用-采样策略,即以一定的概率从整个搜索空间A或候选池P中采样结构α:

在网络刚开始训练时评估过的结构较少,候选池中存储的结构是好结构的可信度不高,因此从候选池中采样的概率在开始时设为0,并线性增加至一个较高的值(在实验中,我们发现0.8是一个较优的值)。若候选池中的结构都来自好空间,通过使用候选池,定理1中好网络的采样概率q提升为:

因此,采样10个结构,至少有5个好结构的概率由88.38%提升至99.36% 。

3、基于候选池的earlystopping策略

候选池的更新为supernet的训练情况提供了一个很好的参考。若候选池发生的更新(顺序变换、进出)较少,可以认为超网络中较好的网络维持着一个相对稳定的排序,这也说明此时的supernet已经是一个较好的性能评估器,因此训练进程可以提前结束,而不需要训练至网络完全收敛。

在实际使用中,我们会比较当前候选池P与t轮迭代前的候选池P_t的差异度,若差异度低于某个数值(我们的实验使用0.08),训练停止。差异度的定义如下:

4、基于候选池的搜索策略

Supernet训练结束后,我们可以使用验证集的ACC评估结构的好坏。本文使用NSGA-II 进化算法[3] 进行结构搜索。我们在进化算法中使用候选池中的结构进行population的初始化,相较于随机初始化,借助于候选池能够使进化算法有一个更好的初始,提升搜索效率及最终的精度。

如 Figure 3 所示,我们在同一个训练好的supernet上使用了随机初始化与候选池初始化两种方式进行搜索,使用候选池初始化搜索到的结构的准确率平均会比随机初始化要高。

4

实验结果

为了与目前的one-shot方法进行对比,我们首先在与 ProxylessNAS[6] 一样的 MobileNetV2 搜索空间上进行结构搜索,结果见 Table 1 。

同时为了进一步提升网络性能,我们在加入了SE的更大搜索空间上进行搜索,结果见 Table 2 。

5

Ablation Study

1、多路径拒绝式采样中的路径评估相关性

我们对随机初始化、uniformsampling、greedy方法训练得到的supernet下的小验证集指标与完整验证集ACC相关性进行了评估,如 Table 3 所示。可见在小验证集上使用loss相比ACC会得到更高的相关性,我们的贪心方法训练出的supernet有着更好的相关性。

我们对不同大小小验证集与完整验证集的相关性进行了评估(Figure 4 左图),同时对uniform-sampling算法在不同迭代轮数下的相关性作了评估(Figure 4 右图)。可以看出我们的算法在较小的验证集大小上仍能保持较高的相关性,在精度与效率的权衡下,我们最终选取 1000 作为小验证集大小。

2、对多路径贪心采样及候选池效果的评估

我们在MobileNetV2的search space下评估了多路径贪心采样及候选池的效果,如 Table 4 所示。

6

总结

超网络训练是单分支One-ShotNAS 方法的关键。与目前方法的对所有分支一视同仁不同,我们的方法贪心地注重于有潜力的好分支的训练。这种贪心地分支滤波可以通过我们提出的多分支采样策略被高效地实现。我们提出的 GreedyNAS 在准确率和训练效率上均展现出了显著的优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳将新增一座万象城!

深圳将新增一座万象城!

深圳晚报
2026-05-18 20:35:35
恭喜广东男篮!朱芳雨选拔人才,1人或被解约,杜锋乐在其中

恭喜广东男篮!朱芳雨选拔人才,1人或被解约,杜锋乐在其中

锅锅爱历史
2026-05-19 00:13:28
不服就干!俄军42架战轰倾巢出动,普京想一波带走乌克兰?

不服就干!俄军42架战轰倾巢出动,普京想一波带走乌克兰?

长星寄明月
2026-05-19 01:26:50
伯恩茅斯VS曼城,切尔西VS热刺,3.2+14+76倍

伯恩茅斯VS曼城,切尔西VS热刺,3.2+14+76倍

林子说事
2026-05-19 09:14:43
心理学上有一个词叫煤气灯效应:面对一个永远不认错、出了事就倒打一耙的人,其实不用翻脸、不用讲理,用这两招就行了

心理学上有一个词叫煤气灯效应:面对一个永远不认错、出了事就倒打一耙的人,其实不用翻脸、不用讲理,用这两招就行了

心理观察局
2026-05-19 06:55:05
年轻人买菜被忽悠一次就再也不去了!网友:把隔壁摊打包,气绿了

年轻人买菜被忽悠一次就再也不去了!网友:把隔壁摊打包,气绿了

夜深爱杂谈
2026-05-19 07:57:26
当空砍群群主遇上降级!穆里奇单赛季狂轰22球,也救不了马洛卡?

当空砍群群主遇上降级!穆里奇单赛季狂轰22球,也救不了马洛卡?

仰卧撑FTUer
2026-05-19 09:58:05
《主角》忍了20年的软柿子团长朱继儒,上位就掀桌子:真正的狠人

《主角》忍了20年的软柿子团长朱继儒,上位就掀桌子:真正的狠人

怂熊剧场
2026-05-18 07:56:17
院士忧心青年择业观:年轻人应该多想着为国家做贡献

院士忧心青年择业观:年轻人应该多想着为国家做贡献

映射生活的身影
2026-05-17 21:45:58
中国电信推出试商用Token套餐:个人及家庭月费9.9元/1000万Tokens起,开发者及中小微企业39.9元/1500万Tokens起

中国电信推出试商用Token套餐:个人及家庭月费9.9元/1000万Tokens起,开发者及中小微企业39.9元/1500万Tokens起

金融界
2026-05-17 19:09:22
美国挖出一块明朝金牌,上面刻有六个字,专家看完直呼:不可能!

美国挖出一块明朝金牌,上面刻有六个字,专家看完直呼:不可能!

阿器谈史
2026-05-18 12:31:05
论文打假博主耿同学:只打假杰青、长江学者,不针对普通学生

论文打假博主耿同学:只打假杰青、长江学者,不针对普通学生

总在茶余后
2026-05-18 12:07:46
拉扬:听到内马尔和拉菲尼亚的名字后,我以为自己没机会了

拉扬:听到内马尔和拉菲尼亚的名字后,我以为自己没机会了

懂球帝
2026-05-19 07:03:08
放弃小蜘蛛!巴萨 6700 万锁定阿森纳头号射手,阿尔特塔藏着大招

放弃小蜘蛛!巴萨 6700 万锁定阿森纳头号射手,阿尔特塔藏着大招

澜归序
2026-05-19 06:42:39
杨振宁离世后,与继子女彻底断联,翁帆:这样挺好,互不打扰

杨振宁离世后,与继子女彻底断联,翁帆:这样挺好,互不打扰

魔都姐姐杂谈
2026-05-19 09:46:44
来访之前先把话说清楚!普京访华前发表最新讲话!

来访之前先把话说清楚!普京访华前发表最新讲话!

阿龙聊军事
2026-05-19 09:55:41
欢迎声中全程冷漠!朝鲜女足时隔12年赴韩国参赛 全队零互动引关注

欢迎声中全程冷漠!朝鲜女足时隔12年赴韩国参赛 全队零互动引关注

林子说事
2026-05-18 18:51:58
陈道明没说谎!被张艺谋力捧,致女孩瘫痪的刘浩存,证实他的评价

陈道明没说谎!被张艺谋力捧,致女孩瘫痪的刘浩存,证实他的评价

动物奇奇怪怪
2026-05-19 01:40:47
中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

细说职场
2026-05-14 21:37:29
9月1日起全国推行:病床搬回家,医保能报销,千万家庭终于熬出头

9月1日起全国推行:病床搬回家,医保能报销,千万家庭终于熬出头

卡皮巴拉去看心理医生
2026-05-18 07:16:19
2026-05-19 10:40:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7283文章数 20751关注度
往期回顾 全部

科技要闻

苹果WWDC26定档6月9日凌晨:iOS27将亮相

头条要闻

夏奇拉再为世界杯献唱 曾用一瓶果酱抓到球星男友出轨

头条要闻

夏奇拉再为世界杯献唱 曾用一瓶果酱抓到球星男友出轨

体育要闻

58顺位的保罗,最强第三中锋

娱乐要闻

张雪峰42岁冥诞,学生家长自发缅怀

财经要闻

从卖流量到卖Token,运营商算力生意破局

汽车要闻

40.98万起!充电5分钟纯电续航420km 腾势N9闪充版胜算有多少?

态度原创

教育
房产
时尚
旅游
军事航空

教育要闻

以感恩为根,以学习为帆,以坚持为桨——任艳华家教好故事

房产要闻

7516元/㎡,161套一次全甩!海口住宅最低价出现了!

今夏超流行这6个颜色,每一种都是显白高手

旅游要闻

解码“沂蒙泉乡”共富密码,沂南铜井镇绘就文旅高质量发展新画卷

军事要闻

莫斯科遭一年多来最大规模无人机袭击 3死18伤

无障碍浏览 进入关怀版