网易首页 > 网易号 > 正文 申请入驻

CVPR论文解读:全新的Mimic方法,效果远优于传统

0
分享至

雷锋网 AI科技评论按:CVPR 2017正在夏威夷火热进行中,精彩论文层出不穷。下文是Momenta高级研发工程师蒋云飞对会上 Mimicking Very Efficient Network for Object Detection 论文进行的解读。

背景

Mimic作为一种模型小型化的方法,Hinton在 Distilling the Knowledge in a Neural Network 一文中已经详细定义并介绍过,但近些年来大部分有关于mimic的论文主要都是局限在较为简单的classification 的任务中,而对于较为复杂一些的detection任务,直接套用以前的方案则显得不行。本文提出了一种学习feature map来实现Object Detection任务上mimic的方法。

传统的Mimic过程,一般使用一个已经训练好的大模型,固定该模型的weights不变,设计一个小模型,学习大模型的soft targets 或者logits的输出;大模型学习到有效的信息可以传递给小模型,使得小模型也可以有较为不错的性能表现,其Loss函数如下:

其中W为小模型的weights,g(x;W) 为小模型的输出,z为学习的大模型的输出。

然而直接套用该方法在检测任务中,效果很差,因此作者进行了进一步的探索。首先,对于常见的检测网络如Faster-RCNN、RFCN、SSD等进行分析,可以发现,它们主要包含两部分,分别为feature extractor以及feature decoder。而不同的大网络主要是feature extractor不同,因此作者认为对于feature map进行mimic,可以获得较为有效的结果。

Mimic方法详细叙述:

因此作者提出了本文的mimic算法,在使用本身ground-truth监督小模型训练的同时,加入大小模型之间feature map的监督,使得mimic的效果会更好。大致的流程如下图所示:

但同时作者也指出,单纯使小模型学习大模型的feature map并不能work,原因在于feature map的维度太高,包含太多全局的信息,而对于仅有少量object的feature map,通常只有微弱的响应。因此,该文中提出了一个新的卷积网络mimic方法,即将学习整个feature map变为学习proposal采样之后的feature来简化任务。

在由小网络生成的proposal中,使用spatial pyramid pooling方法在大小网络上进行局部特征采样(后经作者指正为直接使用pixel-wise的学习),然后通过L2 loss减小二者之间的差别,loss function定义如下:

总的loss主要由两部分组成,分别为mimic loss 以及ground-truth loss,作者在实验中发现,对于mimic loss进行normalization可以取得更为稳定的mimic结果:

同时,作者还提到了对于小网络与大网络feature map大小不同的情况(譬如小网络中输入图像减半),可以增加一个转换层(deconvolution)使得大小网络最终mimic的层保持一致,如下图所示:

另外,在faster rcnn中stage2 fast rcnn的训练过程中,也可以添加大网络的监督信号(监督框的classification以及regression),使得小网络可以学习到更多大网络的有效信息,得到更好的结果。

结果分析:

作者在Caltech行人数据集以及PASCAL VOC 2007 数据集上进行了实验。

Caltech使用log average Miss Rate on False Positive Per Image作为评价标准,作者首先训练并得到了两个baseline检测网络:

同时,定义了mimic的小网络的结构为1/n-Inception 网络,网络的深度与层数没有改变,减小每层conv的channel个数,使得网络变得更细。

可以看到直接使用传统mimic方法训练模型,结果非常糟糕,甚至不及直接使用数据集对小网络进行训练:

而后作者使用本文方法进行Mimic训练,取得了较为可观的性能增长:

从上述结果中,可以看到使用mimic的结果取得了与原网络差不多甚至稍好的结果。

同理,在VOC数据集的测试结果中也可以看到,Mimic的方法取得了很有竞争力的结果。

现场问答

在2017 CVPR现场与论文的作者李全全进行的讨论与交流:

Q:本文为何使用 spatial pyramid pooling进行feature map的sample,是否考虑使用其他方式例如ROI-pooling?

A:经过李全全确认,他后期是直接使用ROI,也即两个feature map pixel-wise相减,而不是spatial pyramid pooling;使用SPP的效果理应是好于单size的pooling的(roi-pooling)。

Q:为何使用单层(最后一层)feature map进行mimic,是否可以融合多个feature map?

A:可以尝试融合多个feature map 进行监督,理论上来说效果应该会比较好,但由于时间较为紧张,所以没有做。文中使用的normalization是为了稳定,因为每次出来的proposal的size是不断变化的,因此在计算loss的时候的pixel的数量也会发生较大的变化,因此需要使用normalization。

Q:为何使用 deconvolution,是否可以对feature map 直接进行线性缩放?

A:直接对于feature map进行缩放是可行的。同时,这样的结构本身会在小物体的检测上比较有用。如果把deconv层独立成一个分支的话(deploy的时候去掉这个分支),效果可能比不上将这个小网络放大,目前看来,大的feature层对于小物体的检测还是比较有好处的。

Q:为何使用小网络生成的 proposal ,有没有尝试过直接使用 ground-truth boxes?

A:希望模型更多的是关注object在feature map上有响应的地方,所以使用Top-proposal。具体来说,Top-proposal的方法中,proposal的数量设定在256或者512,正负样本比例设定在1:1;而使用GroundTruth的框来做监督的效果并不好,作者有进行过类似的实验:对于负样本来说使用random的sample,正样本直接使用GroundTruth,结果比使用top-proposal的方法差一些。

Q:有没有尝试过其他不同网络结构的mimic (更小或者更瘦长的)?

A:对于mimic来说,其实小网络本身有一个baseline,大网络有一个baseline,mimic的任务便是缩小两者之间的差别;而对于小网络来说,相似的网络会有较好的学习能力,当然对于不同结构的小网络也可以使用deconv的方式来进行学习。

论文地址:http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Mimicking_Very_Efficient_CVPR_2017_paper.pdf

雷锋网 AI科技评论编辑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子向华为售后投诉,并告知已在网上发视频维权,结果维权账号火速被禁言

女子向华为售后投诉,并告知已在网上发视频维权,结果维权账号火速被禁言

西虹市闲话
2026-05-21 16:14:45
满嘴“基本盘”,不过是“盘中餐”

满嘴“基本盘”,不过是“盘中餐”

团结湖参考
2026-05-21 08:05:21
U17世界杯抽签结果:中国男足被分入死亡之组,中国女足好签

U17世界杯抽签结果:中国男足被分入死亡之组,中国女足好签

侧身凌空斩
2026-05-21 22:40:22
队魂!36岁周鹏献制胜三分获盛赞 15分钟8分创今年季后赛新高

队魂!36岁周鹏献制胜三分获盛赞 15分钟8分创今年季后赛新高

醉卧浮生
2026-05-21 21:48:33
61岁郭富城参观方媛舅舅的饭店,和一帮亲戚喝酒,获外婆拥抱送别

61岁郭富城参观方媛舅舅的饭店,和一帮亲戚喝酒,获外婆拥抱送别

一盅情怀
2026-05-21 16:23:41
穆里尼奥晴天霹雳!阿隆索强挖皇马未来核心!切尔西 9000 万撬走

穆里尼奥晴天霹雳!阿隆索强挖皇马未来核心!切尔西 9000 万撬走

奶盖熊本熊
2026-05-22 01:27:28
哈兰德加盟皇家马德里的条件

哈兰德加盟皇家马德里的条件

绿茵情报局
2026-05-21 19:51:47
叔侄俩将溺亡男子送回家离开,未通知对方家人也未报警,3天后被发现已腐烂,系做好事还是涉嫌犯罪?

叔侄俩将溺亡男子送回家离开,未通知对方家人也未报警,3天后被发现已腐烂,系做好事还是涉嫌犯罪?

大风新闻
2026-05-21 21:55:24
特朗普回应中俄元首会晤

特朗普回应中俄元首会晤

中国网
2026-05-21 08:55:06
2.36万元订单买家申请“仅退款” 商家千里报警维权 目前货款已结清

2.36万元订单买家申请“仅退款” 商家千里报警维权 目前货款已结清

红星新闻
2026-05-21 21:04:32
杨梅丑闻还没完,荔枝又出事了!商贩大把撒药浸泡,场面触目惊心

杨梅丑闻还没完,荔枝又出事了!商贩大把撒药浸泡,场面触目惊心

谭谈社会
2026-05-21 12:17:39
73岁普京状态似50岁,坦言:避免深夜进食、喝这种酸奶,每天运动

73岁普京状态似50岁,坦言:避免深夜进食、喝这种酸奶,每天运动

时光派长寿观察
2026-05-20 12:45:03
两部门:禁止直接或间接从菲律宾输入猪、野猪及其相关产品

两部门:禁止直接或间接从菲律宾输入猪、野猪及其相关产品

新京报
2026-05-21 16:29:13
纳斯达克中国金龙指数跌幅扩大,现跌3%

纳斯达克中国金龙指数跌幅扩大,现跌3%

每日经济新闻
2026-05-21 23:03:10
恭喜!丧妻1月后迟重瑞近况曝光,身边有佳人陪伴 陈丽华悔不当初

恭喜!丧妻1月后迟重瑞近况曝光,身边有佳人陪伴 陈丽华悔不当初

科学发掘
2026-05-21 17:53:51
上海28岁天才股神直言:目前股市想要逢低建仓,建议死啃513战法

上海28岁天才股神直言:目前股市想要逢低建仓,建议死啃513战法

股经纵横谈
2026-05-21 20:36:31
台海突发海空对峙!

台海突发海空对峙!

安安说
2026-05-21 10:26:13
606票:16票,欧盟报复开始,对中国进口钢铁征收50%关税

606票:16票,欧盟报复开始,对中国进口钢铁征收50%关税

流史岁月
2026-05-21 14:25:07
大家不要倒在黎明前!

大家不要倒在黎明前!

维舟
2026-05-21 21:10:33
美六州初选,所有川普支持者全部胜出,所有反对川普者全部出局

美六州初选,所有川普支持者全部胜出,所有反对川普者全部出局

壹家言
2026-05-21 08:49:10
2026-05-22 02:04:51
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69400文章数 656130关注度
往期回顾 全部

头条要闻

母亲阳台烧香后外出 引发火灾致2名子女死亡

头条要闻

母亲阳台烧香后外出 引发火灾致2名子女死亡

体育要闻

常住人口7000的小镇,拥有了一支德甲球队

娱乐要闻

反转!金秀贤与金赛纶未成年时交往不实

财经要闻

潮水退去,裸泳的一定不止五粮液

科技要闻

小米YU7 GT正式发布:售价38.99万元

汽车要闻

雷军:YU7首战Model Y八败两胜 输给全球销冠不丢人

态度原创

健康
房产
时尚
本地
教育

外泌体与干细胞竟是“快递”与“工厂”的关系?

房产要闻

顺德澐璟楼王『澐冠』启幕|一场高阶共鸣的静奢美学之约

今年夏天最流行的4组搭配,谁穿谁好看!

本地新闻

用云锦的方式,打开江苏南京

教育要闻

高考地理|气候详解

无障碍浏览 进入关怀版