网易首页 > 网易号 > 正文 申请入驻

ICLR2020|快速神经网络自适应技术

0
分享至

  本文介绍的是ICLR 2020的论文《Fast Neural Network Adaptation via Parameter Remapping and Architecture Search》,文章作者是华中科技大学方杰民。

  文 | 方杰民

  编 | 丛末

  论文链接:https://openreview.net/pdf?id=rklTmyBKPH

  代码链接:https://github.com/JaminFong/FNA

  1

  
简介

  神经网络在计算机视觉的各个领域都取得了巨大的成功。通常神经网络模型的设计都需要依托于图像分类的任务,比如在ImageNet分类数据集上设计神经网络,再直接把分类任务上设计的网络模型应用到其他任务(比如分割、检测等)的backbone上。然而由于任务的特性不同,所需要的backbone网络设计也不尽相同。人工神经网络结构的设计往往需要经验丰富的工程师花费比较多的精力来进行调整,效率不高。

  最近NAS(neural architecture search)方法的兴起极大的促进了神经网络的自动化设计,不少工作尝试在分割、检测的任务上展开网络结构搜索,但是backbone的预训练(pre-training)是一个消耗很大、又不可避免的操作。虽然最近的一些工作证实预训练对于最终精度而言不一定是必须的,但是从头训练需要花费大量的迭代次数来达到同等的精度。

  对于NAS算法而言,预训练的问题将更难解决,比如针对backbone的搜索,搜索空间中包含的所有可能的网络可能都面临预训练问题。One-shot/Differentiable的NAS方法虽然能将所有可能的网络集成为一个超网络(super network),但是超网络和最终搜出来的网络依然面临预训练的问题,其对应的计算代价都还是很大的。

  ImageNet数据集的预训练已经成为目前众多计算机视觉任务中一个标准的做法,深度学习社区里也有非常多的ImageNet预训练模型。

  本文从充分利用这些模型出发,提出了一种快速神经网络自适应的算法,该算法能够将一个手工网络作为种子网络,并将其结构和模型参数都快速适应到新任务(比如分割和检测)上。

  整个网络适应过程包含结构层面的适应和参数层面的适应,本文用 Differentiable NAS的方法来完成结构的适应,另外本文提出的参数重映射(parameter remapping)方法作用于两个层面的适应过程,极大的缩减了整个适应过程所需的计算代价。

  2

  
方法

  本文提出了一种参数重映射的方法,该方法旨在将种子网络的参数映射到一个新的网络中。 如图2所示,整个映射过程在深度、宽度、卷积核三个层面进行。实际映射过程中,深度层面的映射先开展,宽度和卷积核层面的映射同时进行。

  在深度层面上,对应层的参数相映射,新的层的参数来源于种子网络中相同阶段(stage)中的最后一层;在宽度层面上,本文在结构适应过程中允许更小膨胀系数的MobileNetV2卷积模块,对应通道的参数相映射;在卷积核层面上,本文采用了中心映射的方法,当MobileNetV2的3x3卷积核向更大核映射时,大核中心的3x3区域来源于种子网络的卷积核,其余区域赋予0值。

  如图1所示,整个适应过程分为三个阶段。

  首先,本文先将种子网络进行扩展(Network Expansion),成为一个包含了结构适应阶段所有可能搜索结构的超级网络,这个超级网络亦即搜索空间的一种表示。 然后本文将种子网络的参数用上述描述的参数重映射方法映射到超级网络上,随即在目标任务/数据集上展开基于Differentiable NAS的结构适应阶段。 网络结构搜索产出针对新任务/数据集的目标结构,此时种子网络的参数被再次重映射到目标结构上,随即展开目标任务/数据集上的参数适应过程。 最终得到参数和结构均被适应于目标任务/数据集的目标网络。

  整个适应阶段参数重映射被实施两次,种子网络的pre-trained参数得以充分利用,极大的缩减整个适应过程的计算代价。

  3

  
实验

  本文选取MobileNetV2(MBV2)作为种子网络,MBV2是一个性能卓越的轻量网络模型,其被广泛用于设计NAS方法的搜索空间。本文在语义分割Cityscapes和目标检测COCO任务上都进行了实验,相比于种子网络MBV2,FNA能以相同或者更小的MAdds取得更高的性能;相比于分割和检测的其他NAS算法,FNA总的计算代价要小很多,最终模型在目标任务上的性能也更强。

  本文进一步通过消融实验验证了所提出的参数重映射方法在FNA中的重要作用,通过参数重映射,总的计算代价能有效减少,并且最终获得的性能与ImageNet pretrain无异。本文还开展了随机搜索(random search)的实验,也取得了不错的效果, 该实验现象说明FNA其实是一种普适性较强的网络适应机制,其在某种意义上讲是搜索方法无关的。

  关于参数重映射的方案,本文也做了一系列探索,并提出更有效的参数重映射方案或可成为将来工作中比较值得探索的一块。

  社区中有较多开源的预训练模型,通过FNA可以将网络模型快速适应到新的任务中,实际场景中如果想要将现有模型应用于其他任务,不妨一试FNA的方法来进一步提升性能,其有效利用现有模型的预训练参数来减小所需算力,可为开发者节省不少成本,也给资源受限的开发者进一步研究带来可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
降价2万!上汽大众官宣:全新SUV,价格下调

降价2万!上汽大众官宣:全新SUV,价格下调

科技堡垒
2026-05-31 09:34:47
再见,皇马!2亿“超巨”遭挂牌出售!2.3亿“顶星”空降伯纳乌

再见,皇马!2亿“超巨”遭挂牌出售!2.3亿“顶星”空降伯纳乌

头狼追球
2026-05-31 18:13:08
著名音乐家姚峰:女儿姚贝娜病逝11年,他至今还为自己的失误懊悔

著名音乐家姚峰:女儿姚贝娜病逝11年,他至今还为自己的失误懊悔

小椰的奶奶
2026-06-01 13:58:22
夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

阿龙美食记
2026-05-29 21:52:34
全网震撼!张凌赫粉丝活生生挤爆玻璃大门!多人流血受伤+摔倒在玻璃渣上!

全网震撼!张凌赫粉丝活生生挤爆玻璃大门!多人流血受伤+摔倒在玻璃渣上!

魔都囡
2026-06-01 03:23:43
广厦0-3落后再传坏消息!胡金秋膝盖重伤,夺冠命运走向上海队

广厦0-3落后再传坏消息!胡金秋膝盖重伤,夺冠命运走向上海队

老吴说体育
2026-06-01 12:42:26
伊朗使用中国导弹击落美F-15战斗机,美中关系再起波澜?

伊朗使用中国导弹击落美F-15战斗机,美中关系再起波澜?

戗词夺理
2026-05-31 15:48:01
刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

北纬的咖啡豆
2026-05-31 14:40:49
破大防!荷兰大臣曾向全球承认误判:没想到中国真敢叫停芯片出口

破大防!荷兰大臣曾向全球承认误判:没想到中国真敢叫停芯片出口

阿离家居
2026-06-01 09:49:29
泽连斯基做梦没料到,先等来的不是俄军打基辅,而是中方划定底线

泽连斯基做梦没料到,先等来的不是俄军打基辅,而是中方划定底线

老赳说历史
2026-06-01 10:38:42
“谁敢质疑最高领袖?”——伊朗强硬派掀桌子,革命47年来头一遭

“谁敢质疑最高领袖?”——伊朗强硬派掀桌子,革命47年来头一遭

民间胡扯老哥
2026-05-31 11:57:37
一旦开战,沿海发达城市咋办?戴旭撂了句狠话,给大家吃了定心丸

一旦开战,沿海发达城市咋办?戴旭撂了句狠话,给大家吃了定心丸

清沐执笔
2026-05-22 11:53:46
国家统计局今日启动入户调查

国家统计局今日启动入户调查

澎湃新闻
2026-06-01 08:10:06
又熔断!韩股“疯魔”牛市,巴菲特指标敲响警钟

又熔断!韩股“疯魔”牛市,巴菲特指标敲响警钟

新浪财经
2026-06-01 12:08:03
成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

封面新闻
2026-05-31 18:34:39
6000万天价!里夫斯迎人生抉择:忠诚一文不值,现实才是底色

6000万天价!里夫斯迎人生抉择:忠诚一文不值,现实才是底色

小七七体育解说
2026-06-01 08:18:15
志愿军七个副司令,六个都风光无限,唯独他被冷落到底

志愿军七个副司令,六个都风光无限,唯独他被冷落到底

历史图鉴
2026-05-27 22:46:08
王菲现实长什么样?路人镜头才是照妖镜,突然理解谢霆锋的专一了

王菲现实长什么样?路人镜头才是照妖镜,突然理解谢霆锋的专一了

临云史策
2026-06-01 11:35:00
姆巴佩两难死局!世界杯全力踢成全别人嫁衣,摆烂则彻底无缘金球

姆巴佩两难死局!世界杯全力踢成全别人嫁衣,摆烂则彻底无缘金球

听我说球
2026-05-31 09:58:22
多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

中新经纬
2026-06-01 12:37:11
2026-06-01 14:28:50
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7322文章数 20755关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

游戏
旅游
亲子
健康
家居

“并非bug”!《GTA6》悬浮路灯竟是佛罗里达真实实景

旅游要闻

逛故宫的游客注意了,坤宁宫明起检修请绕行

亲子要闻

2025年我国批准儿童用药138个,创历史新高

尝试干细胞疗法如何避免踩坑?

家居要闻

自信舒展 高背座椅

无障碍浏览 进入关怀版