网易首页 > 网易号 > 正文 申请入驻

神经网络debug太难了,这里有六个实用技巧

0
分享至

机器之心报道

编辑:Liyuan、蛋酱

神经网络的 debug 过程着实不容易,这里是一些有所帮助的 tips。

基于神经网络的项目瓶颈通常并非对网络的实现。有时候,在编写了所有代码并尝试了一大堆超参数配置之后,网络就是无法正常工作。尤其是面对着数百万的参数, 任何一个小变动都有可能前功尽弃。

在面对各种各样的问题后,有人总结了一些帮助调试神经网络的实用 tips,希望能够减少大家调试神经网络的成本。

检查梯度问题

有时梯度是引发问题的原因。下面是几种与梯度相关的调试方法:

  • 数值计算每个权重的梯度。这通常被称为「梯度检查」,有助于确保正确计算梯度,其中一种方法是使用有限差分。
  • 比较每个权重的大小和梯度的大小。要确保大小的比率是合理的。如果梯度大小远小于权重大小,网络将花费很长时间进行训练。如果梯度大小与权重大小大致相同或更大,网络将非常不稳定,可能根本不会训练。
  • 检查梯度爆炸或消失。如果梯度变为 0 或 nan/infinity,则可以确定网络没有被正确训练。需要首先弄清楚为什么会发生爆炸 / 消失梯度,是否步数太大。一旦弄清楚梯度爆炸 / 消失的原因,就有各种解决方案来解决这个问题,例如添加残差连接以更好地传播梯度或简单地使用较小的网络。
  • 激活函数也会导致梯度爆炸 / 消失。如果 sigmoid 激活函数的输入太大,梯度将非常接近 0。随着时间的推移检查激活函数的输入,然后确保这些输入不会导致梯度始终为 0 或很大。

检查训练过程

经常检查网络的训练进度可以节省时间。以训练贪吃蛇游戏为例,不是训练网络好几天,然后再检查网络是否学到了什么,而是每十分钟用当前学到的权重运行游戏。几个小时后,如果我们注意到每次都在做同样的事情并且获得零奖励,就知道可能有问题了,而这节省了几天的训练时间。

不要依赖定量输出

如果只查看定量输出,我们可能会错过有用的调试信息。例如,在训练语音翻译网络时,比起只检查评估函数是否在减少,更重要的是阅读翻译后的语音以确保它有意义;当训练一个用于图像识别的网络时,一定要确保手动检查网络提供的标签。

不应该依赖定量输出的原因有两个:首先,评估函数中可能存在错误。如果只查看错误评估函数输出的数字,可能需要数周时间才能意识到出现问题。其次,在神经网络输出中可能存在无法定量显示的错误模式。我们可能会意识到某个特定单词总是被错误翻译,或者在左上象限的图像识别网络总是错误的。这些观察结果反过来可以帮助找到数据处理部分的代码 bug,否则这些 bug 将被忽视。

尝试小数据集

确定代码是否存在 bug 或数据是否难以训练的另一种方法是首先拟合较小的数据集,比如将数据集中 100000 个训练示例修剪成只有 100 个甚至 1 个训练示例。如果在一个训练示例的情况下,网络仍然有很高的测试错误,不能够非常好地拟合数据,那么几乎可以肯定网络代码有问题。

尝试更简单的网络

如果全尺寸网络在训练时遇到问题,可以尝试使用层数较少的较小网络,这样可以更快地训练。如果较小的网络在全尺寸网络失败的情况下成功了,则表明全尺寸模型的网络架构过于复杂。如果简单网络和全尺寸网络都失败,则代码中可能存在 bug。

试着使用框架

如果没有使用机器学习框架编写神经网络的代码,那么可以通过在机器学习框架中编写相同的网络架构来检查问题何在。然后将打印语句放入非框架版本和框架版本中逐层比较输出,直到找到打印语句出现差异的位置,即错误所在。如果在反向传播期间发生错误,则可以从最后一层开始逐层打印权重的渐变,直到找到差异。但是此方法仅适用于网络的第一次迭代,因为由于第一次迭代输出的差异,第二次及以后的迭代将具有不同的起点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三个反美的国家,紧紧地抱在了一起!

三个反美的国家,紧紧地抱在了一起!

3号视频
2024-04-24 14:33:16
吧友言论:约基奇最巅峰年纪等大伤穆雷波特2年 这才是篮球的意义

吧友言论:约基奇最巅峰年纪等大伤穆雷波特2年 这才是篮球的意义

直播吧
2024-04-26 16:04:25
天哪罗志祥的脸太吓人了,满脸的科技感,好像哪里都动过了

天哪罗志祥的脸太吓人了,满脸的科技感,好像哪里都动过了

娱乐八卦木木子
2024-04-26 03:08:07
苹果手机输入“发现石油”会自动定位?记者实测:安卓也这样

苹果手机输入“发现石油”会自动定位?记者实测:安卓也这样

南方都市报
2024-04-25 08:08:16
姜还是老的辣,一张豪华品牌销量榜单,直接深深打脸自主品牌

姜还是老的辣,一张豪华品牌销量榜单,直接深深打脸自主品牌

一笑一言
2024-04-23 20:53:07
官宣:任骏飞宣布退役决定,安置曝光,杜锋送祝福

官宣:任骏飞宣布退役决定,安置曝光,杜锋送祝福

元爸体育
2024-04-26 14:14:40
纳了闷了!一个四当家,三分不行,突破不行,为什么敢要4年1.6亿

纳了闷了!一个四当家,三分不行,突破不行,为什么敢要4年1.6亿

球毛鬼胎
2024-04-25 18:24:06
全美排名第4!再见了,杨瀚森!这才是能打NBA的中国内线……

全美排名第4!再见了,杨瀚森!这才是能打NBA的中国内线……

篮球实战宝典
2024-04-26 05:36:45
不给钱就开打?美连下3道挑战书,中国运回黄金,就赌美联储崩盘

不给钱就开打?美连下3道挑战书,中国运回黄金,就赌美联储崩盘

戎评说
2024-04-26 12:01:20
许钟豪重伤任骏飞后!孙铭徽讽刺发声:“人不行了 快点急救”

许钟豪重伤任骏飞后!孙铭徽讽刺发声:“人不行了 快点急救”

狼叔评论
2024-04-26 02:28:15
上海裕安投资集团原董事长余锦旺接受审查调查

上海裕安投资集团原董事长余锦旺接受审查调查

界面新闻
2024-04-26 15:48:58
朱军六十大寿!谭梅晒夫妻合照为丈夫庆生,无意返聘央视钻研书画

朱军六十大寿!谭梅晒夫妻合照为丈夫庆生,无意返聘央视钻研书画

娱小小新
2024-04-26 14:30:58
笑不活了,和泼天的富贵擦肩而过,是什么体验,要被评论区笑死了

笑不活了,和泼天的富贵擦肩而过,是什么体验,要被评论区笑死了

石辰搞笑日常
2024-04-15 20:05:36
紧张局势再升级!布林肯发出警告,中方高层即将访俄应对压力!

紧张局势再升级!布林肯发出警告,中方高层即将访俄应对压力!

小豆豆赛事
2024-04-26 08:29:11
回族女性剃毛传统:是习俗还是必要?

回族女性剃毛传统:是习俗还是必要?

书山有路勤为径
2024-04-26 11:47:39
干部阻拦春耕最新进展:让敛钱人被扒出,纪云浩部队照惹质疑

干部阻拦春耕最新进展:让敛钱人被扒出,纪云浩部队照惹质疑

180°视角
2024-04-25 11:07:23
我国在读博士生超61万人,其中中科院大学3.1万、清华2万、浙大1.7万等,这一数据说明了什么?

我国在读博士生超61万人,其中中科院大学3.1万、清华2万、浙大1.7万等,这一数据说明了什么?

柳叶刀学术
2024-04-25 21:29:00
29省份一季度GDP出炉,广东蝉联第一,这个东北省份增速最快

29省份一季度GDP出炉,广东蝉联第一,这个东北省份增速最快

鲁中晨报
2024-04-26 16:01:07
姚前接受纪律审查和监察调查

姚前接受纪律审查和监察调查

新京报
2024-04-26 15:54:18
金锁被官兵欺负,只剩一件“肚兜”的时候,你还记得尔康说了啥么

金锁被官兵欺负,只剩一件“肚兜”的时候,你还记得尔康说了啥么

娱乐的小灶
2024-04-25 00:23:04
2024-04-26 18:10:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

中国车企“五常”激战北京车展

头条要闻

北漂12年男子:晚上住轿车里 周末于太原北京双城通勤

头条要闻

北漂12年男子:晚上住轿车里 周末于太原北京双城通勤

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

家居
数码
手机
教育
房产

家居要闻

光影之间 空间暖意打造生活律动

数码要闻

三星 Galaxy Watch 7 Ultra 智能手表曝光,有望配血糖监测功能

手机要闻

真我C65 5G正式发布 搭载天玑6300 起售价不到千元

教育要闻

​成都少年闪耀榕江“村超”,川剧变脸与《成都》合唱引爆全场

房产要闻

涉及黄埔、番禺、增城!广州新一轮大规模征地启动

无障碍浏览 进入关怀版