网易首页 > 网易号 > 正文 申请入驻

【学术论文】基于MNIST的忆阻神经网络稳定性研究

0
分享至

  摘要

  为了探究忆阻器的稳定性问题对忆阻神经网络性能的影响,基于等效电阻拓扑结构的忆阻器模型,搭建了一个将忆阻器作为突触的BP神经网络,并利用MNIST数据集对该网络进行训练和测试。忆阻器的稳定性问题通过设置忆阻器参数波动来模拟,最终发现忆阻器一定程度内的性能波动会促进神经网络的收敛,但波动过大则会降低网络的收敛速度。为了表征波动的临界程度,测得了基于忆阻器模型的各参数的最大波动范围,并进一步计算出忆阻器件工艺层次参量的取值范围,为忆阻神经网络硬件化中忆阻器件的工艺制造和选用提供了参考。

  中文引用格式:田野,朱若华,汤知日,等.基于MNIST的忆阻神经网络稳定性研究[J].电子技术应用,2019,45(4):3-6,10.
英文引用格式:TianYe,ZhuRuohua,TangZhiri,etal.ResearchonthestabilityofmemristiveneuralnetworkbasedonMNIST[J].ApplicationofElectronicTechnique,2019,45(4):3-6,10.

  0 引言

  忆阻器是由物理学家蔡少棠教授在1971年提出的第四种电路基本元器件,其忆阻值联系磁通量和电荷量两个电路参量[1]。由于其非易失性(忆阻值可以存储起来)、忆阻值可通过对器件端压的调制实现连续变化等优点,可作为神经元突触来构建神经网络[2]。

  研究发现同一个忆阻器在相同的驱动下测得的多条传输特性曲线之间存在差异;相同制造工艺下,不同忆阻器的性能也不一样,即忆阻器件的性能并不稳定[3]。这些稳定性问题会对忆阻神经网络的收敛速度和功能实现产生影响。

  本文的研究目的是基于一种具有等效电阻拓扑结构的忆阻器模型,探究忆阻器稳定性问题对忆阻神经网络性能的影响,从而得出在保证忆阻神经网络性能的前提下模型参数的允许波动范围。根据忆阻器模型参数的意义,映射到器件工艺层次的参量波动,为忆阻器件的工艺制造和选型提供参考。

  1 忆阻器模型及稳定性仿真

  本文采用了一种具有等效电阻拓扑结构的忆阻器模型,该模型不仅能描述忆阻器的传输特性,而且能准确描述忆阻器的不稳定现象。通过设置波动的忆阻器参数,模拟忆阻器的不稳定性,为忆阻神经网络的搭建做准备。

  1.1 忆阻器模型

  随着忆阻器研究的发展,很多证据表明忆阻器的电阻转换现象是由于器件中作为导电通道的导电丝的形成和消失造成的[4],外加电压控制着导电丝的形成和消失,这样就可以把忆阻器划分为通道区域和无通道区域,导电通道则包括高阻和低阻区域,然后再通过一个合适的拓扑结构将这若干个通道结合起来,这就是本文使用的忆阻器模型[5]。其示意图及数学模型简化过程如图1所示。图(a)为忆阻器件结构图,可等效为图(b),其中由斜划线填充的柱体表示无通道区域,阻值远大于有通道区域(其他柱体),故由于并联可进一步简化为图(c)。

  基于上述模型的数学表达式如下,假设在忆阻器中存在N个导电通道,即图1(c)中的通道数,Rl表示低阻区域完全占据通道时一个导电通道的阻值;Rh表示高阻区域完全占据通道时一个导电通道的阻值。D为导电通道的总长度,Xi为低阻区域占据通道的长度(Xi≤D)。

  所以,第i个导电通道的忆阻值为:

  其中,Ci指定一个统计分布来描述在忆阻器中导电通道长度的不均匀性,θ和α决定通道的初始状态,θ用来调制Ci以给出合适的初值,α则对其进行进一步的调控;γ0用来对通道初始长度进行微调;β和λ则描述随着磁通量(偏压v(t)对时间t的积分)的积累,导电通道的动态变化过程。

  将式(5)、式(6)、式(7)带入式(4)得忆阻值M:

  1.2 忆阻器稳定性仿真

  将上述模型应用于一个Pt/TiO2/TiO2+x/Pt结构的实际忆阻器件中,对各项参数设值为:D=20nm,Roff=1.39 kΩ,Ron=25Ω,N=20。θ=0.05和α=1决定初始导电通道长度及其分布,γ0=-5.9对初始长度进行微调。λ=5.76和β=1将状态转换速度限制在一个比较低的水平,这种情况下忆阻值只能在25Ω~220.71Ω的范围内变化,通过MATLAB仿真得到该模型在周期性电压下I-V特性曲线,即如图2中所示β=1对应的曲线。

  该伏安特性曲线的形状表现为滞回曲线,而且忆阻值随时间变化的趋势与忆阻器相同,在后文中,以该忆阻器模型各参数的取值变化来模拟忆阻器的不稳定性。图2为参数β不同取值时忆阻器的传输特性曲线,其他参数α、γ0、λ不同取值时与之类似。这种对忆阻器不稳定性的模拟结果与YANGJJ等人搭建的忆阻器测试得到的不稳定性表现类似[6],说明该模型可以作为忆阻器件的仿真模型。

  2 忆阻BP神经网络设计与实现

  为了探究忆阻器的稳定性对忆阻神经网络的收敛速度和准确性的影响,搭建了一个三层的忆阻BP神经网络,并用手写数据集MNIST进行训练和测试。

  2.1 忆阻BP神经网络MATLAB实现

  本文中使用MNIST数据集[7]搭建3层全连接忆阻BP神经网络,网络结构为:输入层785个节点(图片28×28个输入节点和一个偏置点),隐藏层130个节点,输出层10个节点,网络结构如图3所示,隐藏层节点及输出层节点激活函数均为logistic函数[8]。

  即用权值变化量等效磁通量积累(磁通量积累由电压v(t)随时间t的积分得到),对忆阻值即权值进行更新。

  2.2 忆阻BP神经网络训练与测试

  不考虑忆阻器模型中的参数波动,设参数α=1,β=1,γ0=-5.9,λ=5.76,对神经网络进行训练及测试,图4为基于MNIST数据集训练的收敛过程,识别率在训练次数超过600次之后变化不显著;训练1500次之后测试识别率为94.32%。由训练记录数据知,训练次数超过573次之后,模型能够对训练集中超过56000组数据进行正确的分类,此时测试识别率为93.35%左右,这个结果将作为后续考虑忆阻器性能波动时的对照组。

  3 忆阻神经网络稳定性分析

  本节主要分析忆阻器模型中的各个参数波动模拟的忆阻器稳定性问题对忆阻神经网络训练及测试结果的影响,并从忆阻器模型的参数波动回溯到器件结构或性能层次的变化,得到模型参数及器件参量的允许波动范围。

  3.1 模型参数与忆阻器件的联系

  本文中忆阻器的忆阻值主要由N=20个相互独立的导电丝中低阻区域和高阻区域的相对长度决定,而低阻区域的初始长度Xi由式(5)、式(6)、式(7)决定:

  参数α、β、γ0决定Xi的初始长度,但由于γ0为负指数,β对其调控作用很小,故只考虑参数α和γ0对Xi的调控。由式(10)可以算出Xi的分布范围为[0.4294D~0.9475D]。分析式(8)可知,参数β、λ决定了忆阻器通电之后忆阻值随磁通量的变化速度,参数β、λ越大,忆阻值变化的越快。

  3.2 忆阻器参数波动对神经网络的影响

  为了定量地讨论忆阻器稳定性问题对忆阻神经网络的影响,对各个参数设置了不同的波动范围,参数在给定范围内随机取值,记录各种情况下训练中能够对训练集中56000组数据正确分类时需要的训练次数,并在训练后用测试集数据进行测试。认为训练次数较无参数波动时的573次增加10%,即630次以上时,忆阻器性能波动对网络收敛速度产生显著影响;测试识别率降到90%以下时对网络功能产生显著影响,那么忆阻器的波动就应该限制在该波动程度范围内。

  3.2.1 参数α的波动对网络的影响

  参数α是模型中调制导电通道初始长度的参量,初始值为1,对其设置了从±0.001α至±0.3α等多种程度的波动,分别训练多次之后得到各种波动程度下的平均训练次数如图5所示,图中也用散点表示了各种波动时的部分训练次数分布情况。训练完之后对所有情况进行了测试,准确率均在93%左右。

  由图5可以发现参数α的波动程度较小时,训练次数均小于573次,甚至小于450次,也就是说α的小范围波动加快了忆阻神经网络的训练收敛,而且不损失测试准确率。而随着波动程度的增大,训练需要的次数也慢慢增大,最终超过630次,虽然测试准确率仍然是93%左右,但严重影响了网络的收敛速度。

  所以可以得到在不影响忆阻神经网络稳定性的情况下,允许参数α的最大波动范围为±0.22α,即参数α取值应该在0.78~1.22之间。而参数α控制导电丝中低阻部分初始长度Xi,由式(10)可以得到一个忆阻器中Xi值的范围在0.3352D~1D之间,基于实际忆阻器件即6.704nm~20nm之间。

  3.2.2 参数β的波动对网络的影响

  参数β是模型中控制忆阻值随磁通量变化速度的参量,也就是影响忆阻神经网络突触权值更新幅度的参量,初始值为1,对其设置了从±0.005β至±8β等多种程度的波动,分别训练多次之后得到各种波动程度下的平均训练次数如图6所示,对各种情况进行了测试,准确率也均在93%左右。

  由图6可以看出,参数β较小程度波动时忆阻神经网络的收敛速度较无波动时快,而波动程度大于±5β之后,训练次数则普遍高于630次,对网络收敛速度产生显著影响,所以β取值范围应该在0~6之间。β主要调控忆阻值随磁通量的变化速度,只能从传输曲线表征,图2为β从小到大变化时忆阻器的传输曲线,忆阻器的传输曲线应该落在β=0和β=6对应曲线之间(其中β=0意味着忆阻器变成定值电阻)。

  3.2.3 参数γ0的波动对网络的影响

  参数γ0是模型中对导电通道初始长度进行微调的参量,初始值设为-5.9,对其设置了从±γ0/20、±γ0/10至±γ0/2等多个波动范围,各种情况下忆阻神经网络训练次数如图7所示;训练完之后对所有情况进行了测试,准确率均在93%左右,几乎无损失。

  由图7仍然可以发现参数γ0的波动程度较小时,忆阻神经网络训练收敛速度较无波动时更快,而且不损失测试准确率;波动程度达到±0.34γ0以上时,网络训练速度过慢,所以其波动应该控制±0.34γ0以内,即γ0取值应该在-7.906~-3.894之间。其调控的Xi的初始值范围应该在0.4283D~0.9641D之间,基于实际忆阻器件Xi的值为:8.566nm~19.282nm。

  3.2.4 参数λ的波动对网络的影响

  参数λ是模型中最直接控制忆阻值随磁通量变化速度的参量,与参数β的意义相似。初始值为5.76,对其设置了从±λ/10至±9λ等多种波动范围,忆阻神经网络训练次数如图8所示,在波动超过±8.4λ之后训练次数均超过1000,在图8中用1000表示。测试准确率保持在92%~93%,几乎无损失。

  不难看出,参数λ一定程度内的波动仍然会加快训练收敛速度,但是当波动程度过大之后,训练次数会急剧增加,很快超过1000次。由训练数据得到:参数λ波动范围在±8.35λ时,平均训练次数为618次,所以参数λ的波动应该控制在±8.35λ以内,这样才能保证忆阻神经网络的稳定性,即参数λ取值在0~53.856之间。λ对忆阻器特性的调控与β相似,从传输曲线上表征。其不同取值时忆阻器传输特性曲线如图9所示,即用作突触的忆阻器的传输曲线应该落在λ=0和λ=53.856对应的曲线之间(其中λ=0意味着忆阻器变成定值电阻)。

  4 结论

  本文基于一种等效电阻拓扑结构的忆阻器模型,探究了忆阻器作为神经网络突触时,其不稳定现象对忆阻神经网络的稳定性及功能实现的影响,并得出了基于MNIST手写数据集的忆阻神经网络中忆阻器性能参数在初始设置基础上的最大波动范围:参数α:±0.22α;参数β:±5β;参数γ0:±0.34γ0;参数λ:±8.35λ。反映到忆阻器模型中对应的器件参数上,即导电丝(总长度D=20nm)中低阻部分初始长度Xi应该控制在0.4283D~0.9641D之间,即8.566nm~19.282nm;忆阻值随磁通量的变化速度则从传输曲线上表征。本文的实验结果不仅证实了忆阻器作为神经网络突触结构的可行性,还发现作为突触的忆阻器一定程度内的性能波动会促进神经网络的收敛;此外,器件参量结果也为忆阻神经网络硬件化中忆阻器件的工艺制造和选用提供了一种参考。

  参考文献

  [1]CHUAL.Memristor-themissingcircuitelement[J].IEEETransactionsonCircuitTheory,1971,18(5):507-519.

  [2]王丽丹,段美涛,段书凯.基于STDP规则的忆阻神经网络在图像存储中的应用[J].电子科技大学学报,2013(5):642-647.

  [3]QUERLIOZD,BICHLERO,GAMRATC.Simulationofamemristor-basedspikingneuralnetworkimmunetodevicevariations[C].The2011InternationalJointConferenceonNeuralNetworks(IJCNN).IEEE,2011:1775-1781.

  [4]KWONDH,KIMKM,JANGJH,etal.AtomicstructureofconductingnanofilamentsinTiO2resistiveswitchingmemory[J].Naturenanotechnology,2010,5(2):148.

  [5]ZHUR,CHANGS,WANGH,etal.Aversatileandaccuratecompactmodelofmemristorwithequivalentresistortopology[J].IEEEElectronDeviceLetters,2017,38(10):1367-1370.

  [6]YANGJJ,PICKETTMD,LIX,etal.Memristiveswitchingmechanismformetal/oxide/metalnanodevices[J].NatureNanotechnology,2008,3(7):429.

  [7]黄睿,陆许明,邬依林.基于TensorFlow深度学习手写体数字识别及应用[J].电子技术应用,2018,44(10):6-10.

  [8]王蒙,常胜,王豪.一种自适应训练的BP神经网络FPGA设计[J].现代电子技术,2016,39(15):115-118.

  作者信息:

  田 野,朱若华,汤知日,常 胜

  (武汉大学 物理科学与技术学院,湖北 武汉 430072)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
观点:中国U17不是输给日本,而是输给对日本的执念

观点:中国U17不是输给日本,而是输给对日本的执念

体坛周报
2026-05-23 18:58:17
男子月薪六千元每月给老婆三千元,觉得老婆吃苦受累,竟偷面霜讨其欢心,警方:并非初犯,此前他给妻子偷过其他护肤品,给自己偷剃须刀

男子月薪六千元每月给老婆三千元,觉得老婆吃苦受累,竟偷面霜讨其欢心,警方:并非初犯,此前他给妻子偷过其他护肤品,给自己偷剃须刀

大风新闻
2026-05-24 10:17:35
8年友谊一夜打脸?王鹤棣深夜破防、沈月长文道歉:再好的关系,也扛不住没分寸的玩笑

8年友谊一夜打脸?王鹤棣深夜破防、沈月长文道歉:再好的关系,也扛不住没分寸的玩笑

东方不败然多多
2026-05-24 10:50:49
随着成都蓉城0-2,北京国安1-2,上海海港1-1,中超最新积分榜出炉

随着成都蓉城0-2,北京国安1-2,上海海港1-1,中超最新积分榜出炉

俯身冲顶
2026-05-23 22:01:18
周洁琼的脚可真大呀

周洁琼的脚可真大呀

手工制作阿歼
2026-05-24 11:00:00
没想到5月还没结束,患不死癌症的张嘉益,就给内娱演员敲响警钟

没想到5月还没结束,患不死癌症的张嘉益,就给内娱演员敲响警钟

仙味少女心
2026-05-23 11:14:45
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
曝出马英九伤人事件后,国民党这人提议:赶紧让司法介入

曝出马英九伤人事件后,国民党这人提议:赶紧让司法介入

健身狂人
2026-05-24 09:45:41
太恶心了!杨梅风波再生事端,有人穿拖鞋将脚直接踩在杨梅上分拣

太恶心了!杨梅风波再生事端,有人穿拖鞋将脚直接踩在杨梅上分拣

火山詩话
2026-05-23 06:28:19
连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

素衣读史
2026-05-15 21:46:27
中欧第三波争端开打,局面变成“1对27”,中方将派人赴欧面谈

中欧第三波争端开打,局面变成“1对27”,中方将派人赴欧面谈

知法而形
2026-05-24 11:49:00
漳州杨梅再添扎心细节:果子烂在树上,果农蹲在地头哭

漳州杨梅再添扎心细节:果子烂在树上,果农蹲在地头哭

天天热点见闻
2026-05-23 08:42:39
3-1,4-2!西甲大结局!姆巴佩获金靴,赫罗纳降级,最终排名出炉

3-1,4-2!西甲大结局!姆巴佩获金靴,赫罗纳降级,最终排名出炉

等等talk
2026-05-24 06:05:12
曝湖人计划送走里夫斯,砸重金引进年薪1.75亿级东部全明星

曝湖人计划送走里夫斯,砸重金引进年薪1.75亿级东部全明星

夜白侃球
2026-05-23 11:37:05
孙铭徽伤情更新!布朗来到禁赛斩杀线,3坏消息让广厦G1处于被动

孙铭徽伤情更新!布朗来到禁赛斩杀线,3坏消息让广厦G1处于被动

后仰大风车
2026-05-24 07:05:13
WSBK称将加快进入中国,张雪称明年将有4支车队使用张雪机车

WSBK称将加快进入中国,张雪称明年将有4支车队使用张雪机车

科普大世界
2026-05-24 11:13:10
公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

潋滟晴方DAY
2026-05-11 06:31:37
比肩杜兰特!布伦森今年季后赛正负值+200 最快26日横扫进总决赛

比肩杜兰特!布伦森今年季后赛正负值+200 最快26日横扫进总决赛

醉卧浮生
2026-05-24 11:26:32
禁止所有中国外交官入境,不让两岸统一,这个国家比美嚣张多了

禁止所有中国外交官入境,不让两岸统一,这个国家比美嚣张多了

共工之锚
2026-05-03 00:08:08
一觉醒来美国与伊朗基本达成协议!伊朗获全胜?以色列这次慌了

一觉醒来美国与伊朗基本达成协议!伊朗获全胜?以色列这次慌了

丹妮观
2026-05-24 11:12:31
2026-05-24 12:51:00
电子技术应用ChinaAET
电子技术应用ChinaAET
北大中文核心期刊
2739文章数 140关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

临产孕妇哭诉丈夫经同学介绍赴泰国后失联 警方已立案

头条要闻

临产孕妇哭诉丈夫经同学介绍赴泰国后失联 警方已立案

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

李晨郑恺冲上热搜!跑男停宣引热议

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

健康
教育
房产
游戏
艺术

外泌体 ≠ 生长因子!它们之间究竟有何区别?

教育要闻

最新调查发现:计算机毕业生,就业率断崖式下滑

房产要闻

疯抢511轮!今年海南最魔幻的地块,被福建能源企业抢了!

Xbox聊天AI助手称《GTA6》微软商店定价70美元

艺术要闻

日本写实画家作品《阿育王》

无障碍浏览 进入关怀版