网易首页 > 网易号 > 正文 申请入驻

内存计算对边缘AI为何如此重要?

0
分享至

(本文编译自Semiconductor Engineering)

在大众媒体中,“人工智能”通常指运行在昂贵且高功耗数据中心的大型语言模型。然而,对于许多应用场景来说,在本地硬件上运行的小型模型则更为贴切。

自动驾驶汽车需要实时响应,避免数据传输延迟。医疗和工业应用通常依赖于无法与第三方共享的敏感数据。尽管边缘人工智能应用速度更快、更安全,但它们的计算资源却非常有限。它们无法拥有TB级的内存空间,也没有近乎无限的电力供应。

对于数据中心来说,这些限制可能有些抽象,但却对边缘人工智能施加了严格的限制。在2025年IEEE国际存储器研讨会上的一篇特邀论文及其后续预印本中,苏黎世联邦理工学院计算机科学教授Onur Mutlu及其同事指出,在典型的移动工作负载中,数据在内存中的移动占总能耗的62%。内存无疑是占用硬件空间最多的组件,但内存延迟往往也是导致执行时间延长的主要因素。

多年来,器件缩放一直是降低功耗的关键,但现在却使问题更加严重。Mutlu表示,规模庞大的DRAM稳定性较差,需要更频繁的刷新周期。大型内存阵列的访问难度也更大,因为带宽的增长速度不如内存条本身的增长速度快。

内存计算和近内存计算提供了可能的解决方案。即使是商用的现成DRAM,只要软件基础设施支持,也可以执行原始的数据复制、初始化和按位逻辑运算。

结合了RRAM和铁电体的混合解决方案

然而,DRAM刷新功耗的问题仍然存在。在神经网络模型中,训练和推理任务都会重复使用存储的权重矩阵。然而,两者的要求却截然不同。

正如CEA-Leti的Michele Martemucci及其同事所解释的,训练任务涉及对权重矩阵进行多次小幅更新,使其逐渐收敛至稳定值。这类任务要求存储器具备高写入耐久性和存储精确值的能力。相比之下,推理任务使用的是稳定不变的权重矩阵,但可能会将其多次应用于输入数据,因此更适合采用具有高读取耐久性的非易失性存储器。无论是训练还是推理,近内存计算都需要与标准CMOS逻辑工艺兼容的设备。

阻变存储器(RRAM)结构简单,依靠氧化层中形成的导电细丝来实现极高的读取耐久性。通过精心设计的编程方案,它们可以存储模拟值,从而减小存储器阵列的大小。Martemucci表示,RRAM技术已经足够成熟,可以在边缘推理场景中进行商业部署。

遗憾的是,RRAM的写入耐久性相对较低。随着时间的推移,编程脉冲会模糊存储值之间的电阻差异。设计人员通常使用传统硬件训练模型,然后将预先计算的权重加载到RRAM阵列中。然而,在许多应用中,边缘设备需要具备“学习”能力。它要么需要根据用户的特定需求进行训练,要么需要修改模型以反映实际流程的变化。

与此同时,铁电电容器支持超快速切换,且具备极高的写入耐久性,能够轻松承受训练任务中频繁的写入操作。然而,尽管其存储的值具有非易失性,但读取操作却具有破坏性。Martemucci表示,这类器件不适合长期存储权重矩阵,也不适合需要频繁读取操作的推理任务。

将铁电晶体管集成到CMOS工艺中非常复杂,需要高温工艺和额外的掩模层。而铁电电容器和隧道结则简单得多,因此多个研究团队开始尝试结合阻变存储器和铁电结构。例如,在今年的VLSI技术研讨会上,SK海力士的研究人员展示了一种兼具电阻和铁电开关功能的混合铁电隧道结(FTJ)。

在传统的FTJ中,顶部和底部电极之间的隧道势垒取决于铁电极性。SK海力士的器件将铁电铪锆氧化物(HZO)层夹在两个电极之间,钽层用作氧空位储存器。钽层附近的导电细丝在器件顶部提供欧姆导电,从而降低了铁电隧道势垒的有效厚度。这些器件实现了精确的模拟乘法累加运算,效率高达每瓦224.4万亿次运算(TOPS/W)。

在另一种混合方法中,Martemucci团队将掺杂硅的HfO2电容器与钛氧清除层整合到标准CMOS BEOL工艺中。这些器件最初表现为铁电电容器,其中一些器件接收一次性“唤醒”脉冲以稳定铁电响应。同时,电容器阵列的另一部分经过一次性“成型”工艺,形成由氧空位构成的导电细丝。钛层充当氧空位储存器,可防止细丝溶解。由此产生的忆阻器器件可以在高阻和低阻状态之间切换。


图1:金属-铁电-金属堆叠结构可作为铁电电容器(FeCAP)或忆阻器使用。

(图源:CEA-Leti)

铁电电容器用作二进制元件,存储用于训练计算的高精度权重。忆阻器存储的模拟权重精度足以应对推理任务。在训练过程中,忆阻器阵列每完成100个输入步骤后更新一次,而铁电阵列则持续更新。针对标准数字识别任务训练该结构时,总写入操作次数比忆阻器的耐久性上限低17倍,比铁电电容器的耐久性上限低75倍,同时能耗比持续更新忆阻器阵列所需的能耗低38倍。

人工智能不仅仅是神经网络

内存计算不仅可以提高传统神经网络计算的能效,还能促进其他建模方法的发展。例如,许多计算难度高的问题可以建模为伊辛模型,即一组连接的节点共同演化至最低能量状态。现实世界中,这类问题可能涉及数千甚至数百万个连接。

解决伊辛模型问题是量子计算最引人入胜的潜在应用之一。更传统的方法是,在去年的IEEE电子设备会议上,德克萨斯大学研究员Tanvir Haider Pantha和他的同事们提出,在CMOS逻辑工艺的后端工艺(BEOL)中整合铁电场效应晶体管(FeFET),构建三维结构。每个节点由四个交叉耦合的FeFET组成,可存储一个带符号的模拟值,该值映射到待解决问题的伊辛耦合矩阵。每个节点的输出是其相邻节点的输入,从而在整个网络中建立振荡,最终达到稳定的最小能量配置。


图2:四个交叉耦合双栅FeFET构成相变纳米振荡器。

(图源:IEDM)

内存计算需要新框架

传统的CPU和GPU是通用器件。只需更改软件即可应用于许多不同的问题。而近内存和内存加速器目前与其预期任务密不可分。伊辛模型求解器、点云网络和图像识别网络将以不同的方式处理数据,需要不同的硬件设计。Mutlu表示,内存计算的下一步将需要能够重新映射内存访问以满足特定问题要求的软件框架。反过来,这些框架将需要能够独立于外部内存控制器、进行自我管理的内存硬件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

近史谈
2026-01-19 10:09:51
后续!绝情臭豆腐最新进展:负责人正脸曝光社死,店老板公开道歉

后续!绝情臭豆腐最新进展:负责人正脸曝光社死,店老板公开道歉

离离言几许
2026-02-28 18:08:15
绝情臭豆腐事件大结局:店老板发声,双方已和解,赔偿金额已到账

绝情臭豆腐事件大结局:店老板发声,双方已和解,赔偿金额已到账

潮鹿逐梦
2026-02-28 21:25:16
首日战况:美以三板斧袭击伊朗斩首战果显著,哈梅内伊及亲属遇难

首日战况:美以三板斧袭击伊朗斩首战果显著,哈梅内伊及亲属遇难

装甲铲史官
2026-03-01 10:32:21
媒体发布卫星图 显示哈梅内伊住所遭袭的前后对比景象

媒体发布卫星图 显示哈梅内伊住所遭袭的前后对比景象

财联社
2026-03-01 13:07:07
伊朗一小学遭导弹袭击,已致118人死亡

伊朗一小学遭导弹袭击,已致118人死亡

界面新闻
2026-03-01 07:29:30
赌中国不会还手?巴拿马总统被秒打脸,中方第五波反制马上就到

赌中国不会还手?巴拿马总统被秒打脸,中方第五波反制马上就到

石江月
2026-02-28 17:09:34
伊朗最高领袖哈梅内伊遇袭身亡,特朗普警告轰炸行动暂不会停!

伊朗最高领袖哈梅内伊遇袭身亡,特朗普警告轰炸行动暂不会停!

财联社
2026-03-01 10:14:07
被美以轰炸后,伊朗民众为何不慌?甚至在跳舞欢呼庆祝

被美以轰炸后,伊朗民众为何不慌?甚至在跳舞欢呼庆祝

老马拉车莫少装
2026-02-28 22:43:52
回顾:孙子长相神似爷爷,婆婆怀疑儿媳12年,亲子鉴定后全家愣住

回顾:孙子长相神似爷爷,婆婆怀疑儿媳12年,亲子鉴定后全家愣住

谈史论天地
2026-02-28 14:55:57
特朗普应该想不到:他对伊朗的灭国之战,让中俄欧看清了一个真相

特朗普应该想不到:他对伊朗的灭国之战,让中俄欧看清了一个真相

头条爆料007
2026-02-28 18:49:20
哈梅内伊身亡,布达诺夫:俄罗斯会接受美国为乌克兰提供的安全保证 | 狼叔看世界

哈梅内伊身亡,布达诺夫:俄罗斯会接受美国为乌克兰提供的安全保证 | 狼叔看世界

狼叔看世界
2026-03-01 11:40:52
哈梅内伊身亡,115名孩童葬身空袭!战争之下,医务人员的坚守有多痛?

哈梅内伊身亡,115名孩童葬身空袭!战争之下,医务人员的坚守有多痛?

医脉圈
2026-03-01 11:10:40
美以对伊朗斩首轰炸得逞 “反常规”白天空袭是成功关键

美以对伊朗斩首轰炸得逞 “反常规”白天空袭是成功关键

洪超飞军事
2026-03-01 11:47:26
“反诈老陈”账号被封,本人回应:问心无愧!MCN机构:即刻解除所有合约,双方合作立即终止

“反诈老陈”账号被封,本人回应:问心无愧!MCN机构:即刻解除所有合约,双方合作立即终止

都市快报橙柿互动
2026-03-01 07:15:47
怎么也想不通,她长这么漂亮,演技那么好,为啥一直火不起来呢

怎么也想不通,她长这么漂亮,演技那么好,为啥一直火不起来呢

草莓解说体育
2026-03-01 00:47:24
哈梅内伊死了,美伊战争烈度比想象的要大很多

哈梅内伊死了,美伊战争烈度比想象的要大很多

黑噪音
2026-03-01 09:49:45
真香啊!个税退税退回21606.18元,浙江一网友晒出自己的“经验”

真香啊!个税退税退回21606.18元,浙江一网友晒出自己的“经验”

火山詩话
2026-03-01 10:32:25
突然大跌,15万人爆仓!伊朗发射高超音速导弹,并封锁霍尔木兹海峡,油价或飙升,国内金饰克价突破1600元

突然大跌,15万人爆仓!伊朗发射高超音速导弹,并封锁霍尔木兹海峡,油价或飙升,国内金饰克价突破1600元

每日经济新闻
2026-03-01 01:03:36
28分钟22+9+7提前打卡!41岁詹皇又创三纪录 美记讽刷数据遭打脸

28分钟22+9+7提前打卡!41岁詹皇又创三纪录 美记讽刷数据遭打脸

颜小白的篮球梦
2026-03-01 11:48:51
2026-03-01 13:19:00
TechSugar incentive-icons
TechSugar
做你身边值得信赖的科技新媒体
5011文章数 12734关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

伊方:目前用的只是"废旧导弹" 将展示不可预见的武器

头条要闻

伊方:目前用的只是"废旧导弹" 将展示不可预见的武器

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

小米汽车2月交付超20000台 雷军:为新SU7量产作准备

态度原创

时尚
旅游
亲子
本地
健康

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

旅游要闻

重庆位居TOP10热门错峰游目的地,错峰出游迎来“黄金窗口期”

亲子要闻

惊!48岁再婚女孕7个月才知,顺产揭秘引关注!

本地新闻

津南好·四时总相宜

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版