网易首页 > 网易号 > 正文 申请入驻

内存计算对边缘AI为何如此重要?

0
分享至

(本文编译自Semiconductor Engineering)

在大众媒体中,“人工智能”通常指运行在昂贵且高功耗数据中心的大型语言模型。然而,对于许多应用场景来说,在本地硬件上运行的小型模型则更为贴切。

自动驾驶汽车需要实时响应,避免数据传输延迟。医疗和工业应用通常依赖于无法与第三方共享的敏感数据。尽管边缘人工智能应用速度更快、更安全,但它们的计算资源却非常有限。它们无法拥有TB级的内存空间,也没有近乎无限的电力供应。

对于数据中心来说,这些限制可能有些抽象,但却对边缘人工智能施加了严格的限制。在2025年IEEE国际存储器研讨会上的一篇特邀论文及其后续预印本中,苏黎世联邦理工学院计算机科学教授Onur Mutlu及其同事指出,在典型的移动工作负载中,数据在内存中的移动占总能耗的62%。内存无疑是占用硬件空间最多的组件,但内存延迟往往也是导致执行时间延长的主要因素。

多年来,器件缩放一直是降低功耗的关键,但现在却使问题更加严重。Mutlu表示,规模庞大的DRAM稳定性较差,需要更频繁的刷新周期。大型内存阵列的访问难度也更大,因为带宽的增长速度不如内存条本身的增长速度快。

内存计算和近内存计算提供了可能的解决方案。即使是商用的现成DRAM,只要软件基础设施支持,也可以执行原始的数据复制、初始化和按位逻辑运算。

结合了RRAM和铁电体的混合解决方案

然而,DRAM刷新功耗的问题仍然存在。在神经网络模型中,训练和推理任务都会重复使用存储的权重矩阵。然而,两者的要求却截然不同。

正如CEA-Leti的Michele Martemucci及其同事所解释的,训练任务涉及对权重矩阵进行多次小幅更新,使其逐渐收敛至稳定值。这类任务要求存储器具备高写入耐久性和存储精确值的能力。相比之下,推理任务使用的是稳定不变的权重矩阵,但可能会将其多次应用于输入数据,因此更适合采用具有高读取耐久性的非易失性存储器。无论是训练还是推理,近内存计算都需要与标准CMOS逻辑工艺兼容的设备。

阻变存储器(RRAM)结构简单,依靠氧化层中形成的导电细丝来实现极高的读取耐久性。通过精心设计的编程方案,它们可以存储模拟值,从而减小存储器阵列的大小。Martemucci表示,RRAM技术已经足够成熟,可以在边缘推理场景中进行商业部署。

遗憾的是,RRAM的写入耐久性相对较低。随着时间的推移,编程脉冲会模糊存储值之间的电阻差异。设计人员通常使用传统硬件训练模型,然后将预先计算的权重加载到RRAM阵列中。然而,在许多应用中,边缘设备需要具备“学习”能力。它要么需要根据用户的特定需求进行训练,要么需要修改模型以反映实际流程的变化。

与此同时,铁电电容器支持超快速切换,且具备极高的写入耐久性,能够轻松承受训练任务中频繁的写入操作。然而,尽管其存储的值具有非易失性,但读取操作却具有破坏性。Martemucci表示,这类器件不适合长期存储权重矩阵,也不适合需要频繁读取操作的推理任务。

将铁电晶体管集成到CMOS工艺中非常复杂,需要高温工艺和额外的掩模层。而铁电电容器和隧道结则简单得多,因此多个研究团队开始尝试结合阻变存储器和铁电结构。例如,在今年的VLSI技术研讨会上,SK海力士的研究人员展示了一种兼具电阻和铁电开关功能的混合铁电隧道结(FTJ)。

在传统的FTJ中,顶部和底部电极之间的隧道势垒取决于铁电极性。SK海力士的器件将铁电铪锆氧化物(HZO)层夹在两个电极之间,钽层用作氧空位储存器。钽层附近的导电细丝在器件顶部提供欧姆导电,从而降低了铁电隧道势垒的有效厚度。这些器件实现了精确的模拟乘法累加运算,效率高达每瓦224.4万亿次运算(TOPS/W)。

在另一种混合方法中,Martemucci团队将掺杂硅的HfO2电容器与钛氧清除层整合到标准CMOS BEOL工艺中。这些器件最初表现为铁电电容器,其中一些器件接收一次性“唤醒”脉冲以稳定铁电响应。同时,电容器阵列的另一部分经过一次性“成型”工艺,形成由氧空位构成的导电细丝。钛层充当氧空位储存器,可防止细丝溶解。由此产生的忆阻器器件可以在高阻和低阻状态之间切换。


图1:金属-铁电-金属堆叠结构可作为铁电电容器(FeCAP)或忆阻器使用。

(图源:CEA-Leti)

铁电电容器用作二进制元件,存储用于训练计算的高精度权重。忆阻器存储的模拟权重精度足以应对推理任务。在训练过程中,忆阻器阵列每完成100个输入步骤后更新一次,而铁电阵列则持续更新。针对标准数字识别任务训练该结构时,总写入操作次数比忆阻器的耐久性上限低17倍,比铁电电容器的耐久性上限低75倍,同时能耗比持续更新忆阻器阵列所需的能耗低38倍。

人工智能不仅仅是神经网络

内存计算不仅可以提高传统神经网络计算的能效,还能促进其他建模方法的发展。例如,许多计算难度高的问题可以建模为伊辛模型,即一组连接的节点共同演化至最低能量状态。现实世界中,这类问题可能涉及数千甚至数百万个连接。

解决伊辛模型问题是量子计算最引人入胜的潜在应用之一。更传统的方法是,在去年的IEEE电子设备会议上,德克萨斯大学研究员Tanvir Haider Pantha和他的同事们提出,在CMOS逻辑工艺的后端工艺(BEOL)中整合铁电场效应晶体管(FeFET),构建三维结构。每个节点由四个交叉耦合的FeFET组成,可存储一个带符号的模拟值,该值映射到待解决问题的伊辛耦合矩阵。每个节点的输出是其相邻节点的输入,从而在整个网络中建立振荡,最终达到稳定的最小能量配置。


图2:四个交叉耦合双栅FeFET构成相变纳米振荡器。

(图源:IEDM)

内存计算需要新框架

传统的CPU和GPU是通用器件。只需更改软件即可应用于许多不同的问题。而近内存和内存加速器目前与其预期任务密不可分。伊辛模型求解器、点云网络和图像识别网络将以不同的方式处理数据,需要不同的硬件设计。Mutlu表示,内存计算的下一步将需要能够重新映射内存访问以满足特定问题要求的软件框架。反过来,这些框架将需要能够独立于外部内存控制器、进行自我管理的内存硬件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没救出来?西尔斯基猛攻多布罗皮利亚!

没救出来?西尔斯基猛攻多布罗皮利亚!

胜研集
2025-11-03 13:16:14
久功不克俄罗斯连撤两员大将!西尔斯基:红军城守住了

久功不克俄罗斯连撤两员大将!西尔斯基:红军城守住了

史政先锋
2025-11-03 11:54:13
办公室有哪些八卦震惊到你了?网友:沉浸在瓜田里无法自拔,炸裂

办公室有哪些八卦震惊到你了?网友:沉浸在瓜田里无法自拔,炸裂

解读热点事件
2025-11-03 00:05:06
知名品牌突发:将关闭全部门店

知名品牌突发:将关闭全部门店

鲁中晨报
2025-11-03 07:11:03
五粮液们的雷,彻底爆了!

五粮液们的雷,彻底爆了!

功夫财经
2025-11-03 08:35:38
51岁男子铁矿上班时突发脑出血去世,其妻受刺激脑内出血,儿子替父申请工伤赔偿遭公司拒绝,人社部门已介入

51岁男子铁矿上班时突发脑出血去世,其妻受刺激脑内出血,儿子替父申请工伤赔偿遭公司拒绝,人社部门已介入

极目新闻
2025-11-03 14:35:23
军事 | 高市早苗涉台错误言行之际,国防部长董军对小泉进次郎怎么说?

军事 | 高市早苗涉台错误言行之际,国防部长董军对小泉进次郎怎么说?

新民周刊
2025-11-03 09:06:39
北京供暖最新消息!11月7日多区供暖点火试运行!

北京供暖最新消息!11月7日多区供暖点火试运行!

BRTV新闻
2025-11-03 11:50:05
哭灵人李美珍:一场3000,跪出两套房一辆车,却没人敢碰她

哭灵人李美珍:一场3000,跪出两套房一辆车,却没人敢碰她

君好伴读
2025-10-30 14:41:42
乌军投降了,红军城大鱼落网,俄凌晨击落6架敌机,基辅封锁消息

乌军投降了,红军城大鱼落网,俄凌晨击落6架敌机,基辅封锁消息

影孖看世界
2025-11-02 23:36:09
历经30年,世界上每台电脑都标配的技术,终于要被抛弃了……

历经30年,世界上每台电脑都标配的技术,终于要被抛弃了……

码农翻身
2025-11-03 08:58:46
开拓者官宣召回杨瀚森!未来下放只训练不比赛?队记解析核心原因

开拓者官宣召回杨瀚森!未来下放只训练不比赛?队记解析核心原因

罗说NBA
2025-11-03 08:35:00
工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

大道微言
2025-11-01 08:58:16
黄金要征税了,两部门发布新政,博主:更要去买黄金,晚了就买不到了

黄金要征税了,两部门发布新政,博主:更要去买黄金,晚了就买不到了

回旋镖
2025-11-02 17:18:39
蔡奇在人民日报撰文

蔡奇在人民日报撰文

澎湃新闻
2025-11-03 09:04:04
黄金大消息!工行宣布,今起暂停

黄金大消息!工行宣布,今起暂停

中国基金报
2025-11-03 12:17:24
窜访纽约的台外事部门负责人林佳龙宴请美国官员,最终无一人到场

窜访纽约的台外事部门负责人林佳龙宴请美国官员,最终无一人到场

三湘都市报
2025-11-02 18:42:53
佟丽娅现身深圳罗湖水贝买珠宝!打扮朴素眼袋重,毫无明星气质

佟丽娅现身深圳罗湖水贝买珠宝!打扮朴素眼袋重,毫无明星气质

柠檬有娱乐
2025-11-03 10:38:49
60岁“网红书记”高洪波卸任后参加马拉松,同荣昌跑友合影

60岁“网红书记”高洪波卸任后参加马拉松,同荣昌跑友合影

极目新闻
2025-11-03 11:12:15
沦陷了!演员温峥嵘“现身”多个直播,粉丝称“根本举报不过来”

沦陷了!演员温峥嵘“现身”多个直播,粉丝称“根本举报不过来”

上观新闻
2025-11-03 09:49:05
2025-11-03 15:31:00
TechSugar incentive-icons
TechSugar
做你身边值得信赖的科技新媒体
4874文章数 12723关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

美媒:中国正迅速充实石油储备 或与俄油设施遭袭有关

头条要闻

美媒:中国正迅速充实石油储备 或与俄油设施遭袭有关

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

本地
亲子
时尚
健康
公开课

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

亲子要闻

程晓玥官宣怀二胎,透露早孕反应非常严重,近照曝光孕肚超明显

秋季穿衣别太老气横秋,看看这27套造型,时尚舒适又显高

核磁VS肌骨超声,谁更胜一筹?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版