网易首页 > 网易号 > 正文 申请入驻

存内计算芯片,热度大增

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

来 源: 内容来自semiengineering,谢谢。

研究人员专注于限制数据移动以减少边缘设备的功耗和延迟。

在大众媒体中,“人工智能”通常意味着在昂贵且耗电的数据中心运行的大型语言模型。然而,对于许多应用程序来说,在本地硬件上运行的小型模型更为合适。

自动驾驶汽车需要实时响应,避免数据传输延迟。医疗和工业应用通常依赖于无法与第三方共享的敏感数据。尽管边缘人工智能应用速度更快、更安全,但它们的计算资源却非常有限。它们无法拥有 TB 级的内存空间或几乎无限的计算能力。

对于数据中心来说,这些限制可能有些抽象,但却对边缘人工智能施加了严格的限制。在2025年IEEE国际内存研讨会的一篇受邀论文及其后续预印本中,苏黎世联邦理工学院计算机科学教授Onur Mutlu及其同事指出,在典型的移动工作负载中,数据在内存中的移动占总能耗的62%,这一比例令人震惊。内存是硬件资源的最大消耗者,而且遥遥领先,但内存延迟往往是执行时间的最大贡献者。

多年来,器件规模的扩大一直是降低功耗的关键,但现在却使问题更加严重。Mutlu 表示,规模庞大的 DRAM 稳定性较差,需要更频繁的刷新周期。大型内存阵列的访问难度也更大,因为带宽的增长速度不如内存条本身的增长速度快。

内存和近内存计算提供了可能的解决方案。即使是商用的现成 DRAM,只要软件基础设施支持,也可以执行原始的数据复制、初始化和按位逻辑运算。

混合解决方案结合了RRAM和铁电体

然而,DRAM刷新功率的问题仍然存在。在神经网络模型中,训练和推理任务都会重复使用存储的权重矩阵。然而,两者的要求却截然不同。

正如 CEA-Leti 的 Michele Martemucci 及其同事所解释的那样,训练任务涉及对权重矩阵进行多次小幅更新,使其逐渐收敛到稳定值。这些任务需要具有高写入耐久性和存储精确值能力的内存。相比之下,推理任务使用稳定不变的权重矩阵,但可能会将其多次应用于输入数据。推理任务受益于具有高读取耐久性的非易失性存储器。在这两种情况下,近内存计算都需要与标准 CMOS 逻辑工艺兼容的设备。

RRAM 是一种简单的器件,依靠氧化层中形成的导电细丝来实现极高的读取耐久性。通过精心设计的编程方案,它们可以存储模拟值,从而减小存储器阵列的大小。Martemucci 表示,RRAM 技术已经足够成熟,可以在边缘推理场景中进行商业部署。

遗憾的是,RRAM 的写入耐久性相对较低。随着时间的推移,编程脉冲会模糊存储值之间的电阻差异。设计人员通常使用传统硬件训练模型,然后将预先计算的权重加载到 RRAM 阵列中。然而,在许多应用中,边缘设备需要具备“学习”能力。它要么需要根据用户的特定需求进行训练,要么需要修改模型以反映实际流程的变化。

与此同时,铁电电容器支持非常快速的开关和极高的写入耐久性。它们可以轻松承受训练任务中遇到的频繁写入操作。然而,虽然存储的值是非易失性的,但读取操作却具有破坏性。Martemucci 表示,这些设备不适合长期存储权重矩阵,也不适合需要频繁读取操作的推理任务。

将铁电晶体管集成到CMOS工艺中非常复杂,需要高温工艺和额外的掩模层。铁电电容器和隧道结则简单得多,这使得多个研究小组能够将RRAM和铁电结构结合起来。例如,在今年的VLSI技术研讨会上,SK海力士的研究人员展示了一种兼具电阻和铁电开关功能的混合铁电隧道结(FTJ)。

在传统的FTJ中,顶部和底部电极之间的隧道势垒取决于铁电极性。SK海力士的器件将铁电铪锆氧化物(HZO)层夹在两个电极之间,钽层用作氧空位储存器。钽层附近的导电细丝在器件顶部提供欧姆导电,从而降低了铁电隧道势垒的有效厚度。这些器件实现了精确的模拟乘法累加运算,效率高达每瓦224.4万亿次运算(TOPS/W)。

在另一种混合方法中,Martemucci 团队将掺杂硅的 HfO2电容器与钛氧清除层结合到标准 CMOS BEOL 工艺中。这些器件最初表现为铁电电容器,其中一些器件接收一次性“唤醒”脉冲以稳定铁电响应。同时,电容器阵列的另一部分经过一次性“成型”工艺,形成由氧空位构成的导电细丝。钛层充当氧空位储存器,防止细丝溶解。由此产生的忆阻器器件可以在高阻和低阻状态之间切换。


图 1:金属-铁电-金属叠层既可以用作 FeCAP,也可以用作忆阻器

铁电电容器充当二进制元件,存储用于训练计算的高精度权重。忆阻器存储的模拟权重精度足以应对推理任务。在训练过程中,忆阻器阵列每完成100个输入步骤后更新一次,而铁电阵列则持续更新。训练此结构进行标准数字识别任务所需的写入操作总数比忆阻器耐久性小17倍,比铁电电容器耐久性小75倍,而能耗比持续更新忆阻器阵列所需能耗低38倍。

人工智能不仅仅是神经网络


内存计算不仅可以提高传统神经网络计算的能效,还能促进其他建模方法的发展。例如,许多计算难度高的问题可以建模为伊辛玻璃,即一组连接的节点共同演化到最低能量状态。[ ⁠ 4] 现实世界中,这类问题可能涉及数千甚至数百万个连接。

解决伊辛玻璃问题是量子计算最引人入胜的潜在应用之一。更传统的方法是,在去年的IEEE电子设备会议上,德克萨斯大学研究员Tanvir Haider Pantha和他的同事们提出构建一个三维结构,将FeFET融入CMOS逻辑工艺的BEOL(后道工艺)。每个节点由四个交叉耦合的FeFET组成,可以存储一个有符号的模拟值,该值映射到待解决问题的伊辛耦合矩阵。每个节点的输出是其相邻节点的输入,从而在整个网络中建立振荡,最终达到稳定的最小能量配置。


图 2:四个交叉耦合双栅 FeFET 构成相变纳米振荡器。提出的伊辛玻璃模型每个节点使用其中一种结构

内存计算需要新框架


传统的 CPU 和 GPU 是通用设备。只需更改软件即可应用于许多不同的问题。近内存和内存加速器目前与其预期任务密不可分。伊辛玻璃求解器、点云网络和图像识别网络将以不同的方式处理数据,需要不同的硬件设计。据 Mutlu 称,内存计算的下一步将需要能够重新映射内存访问以满足特定问题要求的软件框架。反过来,这些框架将需要能够独立于外部内存控制器进行自我管理的内存硬件。

https://semiengineering.com/why-in-memory-computation-is-so-important-for-edge-ai/

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4206期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“神仙租户”退租时房内锃亮反光,房东落泪收房:出租五年多,感觉像失恋了,失去这么好一个租户

“神仙租户”退租时房内锃亮反光,房东落泪收房:出租五年多,感觉像失恋了,失去这么好一个租户

极目新闻
2025-11-05 16:08:13
刘强东新车惊艳亮相,炸翻全网

刘强东新车惊艳亮相,炸翻全网

电商派Pro
2025-11-06 09:45:54
大陆设立台湾光复纪念日,蒋万安再次亮明立场,坚持反对两岸统一

大陆设立台湾光复纪念日,蒋万安再次亮明立场,坚持反对两岸统一

boss外传
2025-11-05 16:00:03
虽说西部垫底难以接受,但至少弗拉格不用再打“控卫”了!

虽说西部垫底难以接受,但至少弗拉格不用再打“控卫”了!

小七说篮球
2025-11-06 16:27:30
四渡赤水简单来说,就是40万国军把3万人的红军包围在一条河附近

四渡赤水简单来说,就是40万国军把3万人的红军包围在一条河附近

忠于法纪
2025-11-04 09:02:20
航天英雄武飞:感谢牧民父母托举,我是幸福的丈夫和爸爸

航天英雄武飞:感谢牧民父母托举,我是幸福的丈夫和爸爸

细品名人
2025-11-06 07:23:14
荷兰政府花200亿挽留无效!光刻机巨头ASML为何要从老家搬走?

荷兰政府花200亿挽留无效!光刻机巨头ASML为何要从老家搬走?

南宫一二
2025-11-06 13:38:57
日本风向剧变!高市早苗或长期执政,危险信号出现,中方早做准备

日本风向剧变!高市早苗或长期执政,危险信号出现,中方早做准备

扶苏聊历史
2025-11-06 15:44:52
唯一的主任医师名额给了关系户,我办了离职,结果院长被领导谈话

唯一的主任医师名额给了关系户,我办了离职,结果院长被领导谈话

红豆讲堂
2025-11-04 19:20:03
泽连斯基喊话欧尔班:别阻挠乌克兰“入欧”

泽连斯基喊话欧尔班:别阻挠乌克兰“入欧”

参考消息
2025-11-05 15:37:14
同学会要交8万''入场费'',我果断退群,隔天警察告知:昨晚班长没了

同学会要交8万''入场费'',我果断退群,隔天警察告知:昨晚班长没了

悬案解密档案
2025-10-31 15:30:25
闹大了!王楚钦与樊振东无缘全运会决赛对决,林诗栋成为最大赢家

闹大了!王楚钦与樊振东无缘全运会决赛对决,林诗栋成为最大赢家

王嚾晓
2025-11-06 14:22:59
刘强东问蔡磊钱够吗?蔡哽咽:儿子才1岁!随后刘的决定令蔡泪崩

刘强东问蔡磊钱够吗?蔡哽咽:儿子才1岁!随后刘的决定令蔡泪崩

瑶卿文史
2025-10-29 22:56:09
台当局抗议,要求大陆允许赴陆参会,国台办提条件:不答应别想来

台当局抗议,要求大陆允许赴陆参会,国台办提条件:不答应别想来

牛锅巴小钒
2025-11-06 04:26:56
6号收评:A股高开高走,所有人都注意了,大盘后市行情已无悬念!

6号收评:A股高开高走,所有人都注意了,大盘后市行情已无悬念!

春江财富
2025-11-06 15:19:15
A股站上4000点,尾盘明牌了,明天周五,11月7日,A股可能这样走

A股站上4000点,尾盘明牌了,明天周五,11月7日,A股可能这样走

甜柠聊史
2025-11-06 16:41:40
我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

五元讲堂
2025-11-05 10:35:02
重庆最强区出现,两江新区GDP将超万亿

重庆最强区出现,两江新区GDP将超万亿

特特农村生活
2025-11-06 14:52:21
1950年,彭总见到韩先楚,便发问:不让你打偏打,胆大包天啊

1950年,彭总见到韩先楚,便发问:不让你打偏打,胆大包天啊

大运河时空
2025-11-05 15:15:03
新中国第一代高级干部名单大全,收藏!

新中国第一代高级干部名单大全,收藏!

霹雳炮
2025-09-13 22:02:41
2025-11-06 17:35:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12161文章数 34696关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

健康
亲子
游戏
房产
公开课

超声探头会加重受伤情况吗?

亲子要闻

amh值低怎么调理好?卵子质量不好如何改善?

CS2迎来重磅更新!“比过去更贴近真实”

房产要闻

中旅·三亚蓝湾,以一座城市会客厅回应世界的滨海想象

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版