网易首页 > 网易号 > 正文 申请入驻

存内计算芯片,热度大增

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

来 源: 内容来自semiengineering,谢谢。

研究人员专注于限制数据移动以减少边缘设备的功耗和延迟。

在大众媒体中,“人工智能”通常意味着在昂贵且耗电的数据中心运行的大型语言模型。然而,对于许多应用程序来说,在本地硬件上运行的小型模型更为合适。

自动驾驶汽车需要实时响应,避免数据传输延迟。医疗和工业应用通常依赖于无法与第三方共享的敏感数据。尽管边缘人工智能应用速度更快、更安全,但它们的计算资源却非常有限。它们无法拥有 TB 级的内存空间或几乎无限的计算能力。

对于数据中心来说,这些限制可能有些抽象,但却对边缘人工智能施加了严格的限制。在2025年IEEE国际内存研讨会的一篇受邀论文及其后续预印本中,苏黎世联邦理工学院计算机科学教授Onur Mutlu及其同事指出,在典型的移动工作负载中,数据在内存中的移动占总能耗的62%,这一比例令人震惊。内存是硬件资源的最大消耗者,而且遥遥领先,但内存延迟往往是执行时间的最大贡献者。

多年来,器件规模的扩大一直是降低功耗的关键,但现在却使问题更加严重。Mutlu 表示,规模庞大的 DRAM 稳定性较差,需要更频繁的刷新周期。大型内存阵列的访问难度也更大,因为带宽的增长速度不如内存条本身的增长速度快。

内存和近内存计算提供了可能的解决方案。即使是商用的现成 DRAM,只要软件基础设施支持,也可以执行原始的数据复制、初始化和按位逻辑运算。

混合解决方案结合了RRAM和铁电体

然而,DRAM刷新功率的问题仍然存在。在神经网络模型中,训练和推理任务都会重复使用存储的权重矩阵。然而,两者的要求却截然不同。

正如 CEA-Leti 的 Michele Martemucci 及其同事所解释的那样,训练任务涉及对权重矩阵进行多次小幅更新,使其逐渐收敛到稳定值。这些任务需要具有高写入耐久性和存储精确值能力的内存。相比之下,推理任务使用稳定不变的权重矩阵,但可能会将其多次应用于输入数据。推理任务受益于具有高读取耐久性的非易失性存储器。在这两种情况下,近内存计算都需要与标准 CMOS 逻辑工艺兼容的设备。

RRAM 是一种简单的器件,依靠氧化层中形成的导电细丝来实现极高的读取耐久性。通过精心设计的编程方案,它们可以存储模拟值,从而减小存储器阵列的大小。Martemucci 表示,RRAM 技术已经足够成熟,可以在边缘推理场景中进行商业部署。

遗憾的是,RRAM 的写入耐久性相对较低。随着时间的推移,编程脉冲会模糊存储值之间的电阻差异。设计人员通常使用传统硬件训练模型,然后将预先计算的权重加载到 RRAM 阵列中。然而,在许多应用中,边缘设备需要具备“学习”能力。它要么需要根据用户的特定需求进行训练,要么需要修改模型以反映实际流程的变化。

与此同时,铁电电容器支持非常快速的开关和极高的写入耐久性。它们可以轻松承受训练任务中遇到的频繁写入操作。然而,虽然存储的值是非易失性的,但读取操作却具有破坏性。Martemucci 表示,这些设备不适合长期存储权重矩阵,也不适合需要频繁读取操作的推理任务。

将铁电晶体管集成到CMOS工艺中非常复杂,需要高温工艺和额外的掩模层。铁电电容器和隧道结则简单得多,这使得多个研究小组能够将RRAM和铁电结构结合起来。例如,在今年的VLSI技术研讨会上,SK海力士的研究人员展示了一种兼具电阻和铁电开关功能的混合铁电隧道结(FTJ)。

在传统的FTJ中,顶部和底部电极之间的隧道势垒取决于铁电极性。SK海力士的器件将铁电铪锆氧化物(HZO)层夹在两个电极之间,钽层用作氧空位储存器。钽层附近的导电细丝在器件顶部提供欧姆导电,从而降低了铁电隧道势垒的有效厚度。这些器件实现了精确的模拟乘法累加运算,效率高达每瓦224.4万亿次运算(TOPS/W)。

在另一种混合方法中,Martemucci 团队将掺杂硅的 HfO2电容器与钛氧清除层结合到标准 CMOS BEOL 工艺中。这些器件最初表现为铁电电容器,其中一些器件接收一次性“唤醒”脉冲以稳定铁电响应。同时,电容器阵列的另一部分经过一次性“成型”工艺,形成由氧空位构成的导电细丝。钛层充当氧空位储存器,防止细丝溶解。由此产生的忆阻器器件可以在高阻和低阻状态之间切换。


图 1:金属-铁电-金属叠层既可以用作 FeCAP,也可以用作忆阻器

铁电电容器充当二进制元件,存储用于训练计算的高精度权重。忆阻器存储的模拟权重精度足以应对推理任务。在训练过程中,忆阻器阵列每完成100个输入步骤后更新一次,而铁电阵列则持续更新。训练此结构进行标准数字识别任务所需的写入操作总数比忆阻器耐久性小17倍,比铁电电容器耐久性小75倍,而能耗比持续更新忆阻器阵列所需能耗低38倍。

人工智能不仅仅是神经网络


内存计算不仅可以提高传统神经网络计算的能效,还能促进其他建模方法的发展。例如,许多计算难度高的问题可以建模为伊辛玻璃,即一组连接的节点共同演化到最低能量状态。[ ⁠ 4] 现实世界中,这类问题可能涉及数千甚至数百万个连接。

解决伊辛玻璃问题是量子计算最引人入胜的潜在应用之一。更传统的方法是,在去年的IEEE电子设备会议上,德克萨斯大学研究员Tanvir Haider Pantha和他的同事们提出构建一个三维结构,将FeFET融入CMOS逻辑工艺的BEOL(后道工艺)。每个节点由四个交叉耦合的FeFET组成,可以存储一个有符号的模拟值,该值映射到待解决问题的伊辛耦合矩阵。每个节点的输出是其相邻节点的输入,从而在整个网络中建立振荡,最终达到稳定的最小能量配置。


图 2:四个交叉耦合双栅 FeFET 构成相变纳米振荡器。提出的伊辛玻璃模型每个节点使用其中一种结构

内存计算需要新框架


传统的 CPU 和 GPU 是通用设备。只需更改软件即可应用于许多不同的问题。近内存和内存加速器目前与其预期任务密不可分。伊辛玻璃求解器、点云网络和图像识别网络将以不同的方式处理数据,需要不同的硬件设计。据 Mutlu 称,内存计算的下一步将需要能够重新映射内存访问以满足特定问题要求的软件框架。反过来,这些框架将需要能够独立于外部内存控制器进行自我管理的内存硬件。

https://semiengineering.com/why-in-memory-computation-is-so-important-for-edge-ai/

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4206期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1只也不行!山东老汉用捕兽夹抓1只售卖,嘴塞木头腿被砍掉

1只也不行!山东老汉用捕兽夹抓1只售卖,嘴塞木头腿被砍掉

万象硬核本尊
2026-02-25 20:25:39
金价,飙涨!

金价,飙涨!

中吴网
2026-02-28 15:36:08
为什么说要得饶人处且饶人?网友:卡里几千万,为了5块钱命没了

为什么说要得饶人处且饶人?网友:卡里几千万,为了5块钱命没了

另子维爱读史
2026-02-25 23:23:26
特斯拉官宣,新车即将涨价!

特斯拉官宣,新车即将涨价!

花果科技
2026-02-28 16:38:33
知名好莱坞演员在自家谷仓内身亡:汽车搭电时突然自燃,曾获5届拳击冠军

知名好莱坞演员在自家谷仓内身亡:汽车搭电时突然自燃,曾获5届拳击冠军

红星新闻
2026-02-27 17:33:09
加拿大总理卡尼开启访印行程:寻求缓和两国关系,减少对美依赖

加拿大总理卡尼开启访印行程:寻求缓和两国关系,减少对美依赖

澎湃新闻
2026-02-27 17:36:27
俄媒警告中国:美国打伊朗只是幌子,目的是逼解放军到太平洋决战

俄媒警告中国:美国打伊朗只是幌子,目的是逼解放军到太平洋决战

起喜电影
2026-02-28 11:49:21
媒体:伊朗接近与中国达成超音速反舰巡航导弹采购协议

媒体:伊朗接近与中国达成超音速反舰巡航导弹采购协议

俄罗斯卫星通讯社
2026-02-26 15:19:44
一种戴久了可能致癌的首饰,很多人家里都有!

一种戴久了可能致癌的首饰,很多人家里都有!

距离距离
2026-02-26 13:18:17
戏子误国!春节刚过就有4位明星相继塌房,走到这一步不值得同情

戏子误国!春节刚过就有4位明星相继塌房,走到这一步不值得同情

墨印斋
2026-02-26 06:21:37
大满贯赛:第2冠出炉!张本美和早田希娜3:0夺冠,国乒无缘冠军

大满贯赛:第2冠出炉!张本美和早田希娜3:0夺冠,国乒无缘冠军

国乒二三事
2026-02-28 16:43:48
其实越南不傻,它当然知道,中国高铁 “物美价廉”

其实越南不傻,它当然知道,中国高铁 “物美价廉”

百态人间
2026-02-28 15:34:20
伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

冷峻视角下的世界
2026-02-20 07:45:35
AI会在所有事情上超越我们!3800亿估值公司CEO警告:海啸将至人类却假装没看到

AI会在所有事情上超越我们!3800亿估值公司CEO警告:海啸将至人类却假装没看到

知识圈
2026-02-27 16:57:06
“手机将全面涨价”,冲上热搜

“手机将全面涨价”,冲上热搜

南方都市报
2026-02-27 14:31:12
独家:弃产1.6万/平,石牌村补偿标准曝光,村民顶不住了

独家:弃产1.6万/平,石牌村补偿标准曝光,村民顶不住了

拆神
2026-02-28 15:26:29
日本综艺有多变态?看完下面这些,保证你菊花一紧!

日本综艺有多变态?看完下面这些,保证你菊花一紧!

日本窗
2026-02-02 17:28:30
古巴已进入倒计时。

古巴已进入倒计时。

素颜为谁倾城人
2026-02-15 05:04:46
不到24小时,美以对伊完成二次打击,俄媒警告:川普在逼中国下场

不到24小时,美以对伊完成二次打击,俄媒警告:川普在逼中国下场

东极妙严
2026-02-28 17:56:12
新iPhone 正式官宣:3 月 2 日,即将发布!

新iPhone 正式官宣:3 月 2 日,即将发布!

科技堡垒
2026-02-28 11:22:07
2026-02-28 19:24:49
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
13036文章数 34824关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

以色列先发制人 8个月后伊美以再次引燃中东

头条要闻

以色列先发制人 8个月后伊美以再次引燃中东

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

亲子
手机
游戏
本地
公开课

亲子要闻

波速球半圆平衡球

手机要闻

一加15T手机曝光,这些特性太诱人!

索尼《马拉松》PS商店仅3.09分:比《星鸣特攻》还低

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版