网易首页 > 网易号 > 正文 申请入驻

SRAM,再续生机

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。


过去几年,先进制程工艺的玩家越来越频繁地遇到同一个问题:逻辑晶体管还在继续缩小,但SRAM跟不上了。

这一矛盾早在台积电3nm节点上就已经暴露出来。SemiWiki援引IEDM资料称,台积电N3的高密度SRAM位单元约为0.0199平方微米,而N3E披露的高密度SRAM位单元约为0.021平方微米;后者不仅没有继续缩小,甚至与N5时代约0.021平方微米的水平接近。


台积电SRAM单元尺寸的发展

因此,过去几年行业中“SRAM缩放已经走到尽头”的讨论越来越多。SemiEngineering在2024年的一篇分析中指出,SRAM难以继续随先进节点缩放,已经对功耗和性能目标构成挑战;但与此同时,SRAM又是AI应用中最关键的片上工作存储之一。该文还援引Flex Logix CEO Geoffrey Tate的说法称,先进节点客户普遍抱怨逻辑比SRAM缩得更快;如果把缓存放到片外,性能会“断崖式下降”。

SRAM不是一个可以被轻易移出芯片的模块。在《》一文中我们就探讨了SRAM的重要性。它之所以重要,恰恰在于足够靠近计算单元,能够提供低延迟、高带宽、可预测的数据访问。一旦把缓存、缓冲区或片上暂存存储放到片外,即便片外有HBM、CXL或其他高带宽方案,芯片仍然会遭遇延迟、功耗、调度复杂度和系统成本的多重惩罚。

然而,6月25日,IBM给这个看似悲观的问题提供了一个新的答案。

IBM发布了0.7nm级的“纳米堆叠”(Nanostack)晶体管架构。按照IBM官方表述,这是业界首个已知的基于纳米片的三维晶体管设计,可在指甲大小的芯片面积内容纳近1000亿个晶体管,密度几乎是IBM于2021年发布的2nm芯片的两倍,并有望相较IBM 2nm节点实现最高50%的性能提升,或70%的能效改善。


图源:IBM

但这款晶体管真正值得关注的,不仅仅是0.7nm这个标签,而是IBM在同一发布中提到的另一项指标:SRAM缩放。

IBM称,其研究人员在VLSI 2026上发表的新研究显示,Nanostack架构可带来40%的SRAM缩放。更准确地说,这不是“SRAM容量降低40%”,而是SRAM单元高度或SRAM面积维度的缩小:同样面积下可以放入更多SRAM,或者同样SRAM容量可以占用更小芯片面积。IBM官方发布页也列出相关VLSI论文,题为《交错沟道纳米堆叠SRAM位单元的面积与性能研究》(Area and Performance of Staggered-Channel Nanostack SRAM Bitcells)。

SRAM是否还能继续缩?也引发业界的关注。

SRAM危机,在AI时代更凸显

SRAM缩放放缓之所以在今天变得更加突出,是因为AI芯片的核心瓶颈已经不只是算得够不够快,而是数据能不能足够快、足够近、足够便宜地送到计算单元旁边。

大模型训练和推理都高度受限于数据搬运。Transformer模型中的权重、激活值、中间结果、注意力计算,以及推理阶段越来越重要的KV缓存,都需要在不同存储层级之间频繁移动。即便算力继续提升,如果这些数据无法高效留在计算附近,芯片就会被HBM带宽、片间通信、片上互连和存储层级拖住。

过去几年,AI芯片竞争表面上看是张量计算单元、FP8、FP4、HBM容量、先进封装和互连带宽之争;但更底层的矛盾是,计算单元越来越多,数据却越来越难喂饱它们。

如果SRAM继续停滞,AI芯片会越来越依赖HBM、先进封装、芯粒化缓存、近存计算、存算一体和更复杂的系统互连。芯片可以更强,但系统也会更贵、更复杂、更难扩展。

具体来看,SRAM缩不动至少会带来五个直接后果。

第一是裸片面积。SRAM面积不缩,芯片中片上存储占比就会上升。对于大GPU、AI ASIC和高性能CPU而言,这意味着更大的裸片面积、更高的光罩成本,以及更紧张的单次曝光面积限制。尤其是AI芯片往往需要大规模片上缓冲区、缓存和暂存存储,SRAM面积停滞会直接稀释先进节点的面积收益。

第二是良率。先进节点下,大尺寸裸片对缺陷密度更敏感。SRAM如果继续占用大量面积,就会把AI芯片推向更高良率压力。一个芯片上的SRAM阵列越大,对冗余设计、修复机制、测试成本和良率管理的要求也越高。

第三是功耗。片外搬数据通常比片内访问更耗能。SemiEngineering援引Rambus专家Steve Woo的观点指出,如果处理器核心无法获得足够SRAM,就必须从更远处搬数据,这会增加功耗并拉低性能。

第四是延迟。对大模型推理而言,尤其是解码阶段、长上下文、多轮对话和实时响应场景,KV缓存与中间状态访问会显著影响尾延迟和用户体验。片上SRAM越充足,越有机会减少访问HBM或跨芯片搬运的次数,从而降低不确定性。

第五是架构选择。SRAM缩不动,会迫使芯片公司在多种路线之间重新取舍:是继续堆HBM,还是做更大的片上SRAM?是走芯粒化缓存,还是走3D缓存?是采用近存计算、存算一体,还是通过CXL扩展外部内存池?这些选择都不只是工艺问题,而会直接影响AI芯片的系统形态。

这也是为什么SRAM重新变得重要。

巨头们,各出奇招

SRAM缩放放缓并不是IBM一家看到的问题。台积电、三星、英特尔过去几年的路线,已经从不同角度说明:SRAM正在从一个默认跟随逻辑缩放的配套模块,变成先进节点竞争力的重要指标。

台积电是SRAM缩放放缓最典型的案例。

如同文章开头所述,在3nm节点,台积电仍然实现了逻辑密度提升,但SRAM位单元已经几乎停滞。N3高密度SRAM位单元约0.0199平方微米,仅比N5的0.021平方微米缩小约5%;N3E的SRAM位单元约0.021平方微米,与N5基本接近。

到了N2,台积电试图把SRAM缩放重新拉回正轨。台积电官方研究页面显示,其2nm CMOS纳米片技术展示了38.1Mb/mm²的SRAM,用于高密度和高能效计算应用。该设计使用0.021平方微米的高密度位单元,并通过设计技术协同优化,让整体SRAM密度相较前一代技术提升1.1倍。


台积电2nm-CMOS纳米片工艺的 38.1Mb/mm² SRAM(图源:台积电)

这里的关键不是位单元尺寸大幅缩小,因为0.021平方微米本身并不比N5、N3E时代更小。真正的变化在于,台积电通过GAA纳米片、阵列设计、电路技术和设计技术协同优化,提高了SRAM宏单元层面的整体密度。Mark LaPedus对相关论文的梳理也提到,台积电2nm SRAM宏单元容量为580Kb,使用0.021平方微米位单元,整体SRAM密度较前代提升10%,达到38.1Mb/mm²。

台积电对SRAM问题的态度是:SRAM缩放不能再只靠几何微缩,而要靠器件结构、阵列架构、辅助电路和设计技术协同优化共同解决。这也解释了为什么台积电在面向AI/HPC的后续节点中继续强化A16、超级电轨(Super Power Rail)等技术。随着AI芯片越来越受限于供电、互连和片上存储,先进节点不再只是晶体管结构之争,而是逻辑、SRAM、供电网络、后端互连和先进封装的系统协同。

三星的路线更偏向结构创新。

2022年,三星宣布3nm GAA工艺进入初始生产,并称其MBCFET技术通过纳米片结构提升驱动电流能力、降低供电电压、改善功耗和性能。三星还强调,GAA可通过调整纳米片沟道宽度,针对不同客户需求优化功耗和性能。

这对SRAM尤其重要。三星在一篇专门讨论“3nm GAA MBCFET与SRAM设计灵活性”的技术博客中写到,MBCFET的纳米片宽度可调,能够为SRAM单元设计提供更大灵活性;通过分别调节PMOS和NMOS,以及下拉晶体管、传输门晶体管等器件的沟道宽度,可以在SRAM单元中获得更好的裕量。三星还称,GAA SRAM位单元相比鳍式晶体管需要更低功耗,并且由于GAA宽度可独立调整,能够改善性能、功耗、面积与SRAM稳定性之间的平衡。

从三星SF2节点看,这一思路仍在延续。三星官方逻辑节点页面显示,SF2作为第二代MBCFET/GAA先进节点,强调更强的稳定性、先进计算负载性能,以及通过多种纳米片宽度配置提升单位功耗性能,同时实现单元高度降低。

英特尔的思路则更偏向系统组合。英特尔18A的核心卖点是RibbonFET与PowerVia。英特尔官方介绍称,18A采用RibbonFET和PowerVia背面供电技术。PowerVia将供电网络移至晶圆背面,以减少正面金属层中电源与信号布线的拥塞,从而改善性能、功耗和密度。

从SRAM角度看,PowerVia的重要性不只在于提升逻辑标准单元的布线效率,也在于改善大规模片上存储附近的供电完整性。SRAM阵列对电压波动非常敏感,最低工作电压、读写稳定性、动态压降都会影响可用频率和工作电压。因此,背面供电本质上也是在为先进节点下SRAM和高密度逻辑阵列提供更稳定的电源基础。

IEDM相关资料显示,Intel 18A RibbonFET CMOS技术中包含0.023平方微米的高电流SRAM单元和0.021平方微米的高密度SRAM单元,并结合PowerVia背面供电。IEEE Xplore收录的论文摘要也显示,英特尔展示了首个基于RibbonFET技术、通过硅验证的高电流和高密度6T SRAM。

总体来看,台积电、三星、英特尔三家路线各不相同,但共同指向一个判断:SRAM已经成为先进制程的新考题。

IBM如何让SRAM继续缩放?

这就要回到晶体管结构本身。

传统CMOS里,nFET和pFET通常在同一平面左右排列。SRAM位单元又高度依赖n/p器件的密集排布。随着节点推进,晶体管本身可以继续缩,但n/p之间的隔离、不同功函数金属、源漏区、栅切割、局部互连和布线规则,不一定能同步缩。

换言之,SRAM不只是晶体管尺寸问题,更是版图、器件隔离、读写裕量、稳定性和互连规则共同约束的结果。

IBM Nanostack的思路,是把这件事从平面维度改写到垂直维度。IBM称,Nanostack是一种三维、基于纳米片的晶体管架构,通过垂直堆叠和错位排列晶体管来提升密度,并允许不同层使用不同材料组合,从而分别优化性能和功耗。

Futurum对IBM这款纳米堆叠晶体管的解读进一步提到,SRAM位单元中的N到P间距是长期约束,而Nanostack通过把N型和P型器件上下堆叠,把横向间距转化为纵向薄介质键合,从而移除一部分横向面积瓶颈;其解读称IBM VLSI 2026论文展示了超过40%的SRAM单元高度降低。

通俗地说,IBM不是靠把每个晶体管雕得更小来救SRAM,而是靠改变nFET和pFET的相对摆放方式:把原本占平面面积的隔离距离,压进垂直方向。

这和CFET SRAM研究方向是一致的。CFET,也就是互补场效应晶体管,本质上同样是把nFET和pFET从横向并排推进到垂直堆叠。IEEE Transactions on Electron Devices在2023年发表的一篇CFET SRAM设计技术协同优化论文摘要显示,A5 CFET SRAM相比A14纳米片SRAM可实现最高55%的位单元面积缩放,相比A10 forksheet SRAM也可实现约40%的位单元面积缩放。

IBM Nanostack展示的SRAM收益并不是偶然,而是整个先进逻辑从鳍式晶体管走向GAA纳米片,再走向forksheet、CFET、Nanostack和更广义3D CMOS过程中的一部分。

当然,IBM此次发布还有另一层产业含义:它试图重新定义GAA之后的晶体管路线。

IBM在纳米片/GAA方向上起步很早。2021年,IBM发布2nm纳米片技术,称其可相较7nm芯片实现45%的性能提升或75%的能耗降低。但从产业商业化角度看,GAA纳米片的实际量产红利更多落到了三星、台积电、英特尔等制造玩家手中。

2022年,IBM与日本Rapidus宣布战略合作。Rapidus将进一步开发IBM的2nm节点技术,并计划在其日本晶圆厂中导入相关技术;IBM也表示Rapidus工程师将与IBM研究人员在Albany NanoTech Complex展开合作。2024年,IBM和Rapidus又把合作扩展到2nm世代的芯粒封装技术。

但问题在于,IBM已经不是主流先进逻辑量产厂,真正落地仍要靠合作伙伴。Reuters在报道IBM此次0.7nm技术时提到,IBM尚未公布制造伙伴,但其此前曾将芯片技术授权给三星和日本Rapidus;IBM方面认为,该技术最早可能在未来五年内进入生产路径。

给SRAM续命的,还有他们

事实上,在IBM发布0.7nm Nanostack之前,AI芯片架构层面已经出现了一批重新重视SRAM的路线。

其中最典型的是Groq。Groq官方对LPU架构的介绍中明确提到,LPU集成了数百MB SRAM,并将其作为主要权重存储,而不是缓存,从而降低延迟,并使计算单元能够全速运行。这种架构可以支持跨芯片的高效张量并行,对于快速、可扩展的推理而言是一项实际优势。

Groq这一路线后来也吸引了英伟达的视线。2025年12月,Groq宣布与英伟达达成一项非独家的推理技术授权协议。按照Groq官方说法,双方合作的目标是扩大高性能、低成本推理能力;与此同时,Groq创始人Jonathan Ross、总裁Sunny Madra以及部分团队成员将加入英伟达,帮助推进和扩展被授权的推理技术。不过,Groq也强调,公司将继续作为独立公司运营,GroqCloud也会继续运行。

Groq路线的核心不是“SRAM容量比HBM大”。恰恰相反,单芯片SRAM容量远小于HBM。但SRAM的价值在于低延迟、高带宽、靠近计算和可预测性。Groq把权重和数据流尽可能显式安排在片上SRAM中,本质上是在用架构和编译器控制数据运动,而不是让硬件缓存层级和外部存储系统承担全部压力。

Cerebras则走得更极端。其WSE-3采用台积电5nm工艺,集成4万亿晶体管、90万个AI核心、125 PFLOPS峰值AI性能,并拥有44GB片上SRAM。Cerebras官方资料显示,WSE-3面向大模型训练与推理,试图通过晶圆级芯片方式,把计算、片上存储和互连铺在一整片晶圆上。

Groq和Cerebras代表了两种不同形态,但它们共同说明了一个趋势:AI芯片的差异化,不再只是张量计算单元有多强,也在于能把多少高带宽、低延迟的存储放到计算旁边。

结语

过去几十年,摩尔定律的核心是单位面积内容纳更多晶体管。到了AI时代,这个表达已经不够完整。AI芯片的竞争,已经不再只是计算单元之争,也越来越是片上存储能力之争。

如果SRAM通过Nanostack、CFET或其他3D CMOS路线重新获得一轮缩放,那么AI芯片架构就会获得新的设计空间。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4457内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

职场资深秘书
2026-07-04 18:31:43
飞机推杆都上车了,银河战舰700这内饰有点意思

飞机推杆都上车了,银河战舰700这内饰有点意思

小南看车
2026-07-03 22:25:06
世界杯首例!非洲劲旅8人兴奋剂违规 检出违禁药物 FIFA拒绝置评

世界杯首例!非洲劲旅8人兴奋剂违规 检出违禁药物 FIFA拒绝置评

狍子歪解体坛
2026-07-04 11:54:56
360万元法拉利被4名儿童划损,最新进展:4名家长均已道歉,共计赔偿2万元,车主表示将不再追究责任

360万元法拉利被4名儿童划损,最新进展:4名家长均已道歉,共计赔偿2万元,车主表示将不再追究责任

大风新闻
2026-07-04 09:50:03
4种中国式大妈发型:“自以为时髦,实际油腻显老”,看看是你吗

4种中国式大妈发型:“自以为时髦,实际油腻显老”,看看是你吗

白宸侃片
2026-07-05 00:26:23
L3/L4强制性国标关上了小鹏理想崇拜的特斯拉纯FSD视觉方案的大门

L3/L4强制性国标关上了小鹏理想崇拜的特斯拉纯FSD视觉方案的大门

沙雕小琳琳
2026-07-04 09:54:10
羽毛球运动员肖明铎去世,年仅17岁,长得很帅气,原因令人惋惜

羽毛球运动员肖明铎去世,年仅17岁,长得很帅气,原因令人惋惜

180视角
2026-07-05 07:03:42
严总出事才三天,西安赛格再迎3个坏消息,这下事闹大了

严总出事才三天,西安赛格再迎3个坏消息,这下事闹大了

娱乐洞察点点
2026-07-05 00:27:13
大快人心,受日本外务省资助的蒋方舟被清华教授举报了!

大快人心,受日本外务省资助的蒋方舟被清华教授举报了!

糖逗在娱乐
2026-07-04 20:40:35
中美贸易战,却意外养肥了这个国家!现在它开始对我们坐地起价!

中美贸易战,却意外养肥了这个国家!现在它开始对我们坐地起价!

书写传奇
2026-07-04 21:29:10
喜事将近?霍家正式官宣!让香港四大家族刮目相看,郭晶晶说对了

喜事将近?霍家正式官宣!让香港四大家族刮目相看,郭晶晶说对了

天天热点见闻
2026-07-05 08:55:05
董卿当年那句话含金量还在上升:韩红的厚度,从不是嘴上说说而已

董卿当年那句话含金量还在上升:韩红的厚度,从不是嘴上说说而已

子芫伴你成长
2026-07-02 23:04:56
为什么世界杯输球佛得角能赢得大家尊敬,巴拉圭会受到许多非议?

为什么世界杯输球佛得角能赢得大家尊敬,巴拉圭会受到许多非议?

生活新鲜市
2026-07-05 10:17:58
成本骤降90%!以色列“铁束”激光武器即将飞上F-15,无人机克星升空倒计时

成本骤降90%!以色列“铁束”激光武器即将飞上F-15,无人机克星升空倒计时

算力游侠
2026-07-05 01:29:28
俄媒女主持人曾言:若中国愿出兵300万,俄军很快就能打败乌克兰

俄媒女主持人曾言:若中国愿出兵300万,俄军很快就能打败乌克兰

南宗历史
2026-03-17 16:53:10
社会对底层人的压榨已经到了极限

社会对底层人的压榨已经到了极限

律法刑道
2026-07-05 08:54:33
非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

叙说医疗健康
2026-06-16 08:00:21
高考落幕撕开现实:大批毕业生自认家境优越不少家庭存款不足万元

高考落幕撕开现实:大批毕业生自认家境优越不少家庭存款不足万元

辉哥说动漫
2026-07-05 09:31:19
永州文旅沦陷!两个女游客遭强制猥亵,丈夫还被打骨折,当地立案

永州文旅沦陷!两个女游客遭强制猥亵,丈夫还被打骨折,当地立案

小鋭有话说
2026-07-01 13:25:56
乌军一招致命,俄后方爆出大雷,解放军大军压境,自卫队露怯了

乌军一招致命,俄后方爆出大雷,解放军大军压境,自卫队露怯了

书写传奇
2026-07-03 04:40:44
2026-07-05 11:32:49
半导体行业观察
半导体行业观察
专注观察全球半导体行业资讯
14095文章数 34968关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

蒋方舟再回应"清华教授实名举报论文造假":不认可

头条要闻

蒋方舟再回应"清华教授实名举报论文造假":不认可

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

王力宏成都舞台受伤 仍然坚持三小时

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

旅游
手机
数码
本地
公开课

旅游要闻

沂河岸边璀璨灯光秀出美景

手机要闻

华为“韬定律”V2版本发布;三星DRAM拟涨价20%

数码要闻

iOS 27源码曝光苹果全新可穿戴设备 支持“视觉智能”

本地新闻

国内足球之旅?这座小城给你高分答案

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版