网易首页 > 网易号 > 正文 申请入驻

这些趋势推动2026年进入“内存超级周期”

0
分享至

“超级周期”这个词,再次回到了存储半导体的叙事中心。

过去,内存价格起起伏伏,总被视为资本开支与库存的游戏。2021年,行业沉浸于短缺经济的繁荣之中,两年后,行业又旋即陷入“传统周期”低谷,三巨头的美光、三星与SK海力士,利润率无一不是跌破零点。


正是GPT的横空出世,重新定义了内存的价值。AI的性能,很大程度上去取决于它们存储数据的方式,访问数据的速度,以及可以储存的数据的规模。计算是能源的处理形式,但能源也越来越多地用于数据不断写入、读出与传输。彼时,为内存这一标准化的“大宗商品”带去新生的是HBM。

如果机械照搬四五年一轮回的“传统周期”,很快内存行业又将陷入低谷。但这一次,行业相信AI正在改写这条曲线。需求不再仅仅是短期库存回补,而是对计算、带宽及能效的结构性重塑。

卖方市场

整个AI都是芯片的卖方市场。硅谷巨头们陷入了第二波AI基建热潮,不仅GPU短缺,HBM同样短缺。SK海力士明年的订单也早已售罄。

面向数据中心的HBM,由堆叠的DRAM构建而成,创造了更高的价值。它与主要面向消费电子市场的DDR,存在产能分配矛盾。从Ampere到Blackwell Ultra,HBM不仅在AI基础设施硬件中的材料清单(BOM)中成本超过一半,而且还在继续增长;在BOM增长中,绝对和相对增长的最大部分,都来自HBM。因此,内存巨头们也更有动力将产能分配给它。

另一方面,消费电子也在接受AI的栖身;又撞上了PC换机周期。最近,苹果已经开始抢购三星明年二季度出货的LPDDR5X内存(低功耗版),以应对已经迟到的个人AI体验;小米干脆宣布上调新品售价。

尽管NAND领域与DRAM没有直接的产能分配矛盾,但它们往往在资本开支层面此消彼长。这也导致内存的“超级周期”从DRAM领域蔓延至NAND领域。另一方面,随着Veo 3与Sora 2将视频生成推向竞争前沿,AI对于大容量储存的需求,本身也在飞涨。上个月,闪迪率先宣布涨价,全系上调10%;这个月,三星和SK海力士更是提价高达30%。

市场普遍预计,这场由AI驱动的供应短缺,不只是供需错配的结果,将比以往任何一次“传统”的繁荣周期都更长、更强。

以内存为中心视角的AI基础设施


这张来自Seagate(希捷)的图示,清晰地展示了,在AI基础设施的整体架构中,各类存储(Storage )与内存(Memory)产品在不同环节中的分工与作用。

GPU或XPU等处理器,与HBM/DRAM紧密耦合,从而构建出强大的计算集群(Compute Cluster)。越靠近GPU,数据就越“热”,也就越需要更高的带宽与更低的延迟。最终,这些数据会流入一个基于HDD(机械硬盘)或SSD(固态硬盘)构建的网络化存储集群(Storage Cluster),“冷却”下来,用于长期保存。它们容量更大,成本更低,速度则会更慢。

在过去,大模型预训练是AI基础设施的主要需求。这是一个数据如何被存储、预处理、分发,以及模型权重如何更新的流程。庞大的训练数据集通常存放在存储集群,前端配备了一层SSD缓存,以提高读取效率。训练开始前,数据会被token化,以二进制格式写入SSD。在训练中,这些token会被分批(batch)加载到GPU,使得HBM得以充分利用;模型的权重与状态会周期性地保存为检查点(checkpoints),存放在NVMe(基于PCIe总线的高性能存储协议)SSD上,以便中断后快速恢复。

如今,推理已成为新的主角。它意味着模型权重、键值缓存(KV cache)以及RAG(检索增强生成)的不同数据访问模式。在这个过程中,模型参数不再频繁重写,也让不擅长此道的NAND获得新的机会。当查询触发时,模型权重必须加载到HBM。随后生成的键值矩阵(KV matrices),也会暂存在HBM中,用于后续注意力计算。如果KV缓存过大,就要先后分层卸载(offload)至DRAM与SSD中。RAG的向量数据库通常也存放在SSD上,在推理时快速检索并载入HBM。

容量、带宽与成本,构成了AI基础设施中内存技术的“不可能三角”。但市场仍试图突破边界,或同时提升三者上限,或在特定应用中强化某一项性能。这为即将到来的“超级周期” 注入了新的结构性增量与想象力。

定制HBM

不断扩展的大模型,对带宽的追求也没有尽头。越靠近计算核心的内存,就越成为性能提升的关键。被称为“HBM之父”的,已经将HBM的路线图,规划至 2038年。从HBM4到HBM8,每一代都在推高带宽、速度与容量上限,其中带宽的提升尤为显著。


如今,SK海力士、美光与三星已经进入HBM4的首轮竞速。三家公司已经先后向英伟达送样,HBM4将成为2026 年下一代AI基础设施与AI加速芯片的标准配置。

但正如AI芯片,HBM也开始讲诉同样的叙事。为了压缩能耗、减少延迟与信号损失,AI芯片厂商开始与存储厂深度共设计(co-design),推出定制化基底裸片(custom base die)。这意味着HBM堆叠底部的逻辑层不再通用,而是针对特定AI架构优化信号路径、电源分配与接口协议,从而实现更高的能效和带宽密度。这是一次革新架构层面的重大飞跃,彻底改变了HBM与AI加速器的集成方式。

今年6月,SK海力士同时锁定了英伟达、微软、博通,达成HBM4E定制合作;三星也在与博通、AMD谈判。英伟达已经拿出了自己的基础裸片的设计,预计2027年小规模量产。它现在不仅要自己掌握GPU、CPU与网络,还要掌握HBM,未来无论HBM由哪家制造,都必须兼容它的底层架构。亚马逊AWS高管直言,HBM定制化“可能会关闭其他玩家的大门”。

存算一体

如果HBM代表着“更大的带宽”,那么“更近的距离”也是业界开始思考大幅降低数据延迟的另一条路径。初创企业d-Matrix就认为,与其堆叠更多带宽,不如直接。

在今年夏天的 Hot Chips 2025 上,这家成立于2019年的企业,展示了这种理念的最新形态。它就是Pavehawk 架构,其核心是3D堆叠数字内存计算(3DIMC)技术,使用改进型SRAM单元,在内存内部直接执行计算。通过在垂直方向上将计算层与存储层堆叠,数据移动距离被压缩到极限。它还发布了存算一体的Corsair芯片,宣称带宽性能比HBM4高出10倍,能耗则降低90%。


到了OCP全球峰会2025上,d-Matrix更进一步,展示了机架级解决方案 SquadRack。它在性价比、能效、token生成速度上,分别提升了3倍、3倍、10倍。单机架可以运行千亿参数大模型;想要部署更大的模型,还可以通过以太网横向扩展。明年,这家公司还会拿出迭代后的Raptor架构。

推理工作负载正迁移至边缘与端侧。随着小模型性能逐步提升,存算一体能在延迟高度敏感的应用场景下找到自己的机会。侧重SRAM层面的创新,也是Groq等芯片初创企业努力突破的方向。

热数据扩展

随着推理负载不断扩大,压力也在从DARM向NAND传导。当上下文窗口与并发请求同时增长时,推理系统开始需要一种更廉价、更大容量的“缓冲层”。这让SSD成为了创新焦点。

当初,为了减轻HBM的压力,无论是英伟达的Dynamo Distributed KVCache Manager框架,还是华为的UCM技术,都在通过多级缓存算法,将访问压力逐层下沉到存储层。但HDD带宽实在太低,带宽性能(BW/TB)反而随着单盘容量持续提升而逐年下降。而主流TLC(三层单元)SSD容量稍显不足;一个单位SLC(单层单元)能储存1个比特(2种状态),到了量产级的最新主流技术QLC(四层单元)则能储存4个比特,相当于闪存容量翻了16倍。


今年年中,Meta宣布与PureStorage合作,将QLC SSD引入数据中心架构,以取代部分HDD和TLC SSD。Meta认为,尽管TLC在写入密集型环境中仍具优势,但QLC拥有更高密度、更好能效和更低的每TB成本,足以承担“热数据”的一部分任务。

HBF终局

如果说HBM代表着DRAM的堆叠形态,那么HBF则是NAND的堆叠形态。前者在内存层级持续追求更高带宽,后者则在存储层级探索更高带宽与更大容量。这种架构尤其适合向量数据库与AI智能体等场景,它们渴求内存容量的高速增长。

金教授相信,未来,HBF将左右整个业界的性能表现。力积电(Powerchip)也是这么想的,在上周的财报发布会上表示,HBF将成为未来的重要技术,能够满足文本、图像甚至视频模型带来的超大规模存储需求。Rubin CPX的出现已经证明,并非所有阶段都必须超高的内存带宽;是时候追求更高的内存容量了。

当前,HBM最大的短板正是容量。由于DRAM采用“1T1C”结构,即每个单元包含一个晶体管(Transistor)和一个电容(Capacitor),其扩展空间已经逼近物理极限,内存密度难以继续提升。相比之下,NAND采用单晶体管浮栅(floating gate)结构,单元间距更紧凑,便于扩展。基于NAND的架构可实现比HBM高8至16倍的存储密度,并在相近成本下提供可比的读取带宽。

今年8月,闪迪(SanDisk)与SK海力士签署了谅解备忘录(MoU),宣布共同开发HBF产品,首批样品预计将于2026年下半年面市。在本月的OCP大会上,SK海力士官宣了“AI-NAND B”系列,正是一款通过堆叠NAND闪存以扩大带宽的HBF。

AI时代,AI基础设施中的内存栈正在被逐步重构。大模型的未来,取决于它能装下多少数据,又能以多快的速度读写这些数据。市场在扩产HBM,满足周期性上行的需求,也在发明新的内存形态,创造新的增量市场。于是,内存或许真的迎来了属于自己的“超级周期”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

带你感受人间冷暖
2025-11-04 16:38:29
黄火青曾想帮助丁盛恢复军籍,事情碰壁,慨叹:谁知结果是这样!

黄火青曾想帮助丁盛恢复军籍,事情碰壁,慨叹:谁知结果是这样!

春秋砚
2025-11-08 13:30:06
世界最高的教堂封顶!高迪设计,建了143年

世界最高的教堂封顶!高迪设计,建了143年

GA环球建筑
2025-11-08 16:49:15
绿卡重大改革!给老人申请绿卡面临严查,有慢性病的将被拒签

绿卡重大改革!给老人申请绿卡面临严查,有慢性病的将被拒签

大洛杉矶LA
2025-11-08 04:32:11
国家出手!李梓萌骗人真相大白,幕后黑手被揪,受害者不止一人

国家出手!李梓萌骗人真相大白,幕后黑手被揪,受害者不止一人

许穋很机智
2025-10-19 13:34:42
西安市委书记方红卫,被查

西安市委书记方红卫,被查

新京报
2025-11-07 20:21:09
这是我见过的五官最精致的女性,一脸福相,以后会贵不可言

这是我见过的五官最精致的女性,一脸福相,以后会贵不可言

手工制作阿歼
2025-10-28 14:03:28
为什么建议不要加95号汽油?车主:加95号油是自找麻烦

为什么建议不要加95号汽油?车主:加95号油是自找麻烦

小怪吃美食
2025-11-06 07:23:31
念你,岁岁年年

念你,岁岁年年

繁花新鲜事
2025-10-29 15:34:10
生命起源宇宙?多名宇航员返回地球后,身体出现“不可逆”变化

生命起源宇宙?多名宇航员返回地球后,身体出现“不可逆”变化

不写散文诗
2025-10-31 23:51:29
我曾背一残疾同学上学8年,三十年后重逢,他的态度让我怀疑人生

我曾背一残疾同学上学8年,三十年后重逢,他的态度让我怀疑人生

人间百态大全
2025-10-27 06:45:03
中国人死亡19万,比美军多5倍,好意思说胜利吗?金将军这样回答

中国人死亡19万,比美军多5倍,好意思说胜利吗?金将军这样回答

混沌录
2025-10-29 20:22:14
67岁环卫工打扫时被撞身亡,用人单位诉请撤销工伤认定,称签劳务协议时超退休年龄 法院驳回

67岁环卫工打扫时被撞身亡,用人单位诉请撤销工伤认定,称签劳务协议时超退休年龄 法院驳回

红星新闻
2025-11-07 20:40:10
《繁花》剧组再发声明

《繁花》剧组再发声明

新京报
2025-11-08 20:48:13
未来两年,武汉大拆迁,有你家吗?

未来两年,武汉大拆迁,有你家吗?

光华楼评
2025-11-08 09:42:06
女子北京缴十多年社保,却被告知不能在北京退休,官方:超龄了

女子北京缴十多年社保,却被告知不能在北京退休,官方:超龄了

渔夫说事
2025-11-08 16:35:03
宁夏退伍士兵将岳父全家7口人全部割喉,妻子肚里的孩子都没放过

宁夏退伍士兵将岳父全家7口人全部割喉,妻子肚里的孩子都没放过

热风追逐者
2025-09-24 23:41:51
北京卫戍区从兵团级降格为正军级后,从未配备副大军区级

北京卫戍区从兵团级降格为正军级后,从未配备副大军区级

起喜电影
2025-11-08 11:30:31
莫斯科大面积停电:海王星导弹让俄民众尝战争苦果

莫斯科大面积停电:海王星导弹让俄民众尝战争苦果

世界探索者探索
2025-11-06 21:28:25
太阳若熄灭,我们至少10000年后才能感受到,生命又将经历什么?

太阳若熄灭,我们至少10000年后才能感受到,生命又将经历什么?

诗意世界
2025-11-07 16:47:03
2025-11-08 21:16:49
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
239文章数 52关注度
往期回顾 全部

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

艺术
旅游
游戏
家居
公开课

艺术要闻

40岁老板娘风流成性,同时交往多名男友!被情人痛下杀手...

旅游要闻

万盏LED点亮伦敦夜空!摄政街天使彩灯,藏着欧洲最暖的圣诞浪漫

腾讯旗下生活模拟RPG新作首曝!浮空都市X温馨怪谈

家居要闻

现代自由 功能美学居所

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版