直接说结论:SSD
- 价值量核心差异:训练场景的存储成本重心在HBM,是 AI 算力升级的直接受益者;推理场景的存储成本重心在SSD,模型数量爆炸带动容量需求爆发。
- DDR 是通用底座:两个场景均需大容量 DDR5,随 AI 服务器扩容稳步增长,弹性弱于 HBM 和高端 SSD,但确定性最强。
- 成本占比持续抬升:AI 驱动下,存储在 AI 服务器总成本中的占比从传统服务器的 10%-15%,提升至 20%-30%;其中 HBM 和企业级 SSD 是增量最大的两个品类。
- 供需紧张程度分化:HBM 供给刚性最强,价格弹性最大;企业级 SSD 受 AI + 传统服务器双需求拉动,2026 年价格涨幅显著;DDR5 受服务器整体扩容带动,价格周期与 AI 需求共振。
AI 大模型的训练与推理,本质是海量张量数据的反复搬运与计算,存储是限制算力发挥的核心瓶颈。三者在 AI 数据中心(AI DC)中形成明确的分层协作体系:
1. AI 训练场景:海量数据迭代,带宽决定训练效率
训练阶段需要反复加载数据集、前向传播、反向更新权重,数据吞吐极大,对存储的带宽、容量、稳定性要求最高。
- HBM:核心计算载体,训练速度的瓶颈
- DDR:系统级缓冲,衔接存储与显存
- SSD:海量数据底座,持久化存储
推理阶段单批次计算量小,但模型权重大、并发请求多,访存耗时占比更高,“内存墙” 问题更突出。
- HBM:推理性能的核心约束
- DDR:请求调度与多模型缓存
- SSD:全量模型库与冷数据存储
- HBM:堆叠层数持续提升(从 8 层到 16 层、24 层),带宽向 2TB/s + 迈进,内嵌散热结构,HBM4/5 代际持续升级;
- DDR:向 DDR5/6 演进,容量更大,配合 CXL 协议实现内存池化,让多 GPU 共享远端 DDR 内存,缓解 HBM 容量不足;
- SSD:向高密 QLC/PLC、PCIe 6.0 演进,单盘容量突破 200TB,同时靠近计算节点部署(近端存储),缩短数据搬运路径。
附图:
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特别提示:内容基于公开信息整理,仅作知识科普,不构成投资建议,投资有风险,入市需谨慎
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.