智通财经APP获悉,中信证券发布研报称,Agent AI时代存力为核心,驱动存储行业迎长周期范式转移。供需方面,AI推理带动Token消耗剧增,KV Cache随之线性激增,需求爆发与原厂扩产错位致使缺货常态化,预计供不应求将持续至2027年,涨价贯穿2026全年。技术方面,在HBM及DRAM极度缺货及成本高企背景下,厂商分享NAND创新方案,分担显存容量需求压力。该行持续看好存储创新成长趋势。
中信证券主要观点如下:
2026年中国闪存市场峰会举办,聚焦AI时代存储创新及产业链升级机遇
2026年3月27日,全球存储产业年度盛会CFMS MemoryS 2026在深圳举办。作为行业风向标级峰会,本届活动以“穿越周期,释放价值”为核心主题,深度聚焦技术创新与产业链协同升级,吸引了三星电子、慧荣科技、铠侠、Solidigm、英特尔、腾讯云等数十家全球头部企业参与,覆盖存储芯片原厂、主控设计、模组制造、云端服务等全产业链环节。峰会通过高端论坛与技术展览双轨并行,演进中涉及景气趋势展望,聚焦Agent AI时代token/KV Cache剧增下的存力需求爆发,对PCIe 5.0/6.0 SSD、超大容量QLC技术突破及其他AI驱动下的存储创新变革展开前沿探讨,同步展示超百项创新产品。
AI推理带动存储需求爆发,结构性错配常态化,预计供不应求至少持续至2027,涨价贯穿2026全年
需求端:据CFM中国闪存市场数据,2026年服务器出货同比+15%,AI服务器在整体服务器出货中占比将突破20%,大模型从训练阶段步入推理阶段,Agent应用爆发导致Token消耗剧增,当序列长度从1k提升至128k token时,KV Cache占用从0.5GB提升至64GB(BF/FP16, 单请求)长上下文+高并发之下,存储需求随token/并发量线性暴涨,CFM预测HBM容量2025/2026年分别同比+90%/35%以上,同时KV Cache下沉叠加HDD供给短缺需求外溢驱动eSSD成为2026年NAND最大下游(占比提升至37%)。
供给端:扩产周期错位,缺货涨价将长期持续。存储原厂普遍采取稳住价格的策略,将先进产能优先投入高毛利的AI存储产品,据CFM,包含HBM/DDR5/LP5X/6较为高端的DRAM产能占比由2024年不到50%提升至2026年的85%+,成熟制程与消费级产能被持续挤压,行业库存由2023年10~12周,2024年8~10周,2026年下降至4周,跌至历史安全线以下。存储扩产周期长达18~24个月,26H2不可能出现供给拐点,慧荣科技认为2027年才是存储缺货的“至暗时刻”。25H2起存储价格迎来史诗级上涨,CFM预计DRAM和NAND ASP将在2026全年保持上涨。AI推理时代存力为核心,存储迎来长周期范式转移,为超级成长,非周期反弹。
存储产业链加速价值重构
在近期的GTC大会上,英伟达着重提出了“Token工厂经济学”,其核心意义在于强化了存储在AI基础设施中的战略地位,也意味着存储产业的盈利天花板将被长期打开,据CFM数据,eSSD产品ASP在26Q1已达消费级NAND ASP 2倍以上。对于存储原厂而言,核心在于进行介质升级及系统架构级重构,本次论坛演讲主要聚焦企业级市场;对于存储解决方案厂商而言,行业焦点从“看谁更便宜”转向“看谁能拿到货”,同时群联电子等头部厂商正加速向自研主控赋能的“客制化高附加值模组”转型,并拓展企业级SSD,以重新定义存储价值,摆脱传统依赖低成本库存的模式。
AI云端(企业级)存储趋势:大容量QLC爆发与接口极速演进,重塑算力引擎
AI正加速从“训练”走向“推理”阶段,未来推理与训练服务器的比例预计将高达10:1至50:1。目前,受制于存储带宽瓶颈,GPU集群的可用度(利用率)仅约46%至50%。显存升级为核心需求,同时本次峰会多家厂商分享存算协同的功能再分配,eSSD的角色正从“被动的数据容器”跃升为核心的“算力引擎”与“扩展内存层”:在训练侧,依托超大容量QLC eSSD存储Checkpoint,可大幅提升GPU的运行效率;在推理侧,eSSD则通过分层缓存KV Cache,承接庞大上下文状态管理、向量数据库查询及模型分片加载等任务。实测数据显示,将KV缓存卸载至SSD,通过消除预填充计算,可将首token生成时间(TTFT)降低41倍。企业级存储正呈现以下技术趋势:
面对海量AI数据与KV Cache的缓存外溢需求,高密度QLC成为关键介质,百TB级超大容量QLC方案成为首选。铠侠(245.76TB)、大普微(245TB)以及闪迪(高达256TB的SN670方案)也纷纷展出了突破两百TB级别的超大容量QLC产品,极大优化了空间效率与TCO。
主控芯片走向“软硬协同”,填补介质短板。针对推理场景下KV Cache带来的高频随机读写与带宽压力,主控芯片正主动升级。平头哥镇岳510通过原生支持ZNS协议及系统级协同,助力QLC规模化商用,累计出货超50万片;联芸科技则引入KV加速引擎、预测性预取等技术,让主控从“数据搬运工”变身为主动的“智能资源调度器”。
接口极速迭代与液冷创新,适配十万卡GPU超大集群。面向千卡、万卡乃至十万卡集群的庞大数据吞吐与高密度发热挑战。三星展示16通道PCIe 6.0固态硬盘PM1763,输入/输出性能跨越式提升2.0倍;FADU的PCIe Gen6主控“Lhotse”已流片,顺序读性能将达28.5GB/s。
AI终端(消费级)存储趋势:端侧AI加速落地,存算融合破解内存占用瓶颈
端侧环境对硬件BOM成本、系统功耗和DRAM内存占用极为苛刻,因此,通过“存算融合”、软硬件智能调度及高级缓存技术,将推理压力从内存(DRAM)向闪存(NAND)转移,成为当前突破端侧大模型部署瓶颈的重要补充。
AI PC与本地大模型:Hybrid混合技术降低DRAM容量需求暴增压力。在端侧运行百亿或千亿参数大模型对内存是巨大考验,江波龙推出搭载5nm SPU的存储处理单元与iSA存储智能体,在联合调优验证中在PC主机上实现397B模型本地部署,并在256K上下文场景下降低近40%的DRAM占用;群联电子推出Phison Hybrid AI SSD与aiDAPTIV+技术,预计可减少超50%的DRAM使用量,实现成本可控且安全的本地推理。
智能汽车与边缘计算:走向中央池化架构与统一平台底座。具身智能与高阶智驾对底层架构提出了全局协同要求。小鹏汽车明确指出,当前最高达2250 TOPS的算力下,DRAM带宽已成为推理延迟的核心瓶颈,车规LPDDR6时代即将到来,且车载NAND存储正从分域孤岛走向中央池化与软件定义。
智能手机与AIoT物联网:高速接口与高级缓存技术的深度下沉。面向移动端及新兴穿戴设备的响应速度与续航要求,慧荣科技即将推出新一代UFS 4.1主控SM 2755,并加速布局智能手表/眼镜等AIoT市场;闪迪采用SmartSLC缓存技术,在仅约2W功耗下实现UFS 4.1的高吞吐量运行;江波龙则推动HLC高级缓存技术在嵌入式端落地,以降低终端BOM成本。
风险因素:
全球宏观经济低迷风险;下游需求不及预期;创新不及预期;国际产业环境变化和贸易摩擦加剧风险;算力升级进度不及预期;云厂商资本开支不及预期等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.