![]()
国家数据局数据显示,从2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿(截至2026年3月),两年增长超过千倍,而在这组数据的背后,体现了AI正在从实验室里的模型训练,全面进入生产生活中的应用落地。
过去以“数据保存”为核心使命的存储设备,如今被赋予了“数据赋能”的全新职责——它不再是被动承载数据的“容器”,而是主动参与数据处理、支撑AI高效运转的“核心枢纽”。
对于存储行业来说,这个拐点带来的不是温和的增量增长,而是一场全面重构。在这场重构的背后,不再是让数据走向AI,而是让AI走向数据。
存储架构迎来“基因重组”
“原来的企业存储是做数据保护,现在AI存储的第一目标是效率提升——如何充分满足GPU对于数据的需求,而不让它空转”,浪潮信息存储产品部副总经理郭海峰用这样一句话概括了存储使命的根本性变化。
这不仅是产品定位的调整,而是整个技术架构的“基因重组”。郭海峰指出,传统企业级存储是“通算架构”——以CPU为核心,数据需要由CPU进行路径解析、从内核态进行复制和转发,再传给GPU进行计算。这种架构在服务关系型数据库和传统应用时运转良好,但当它面对智算时代的GPU集群时,效率极为低下:如果存储成为瓶颈,昂贵的GPU就会空转。
数据可以说明问题的严重性。IBM大中华区存储事业部总经理吴磊告诉笔者,如今GPU部署动辄百卡、千卡、万卡规模,投资以亿甚至十亿计,“1%的闲置就意味着上亿元的浪费”。无独有偶,郭海峰同样曾公开表示,存储和网络在整个智算系统中可能只占5%-10%的成本,但如果GPU空转,这5%-10%的成本就会毁掉其余90%以上的投资回报。
为了满足当前企业对于算力利用率的需求,存储也迎来了“基因重组”的新阶段。目前来看,从软件和硬件两个层面切入,都可以优化整体存储架构。这个过程中,浪潮信息与IBM就是很好的两个方面的代表。比如,浪潮信息在其新发布的A9000系列产品中就采用了“全链路免锁零拷贝的用户态AI原生并行架构”,将数据传输路径从内核态切换到用户态协议栈,实现端到端的免拷贝,将延迟从传统的毫秒级降至微秒级,单节点带宽达到160GB/s(行业主流水平为60GB/s至80GB/s)。
在软件层面的架构变革背后,暗含着一条更深层的技术主线,那就是KV Cache。在AI推理场景中,为了加速模型响应、避免重复计算,系统需要将键值对缓存保留在高速存储中。但随着上下文窗口的急剧扩大,KV Cache的规模已经远远超出了GPU显存(HBM)和本地DRAM的承载能力。郭海峰向笔者详细解释了这一技术逻辑:通过PD分离(Prefill与Decode分离),利用GlobalCast技术和“双路径”设计,将空闲的带宽整合利用,显著缩短首Token产生时间。浪潮信息公布的数据显示,通过Agent Memory外置存储架构,A9000可将首Token延迟(TTFT)降低97%,Token吞吐量提升超过20倍。
与之相对,IBM则从另一个维度切入。IBM推出的Storage Scale并行文件系统在万卡集群中支撑高频的checkpoint数据落盘,确保数据能够在极短时间内写入存储,充分释放GPU的计算效率。
除了“软件”层面的优化之外,IBM还在其自研的第五代闪存核心模块(FlashCore Module 5)的每块NVMe闪盘上嵌入一颗专用芯片和高性能处理器,实现硬件级的压缩、去重和加密。吴磊透露,这一设计可以将压缩比做到1:5,并且因为压缩在盘上完成,不会对存储控制器的性能造成影响。
种种技术的变化都揭示了AI时代存储架构的另一个重要方向:存储不再只是数据的被动容器,而是具备感知和计算能力的主动节点。
涨价是暂时的,效率优化才是关键
当存储节点不再是被动容器,而是进化为承载KV Cache、主动参与计算卸载的智能枢纽之时,业界对高带宽、低延迟存储介质的依赖便呈指数级攀升。这种由架构变革催生的庞大缺口,直接投射在了上游供应链的产量倾斜与价格博弈之上。
据多方数据显示,2026年第一季度DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。这轮涨价潮的直接推手是AI——大模型训练和推理需求井喷,DRAM和NAND原厂将大量产能从消费级产品转向高利润的企业级AI产品,TrendForce预测,2026年第二季度NAND闪存合约价将继续大幅跳升70%至75%。
但吴磊与郭海峰不约而同地认为,存储涨价是一时的,真正需要关注的是效率优化。郭海峰提到,有的企业将存储迁移到高带宽方案后,GPU利用率提升了15%——“用不到整个项目10%的钱采购存储,把卡的利用率提升了15%”。吴磊则算了一笔更直观的账:通过FCM的1:5压缩技术,用户在涨价后开启压缩功能,实际可用容量的单位成本甚至比涨价前更低。
然而成本优化远不只是一个压缩比的问题。存储行业正在经历的,是对“数据应该放在哪里”这一根本问题的重新思考。传统企业级存储中,“热、温、冷”数据分层管理已经是成熟理念,但AI时代的分层逻辑远比过去复杂。
这时候,五层存储体系也就应运而生了,其出现是AI给存储行业带来的最直观的结构性变化。按照业界通行的分类:第一层是HBM(高带宽内存),第二层是本地DRAM,第三层是本地SSD,第四层是传统企业级外置存储。而在第三层和第四层之间,现在出现了一个“3.5层”——这是一个专门服务于推理场景的外置缓存层。
为什么需要3.5层?郭海峰向笔者解释道:“3.5层是为了效率,放弃一定的可靠性,数据比是1:1,大不了数据丢了重新算,但不能牺牲效率。”这与第四层传统存储“数据保护优先”的理念形成了鲜明对比。无独有偶,吴磊也给出了类似的判断:“全用HBM当然最好,但HBM太贵了。”在经济学约束下,分层是必然选择。
而在五层存储体系分层的影响下,“磁带存储”这个“古老”的存储技术又一次成为了企业性价比之选。据吴磊介绍,过去几年多家大厂已部署EB级甚至10EB级的磁带库,包括百度智能云在底层的冷数据存储。LTO联盟由IBM、HPE和Quantum联合推动,LTO-10已实现40TB原始容量,2.5:1压缩比下可达100TB,未来LTO-11可达70TB、LTO-12可达110TB。吴磊提供了一个实用视角:磁带机械臂从最远端抓取数据大约需要一分五十多秒,但如果一个数据三个月甚至六个月才访问一次,两分钟的等待完全可以接受。
让AI走向数据
这一轮存储行业的变革不仅仅是五层存储体系所能完整体现的,而是映射出了一个更为深层的变化,传统的“让数据走向AI”模式已经不能满足当前用户的需求,让AI走向数据将取而代之。
在传统数据使用模式中,AI应用是“索取方”:应用发起请求,存储响应。这种模式在小规模、低频次场景下可行,但面对EB级数据、百万并发请求时,完全不可持续。更致命的问题是数据一致性的崩塌。吴磊用一段生动的比喻描述了这一困境:“我们每个人可能好几个TB的照片、视频,企业是几百个TB、几百个PB,甚至EB级的时候,哪一个副本数据说出来的是真话,哪个副本数据说出来的是假话?”
面对此,IBM给出的解决方案是内容感知存储(Content-Aware Storage,CAS),结合单一数据副本和即时感知数据变化的机制。其核心理念是:数据发生了变化,模型能够即时感知,而不是通过繁琐的副本生产和传输来同步。吴磊强调:“过去部分厂商出于销售目的建议客户扩容升级。存储管理员疲于应对报告和迁移。现在有了AI智能体,可以把所有数据分析完,一次性做出决策,甚至可以做到跨洲的数据迁移。”
这意味着存储的角色从被动的数据仓库转变为主动的数据编排平台。而这个解题思路似乎已经行业的一个共识。IBM提出的内容感知存储核心理念与浪潮信息提出的“AI Data Platform”概念有着许多相似之处。郭海峰告诉笔者,“AI Data Platform”概念强调的是数据不是静态的“湖”,而是“一条不断流淌的河流,不断有数据进来,不断去处理、清洗、打标和再优化,重新训练模型”。这种动态的数据管理逻辑,与传统的“存下来以后再说”的思路有着本质区别。
从产业视角看,“让AI走向数据”正在催生新的产业协同模式。浪潮信息利用全栈能力(从底层算力到上层平台)为合作伙伴提供基础设施,郭海峰将其形容为“搭台唱戏”——浪潮信息搭台,伙伴唱AI这场戏。IBM则宣布与英伟达进一步扩大合作,在GTC 2026上展示了深度集成方案:Storage Scale System 6000可提供10PB高性能存储,用于支撑GPU原生分析引擎,IBM同时计划于2026年第二季度初在IBM Cloud上提供英伟达Blackwell Ultra GPU。
但这一切的最终落点仍然是人。吴磊在沟通会上反复强调:“AI是一个工具,不能代替人,它没有情感,它没有办法做决定,最终做决定的是人类。”无论是浪潮信息让GPU“不空转”,还是IBM用AI智能体让存储管理员管理数十个同构或异构节点,终极目标都是将人从繁琐的运维中解放出来,将注意力投向创新。
IBM商业价值研究院的调研显示,76%的CEO对自己企业的IT架构“非常自信”,但43%的CIO感到焦虑。这种认知落差恰恰说明,AI时代的数据基础设施挑战,远比表面看到的更复杂。“让存储融入平时的业务中,而不是让业务等存储”——金鑫这句总结,或许是这个时代对存储行业最朴素也最关键的要求。
回望过去两年,存储行业经历了从波澜不惊到惊涛骇浪的转变。当全球AI总支出逼近万亿美元量级,当Token成本的每一次下降都直接影响大模型的经济可行性,存储不再只是技术的终点,而正在成为AI价值链条中不可或缺的一环。
(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.