网易首页 > 网易号 > 正文 申请入驻

存储涨价90%背后:AI倒逼存储"基因重组"

0
分享至

「1%的闲置就意味着上亿元的浪费。」当IBM吴磊说出这句话时,存储行业的底层逻辑已经彻底变了。

2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿。两年千倍增长,AI正从实验室训练全面杀入生产生活。但这组疯狂数字背后,藏着一个被忽视的瓶颈——存储。


过去存储是"数据保险箱",现在成了"算力水龙头"。GPU集群动辄千卡万卡,投资以亿甚至十亿计。存储一旦卡壳,昂贵的GPU集体空转。这不是性能优化,是生死线。

一、存储使命的"基因重组":从保护数据到喂养GPU

浪潮信息郭海峰用一句话点破本质:「原来的企业存储是做数据保护,现在AI存储的第一目标是效率提升——如何充分满足GPU对于数据的需求,而不让它空转。」

这不仅是产品定位调整,是技术架构的底层重写。

传统企业级存储是"通算架构"——CPU为核心,数据经CPU路径解析、内核态复制转发,再传给GPU。这套架构服务关系型数据库时运转良好,面对智算时代的GPU集群却效率极低。

数据印证了严重性。吴磊透露,GPU部署规模已至百卡、千卡、万卡级别,「1%的闲置就意味着上亿元的浪费」。郭海峰也曾公开表示:存储和网络只占智算系统5%-10%成本,但GPU空转时,这5%-10%会毁掉其余90%以上的投资回报。

存储的"基因重组"从软硬件两个维度同时展开。

硬件层面,浪潮信息A9000系列采用"全链路免锁零拷贝的用户态AI原生并行架构"。数据传输路径从内核态切至用户态协议栈,端到端免拷贝,延迟从毫秒级压到微秒级,单节点带宽160GB/s——行业主流水平仅60GB/s至80GB/s。

软件层面,一条更深的技术主线正在浮现:KV Cache(键值缓存)。

AI推理场景中,为加速响应、避免重复计算,系统需将键值对缓存留在高速存储。但上下文窗口急剧扩大后,KV Cache规模已远超GPU显存(HBM)和本地DRAM的承载极限。

郭海峰详细解释了技术逻辑:通过PD分离(Prefill与Decode分离),利用GlobalCast技术和"双路径"设计,整合空闲带宽,显著缩短首Token产生时间。浪潮信息数据显示,Agent Memory外置存储架构可将首Token延迟(TTFT)降低97%,Token吞吐量提升超20倍。

IBM则从另一维度切入。Storage Scale并行文件系统在万卡集群中支撑高频checkpoint数据落盘,确保数据极短时间内写入存储,充分释放GPU计算效率。

更激进的硬件创新来自IBM自研的第五代闪存核心模块(FlashCore Module 5)。每块NVMe闪盘嵌入专用芯片和高性能处理器,实现硬件级压缩、去重和加密。吴磊透露,压缩比可达1:5,且因压缩在盘上完成,不影响存储控制器性能。

这些技术变化指向同一方向:存储不再是被动容器,而是具备感知和计算能力的主动节点。

二、涨价90%的连锁反应:效率优化成唯一解

当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽,业界对高带宽、低延迟存储介质的依赖呈指数级攀升。这种架构变革催生的庞大缺口,直接投射在上游供应链的价格博弈上。

2026年第一季度,DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。TrendForce预测,2026年第二季度NAND闪存合约价将继续大幅跳升70%至75%。

涨价推手明确:大模型训练和推理需求井喷,DRAM和NAND原厂将大量产能从消费级转向高利润的企业级AI产品。

但吴磊与郭海峰不约而同地认为,存储涨价是一时的,效率优化才是核心命题。

郭海峰提到实例:有企业将存储迁移至高带宽方案后,GPU利用率提升15%——「用不到整个项目10%的钱采购存储,把卡的利用率提升了15%」。吴磊的账更直观:通过FCM的1:5压缩技术,用户涨价后开启压缩功能,实际可用容量的单位成本甚至比涨价前更低。

成本优化远非压缩比这么简单。存储行业正在重新回答"数据应该放在哪里"这一根本问题。

三、五层存储体系:AI时代的数据"定居点"重构

传统企业级存储中,"热、温、冷"数据分层已是成熟理念。但AI时代的分层逻辑远比过去复杂。

五层存储体系应运而生,这是AI给存储行业最直观的结构性变化。

按业界通行分类:第一层HBM(高带宽内存),第二层本地DRAM,第三层本地SSD,第四层传统企业级外置存储。而在第三层和第四层之间,出现了一个"3.5层"——专门服务于推理场景的外置缓存层。

为什么需要3.5层?郭海峰的解释很直白:「3.5层是为了效率,放弃一定的可靠性,数据比是1:1,大不了数据丢了重新算,但不能牺牲效率。」这与第四层传统存储"数据保护优先"的理念形成鲜明对比。

吴磊给出类似判断:「全用HBM当然最好,但HBM太贵了。」经济学约束下,分层是必然选择。

五层体系的影响向下传导,一个"古老"技术重新成为性价比之选——磁带存储。

据吴磊介绍,过去几年多家大厂已部署EB级甚至10EB级磁带库,包括百度智能云底层的冷数据存储。LTO联盟由IBM、HPE和Quantum联合推动,LTO-10已实现40TB原始容量,2.5:1压缩比下可达100TB,未来LTO-11可达70TB、LTO-12可达110TB。

吴磊提供了一个实用视角:磁带机械臂从最远端抓取数据约需一分五十多秒,但如果数据三个月甚至六个月才访问一次,两分钟等待完全可以接受。

这一轮变革远不止五层体系所能完整概括。

四、从"数据走向AI"到"AI走向数据":范式转移的底层逻辑

存储行业的重构,本质是AI基础设施范式的根本转移。

过去是"数据走向AI"——数据被搬运到计算中心,由模型处理。现在是"AI走向数据"——计算能力下沉到数据所在位置,存储节点主动参与推理过程。

这种转移的驱动力来自经济现实。GPU算力成本高昂,任何数据搬运的延迟和冗余都是不可承受的浪费。存储必须从"成本中心"进化为"效率杠杆"。

浪潮信息与IBM的技术路线差异,恰恰映射了这场变革的多元路径。前者从架构底层重写数据传输逻辑,后者从硬件颗粒度和系统级优化切入。两条路径指向同一终点:存储即计算,数据即服务。

KV Cache的外置化、PD分离的架构创新、硬件级压缩的芯片嵌入——这些技术细节的累积,正在重塑企业级存储的产品定义。未来的存储采购决策,将不再以容量和可靠性为单一维度,而是以"每Token成本"和"GPU利用率提升幅度"为核心指标。

这对科技从业者意味着什么?

首先,基础设施团队的技能栈需要扩展。传统的存储管理员熟悉RAID、备份策略和容量规划,现在必须理解推理延迟、KV Cache命中率和checkpoint写入带宽。存储与AI工程的边界正在模糊。

其次,成本核算模型必须更新。存储采购不能再按"每GB多少钱"简单计算,而要建立全栈效率模型——存储投入如何转化为GPU利用率提升,进而影响整体推理成本。

最后,技术选型需要更长期的供应链视角。DRAM和NAND的价格波动将持续,但架构决策的影响周期更长。选择支持硬件压缩的存储平台,或提前布局五层体系的分层策略,是对冲价格风险的有效手段。

存储行业的这场"基因重组",远未结束。

当140万亿日Token成为常态,当万卡集群成为中型企业的标配,存储架构的每一次优化都将被放大为巨额的经济效益或损失。这不是关于技术的抽象讨论,是关于资源如何配置、效率如何衡量、竞争力如何构建的硬核商业问题。

浪潮信息和IBM已经亮出了自己的牌。更多玩家正在入场。而真正的考验在于:当存储从"容器"变成"枢纽",你的基础设施团队准备好重新理解数据的位置了吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股存储芯片股集体飙涨,多股20cm涨停,金螳螂11天9板,闻泰科技一字跌停

A股存储芯片股集体飙涨,多股20cm涨停,金螳螂11天9板,闻泰科技一字跌停

21世纪经济报道
2026-05-06 12:16:08
重庆动物园通报“大熊猫食用竹子被指发霉”:供应商处理不当致部分竹子变质

重庆动物园通报“大熊猫食用竹子被指发霉”:供应商处理不当致部分竹子变质

界面新闻
2026-05-06 07:09:51
不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

细说职场
2026-04-26 21:04:20
赖文峰现身陕西,与小23岁妻子楚玲直播带货助农,性格随和有耐心

赖文峰现身陕西,与小23岁妻子楚玲直播带货助农,性格随和有耐心

揽星河的笔记
2026-05-05 20:18:37
湖人输雷霆,听听媒体专家怎么说!詹姆斯因祸得福,亚历山大拉胯

湖人输雷霆,听听媒体专家怎么说!詹姆斯因祸得福,亚历山大拉胯

杨仔述
2026-05-06 11:56:19
越南少将的坦白:中国军队在谅山再停留五天,越军将无一幸免

越南少将的坦白:中国军队在谅山再停留五天,越军将无一幸免

别人都叫我阿腈
2026-05-03 03:21:11
汪峰新恋情曝光:森林北成为过去式!

汪峰新恋情曝光:森林北成为过去式!

八卦疯叔
2026-05-04 09:48:43
俄想截胡?乌总理急访华游说:图们江教训惨痛,中国不能轻易点头

俄想截胡?乌总理急访华游说:图们江教训惨痛,中国不能轻易点头

有范又有料
2026-05-05 11:26:19
0-1遭爆冷绝杀!中国U17男足首秀耻辱一败,大争议:4大主力遭弃

0-1遭爆冷绝杀!中国U17男足首秀耻辱一败,大争议:4大主力遭弃

大秦壁虎白话体育
2026-05-06 06:46:15
想不通!钱越来越难挣,五一到处却人山人海,西安网友吐槽引热议

想不通!钱越来越难挣,五一到处却人山人海,西安网友吐槽引热议

夜深爱杂谈
2026-05-06 11:13:06
10年麻将馆老板囗述:凡是爱打麻将的,没有一个人日子是过得好的

10年麻将馆老板囗述:凡是爱打麻将的,没有一个人日子是过得好的

小噎论事
2026-04-24 17:15:21
伊朗曝光美海底光缆后,中国埋了几十年的管道,开始变得值钱了

伊朗曝光美海底光缆后,中国埋了几十年的管道,开始变得值钱了

杰丝聊古今
2026-05-04 01:00:28
王晶曝陈百强真正死因,64岁何超琼颜面尽失

王晶曝陈百强真正死因,64岁何超琼颜面尽失

君笙的拂兮
2026-03-22 03:44:36
胃热是光吃不拉,脾虚是一吃就拉,肝郁是不停放屁,中医一招调理

胃热是光吃不拉,脾虚是一吃就拉,肝郁是不停放屁,中医一招调理

垚垚分享健康
2026-04-29 11:24:29
后悔莫及,两三百元维修费,换两条人命!辽宁北镇悲剧本可避免

后悔莫及,两三百元维修费,换两条人命!辽宁北镇悲剧本可避免

一口娱乐
2026-05-04 12:30:11
张新武已任中华全国总工会副主席候选人

张新武已任中华全国总工会副主席候选人

澎湃新闻
2026-05-06 10:04:26
他曾担任3个直辖市市委书记,40岁官至副国级,43岁粉碎重大阴谋

他曾担任3个直辖市市委书记,40岁官至副国级,43岁粉碎重大阴谋

元哥说历史
2026-05-02 14:25:03
最强航母战斗群出动,解放军抵近菲律宾,美媒急了:不能让菲亲华

最强航母战斗群出动,解放军抵近菲律宾,美媒急了:不能让菲亲华

透视到底
2026-05-06 17:00:40
一屋子专业演员,愣是演不过一个跨界戏子,我想说烂不是没理由的

一屋子专业演员,愣是演不过一个跨界戏子,我想说烂不是没理由的

一娱三分地
2026-05-05 16:47:40
英伟达想革光模块的命

英伟达想革光模块的命

远川科技评论
2026-05-06 08:46:14
2026-05-06 18:51:00
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
2208文章数 24关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

合肥市委书记费高云任上被查 曾任江苏省委政法委书记

头条要闻

合肥市委书记费高云任上被查 曾任江苏省委政法委书记

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

最新GDP!全国30强城市,又变了

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

健康
时尚
房产
游戏
军事航空

干细胞治烧烫伤面临这些“瓶颈”

夏天的白裙,可以像赫本那样穿

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

《寂静岭:Townfall》实体预购开启!定价超级惊喜

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版