从越用越便宜到越用越贵，谁在为AI的“算力饥渴”买单？|内存|英伟达|服务器|台积电|知名企业

从越用越便宜到越用越贵，谁在为AI的“算力饥渴”买单？

2026-04-16 19:36:41　来源: 万联万象

黑龙江举报

分享至

大模型越用越便宜的神话，在一轮又一轮涨价公告中宣告终结。

短短四天之内，阿里云连发三条产品涨价公告：4月13日，DataWorks取消每日API调用次数限制，标准版免费额度调整为10万次/月，超出部分按量付费；4月15日晚，百炼部分模型单元服务价格上调2%至5%不等；同日，DDoS高防弹性95定价从100元/Mbps/月调整为150元/Mbps/月。而这已是阿里云一个月内的第二次涨价——3月18日，其AI算力、文件存储等产品最高涨幅已达34%。

海外的涨价更为隐蔽但同样深刻，Anthropic调整了旗下Claude Enterprise订阅模式：从每月每用户最高200美元的固定费用，转变为每月20美元基础费加上按照实际算力消耗计费。对于重度用户而言，新定价可能导致成本翻倍甚至三倍。

这一轮涨价远非一次简单的成本传导，有人用“硅基通胀”一词来形容新型工业血液的价值重估，从这个角度来看，涨价的趋势也很难就此打住。算力正在从“可无限获取的公共资源”转变为“需竞价获取的战略资产”，定价权正在从应用层向基础设施层迁移。谁掌握算力，谁就掌握AI时代的铸币权。

为什么越用越贵？

2026年以来，全球算力需求增长曲线变得越发陡峭，据全球最大的API聚合平台OpenRouter数据，2026年4月其周度累计Token消耗量较一年前提升约7-8倍。国家统计局今天（4月16日）发布会上的最新数据显示，截至今年3月，日均词元（Token）调用量突破140万亿，比上年末增长超40%。

中信证券在研报中指出，Token调用量井喷带来的是算力需求极大爆发，与此同时供给侧受到各类硬约束短期边际增量有限，目前国内外均出现了严重的算力荒。

Agent的兴起是算力需求结构最深刻的变革，以OpenClaw为代表的AI Agent，单次任务消耗Token是ChatBot的10到100倍，国内厂商纷纷推出“国产龙虾”，进一步加速了“养虾”的普及。

关键转变在于传统ChatBot产生的算力负载是间歇性的——用户提问、模型回答、会话结束；而Agent的常态是持续运行，多步骤推理、信息检索、代码执行、结果迭代。这种“常驻负载”从根本上改变了算力需求的形态——从请求/响应的离散模式，转变为全天候持续的算力消耗。

这种转变也解释了为什么Agent和多模态应用的爆发对推理端算力需求拉动极大。中信证券认为，AI芯片需求可分为训练和推理，目前推理端算力需求的增长动力显著更强。

这样看来，传统产业经济学里的“规模效应”失效了吗？

传统SaaS的定价逻辑建立在边际成本递减的假设之上——用户越多，单位成本越低。但AI推理的边际成本结构截然不同，根源在于算力的边际成本并非算法决定的，而是由物理供应链决定的。高带宽内存的产能、先进封装的吞吐量、电力供应的规模——这些物理约束在供给侧设置了刚性天花板，导致“需求越大、成本越高”的现象持续存在。

谁的产能，谁的壁垒？

算力“荒”的本质并非芯片不够，而是整个物理供应链的“木桶效应”正在集中显形。从晶圆到封装，从内存到光模块，每一个环节都在构成一道硬约束。

在AI芯片生产链条中，CoWoS先进封装是当前最关键的瓶颈。摩根士丹利研报显示，台积电2026年CoWoS总产能约93kwpm，较2025年底的70k增长33%。但更关键的是，新增产能几乎被辉达与博通两大国际客户包走，仅部分少量产能分配给联发科。据台媒报道，台积电已全面上调2026至2027年CoWoS产能目标，机构推估台积电先进封装产能将从今年的130万片增至2027年的200万片。即便如此，供给仍远远无法满足井喷式的需求。

高带宽内存（HBM）是AI算力另一项核心成本，根据SemiAnalysis的存储模型测算，2026年第一季度，LPDDR5合约价格同比涨幅预计将达约4倍，DDR5合约价格同比涨幅预计将达约5倍。

AI服务器的内存成本占比正在急剧攀升，一台配备8颗H100 GPU的高端AI服务器，仅HBM内存的采购成本就可能占整机成本的30%以上。当内存价格以数倍的幅度跳涨时，整机成本被成倍推高。

除了芯片和内存，AI基础设施中的“毛细血管”同样面临短缺，800G以上光收发模块2026年预计增至6300万组，但EML激光器产能被英伟达等巨头垄断，交期已排至2027年之后。Paddle Card等关键PCB组件的交期从正常的6周拉长到6个月。

SemiAnalysis报告指出，更高的服务器采购成本压缩了项目预期回报，迫使部分运营商放缓甚至搁置新部署计划。换言之，原本应进入市场的新增供给被迫滞后，进一步收紧了租赁市场的供给格局。

当供给侧每个环节——晶圆、封装、内存、光模块——都形成寡头壁垒时，算力就从“可复制的商品”变成“需排队争夺的稀缺品”。

定价权转移下的产业链博弈

涨价潮最深刻的变革不在于价格本身，而在于它重新定义了AI产业链中的权力关系。

过去十年，云计算行业遵循“只降不升”的铁律——规模效应驱动价格持续下行，厂商以低价获客、以规模取胜。然而2026年，阿里云、腾讯云、百度云等头部厂商集体打破这一惯例。

所谓的定价权转移主要体现在三个层面：

云厂商从“规模扩张优先”转向“价值定价优先”，将稀缺的GPU资源向高毛利的模型即服务（MaaS）与核心API集中。东吴证券研报分析，当前算力紧缺下，算力租赁厂商的议价权有望提升，其业务正从单纯的裸算力出租升级为模型服务或Token分成模式，即从“卖算力”转向“卖词元”。

大模型厂商的商业模式也在发生根本性转变，智谱年内三次提价，整体涨幅超60%。Anthropic从固定订阅转向按量计费，标志着大模型公司从“烧钱换增长”向“精细化运营”的转型。

硬件厂商是这轮涨价的最大受益者，SemiAnalysis数据显示，部分2至3年前签署的H100租赁合约，正以原价完成续约，有的合约甚至直接续约4年至2028年。一款2022年发布的芯片，在四五年后仍能以原价锁定长期租约——这在半导体行业历史上极为罕见。

谁在承受成本压力呢？

重度用户是这场涨价中最直接的“受害者”，Anthropic新定价模式下，重度用户的成本可能翻倍甚至三倍。

开发者与中小企业正在面临“算力鸿沟”的挤压，国内模型厂和云平台纷纷下调Coding Plan的额度和优惠，智谱等厂商的Coding Plan产品出现了限购现象。

二线云厂商与大模型公司同样承压，仅有头部云厂商能够获得较为充足的先进算力资源，中小型厂商在算力争夺中处于明显劣势。

在此背景下，算力正在制造新的社会分层。头部科技公司锁定长期协议和先进产能，享有稳定的算力供给和相对有利的价格；中小企业只能按小时租赁、按Token付费，在供需波动中承受更大的成本压力。

国产替代的加速窗口

算力短缺不仅带来涨价，也为国产算力产业链创造了历史性机遇。中信证券明确判断，AI应用爆发对应的国内算力荒将会加速国产卡放量，预计2026年国产算力芯片出货量至少实现翻倍以上增长，将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。

据IDC数据，2025年中国AI加速卡出货量约400万张，其中国产AI加速卡出货量165万张，市场份额约41%。华为出货量约81万张，市场份额约20%，已与英伟达形成实质性竞争格局。

在英伟达新的AI加速卡恢复对华销售之前，中国国产AI加速卡厂商有望持续替代英伟达的市场份额。

从推理端切入国产替代的逻辑同样清晰，中信证券分析指出，推理环节对算力产品综合性能要求相较训练端任务更低，国产算力芯片厂商通过与互联网厂商深度合作（针对特定需求定制化或优化），能够提供更适配需求的推理芯片，国产替代节奏相较于训练端进展更快。

国产算力产业正形成多强并驱的格局，除华为外，寒武纪计划在2026年交付50万件AI加速器，其中包含多达30万件最先进的思元590和690芯片，并计划将其芯片产量提高两倍以上。海光信息新一代芯片性能约为H100的45%，2026年计划量产近30万颗。

中银国际证券在研报中称，“十五五”规划建议明确提出“适度超前建设新型基础设施”，算力不再仅仅是技术圈的专业议题，而是上升为国家战略层面的核心竞争力。

结语

短期内，供需紧张的格局难以根本缓解。大摩预测2026年CoWoS产能仅增长33%，而Token消耗量同比已增长7-8倍——产能增速远落后于需求增速。关键问题集中在AI需求可能出现的问题以及除NVIDIA外的投资标的。当定价权加速向上游集中时，产业链的投资逻辑也在同步重构。

中长期来看，这轮涨价潮最深远的影响，可能在于AI产业成本结构的转变。

从“训练昂贵、推理便宜”到“训练平价、推理昂贵” 。随着模型架构创新和训练效率提升，训练成本在持续下降；但推理环节因Agent常驻负载和多模态交互的普及，正成为算力消耗和成本的核心来源。这意味着未来AI商业模式的盈利模型需要重新设计。

“算力效率”成为核心竞争力，当Token本身成为计价单位，如何降低每次交互的Token消耗、优化推理效率，将成为继模型能力之后企业竞争的第二条核心赛道。

参考资料

[1]Token量井喷导致算力荒，国产算力在推理端加速突围，中信证券

[2]电子行业国产算力全面突破：从芯片替代到系统架构创新，中银国际证券

[3]算力告急！SemiAnalysis深度解读：从GPU到内存再到光纤，AI供应链全线紧绷，华尔街见闻

[4]算力涨价潮席卷全球！阿里、Anthropic连续调价严重算力荒再现，财联社

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.