大模型越用越便宜的神话,在一轮又一轮涨价公告中宣告终结。
短短四天之内,阿里云连发三条产品涨价公告:4月13日,DataWorks取消每日API调用次数限制,标准版免费额度调整为10万次/月,超出部分按量付费;4月15日晚,百炼部分模型单元服务价格上调2%至5%不等;同日,DDoS高防弹性95定价从100元/Mbps/月调整为150元/Mbps/月。而这已是阿里云一个月内的第二次涨价——3月18日,其AI算力、文件存储等产品最高涨幅已达34%。
![]()
海外的涨价更为隐蔽但同样深刻,Anthropic调整了旗下Claude Enterprise订阅模式:从每月每用户最高200美元的固定费用,转变为每月20美元基础费加上按照实际算力消耗计费。对于重度用户而言,新定价可能导致成本翻倍甚至三倍。
这一轮涨价远非一次简单的成本传导,有人用“硅基通胀”一词来形容新型工业血液的价值重估,从这个角度来看,涨价的趋势也很难就此打住。算力正在从“可无限获取的公共资源”转变为“需竞价获取的战略资产”,定价权正在从应用层向基础设施层迁移。谁掌握算力,谁就掌握AI时代的铸币权。
![]()
为什么越用越贵?
2026年以来,全球算力需求增长曲线变得越发陡峭,据全球最大的API聚合平台OpenRouter数据,2026年4月其周度累计Token消耗量较一年前提升约7-8倍。国家统计局今天(4月16日)发布会上的最新数据显示,截至今年3月,日均词元(Token)调用量突破140万亿,比上年末增长超40%。
中信证券在研报中指出,Token调用量井喷带来的是算力需求极大爆发,与此同时供给侧受到各类硬约束短期边际增量有限,目前国内外均出现了严重的算力荒。
Agent的兴起是算力需求结构最深刻的变革,以OpenClaw为代表的AI Agent,单次任务消耗Token是ChatBot的10到100倍,国内厂商纷纷推出“国产龙虾”,进一步加速了“养虾”的普及。
关键转变在于传统ChatBot产生的算力负载是间歇性的——用户提问、模型回答、会话结束;而Agent的常态是持续运行,多步骤推理、信息检索、代码执行、结果迭代。这种“常驻负载”从根本上改变了算力需求的形态——从请求/响应的离散模式,转变为全天候持续的算力消耗。
这种转变也解释了为什么Agent和多模态应用的爆发对推理端算力需求拉动极大。中信证券认为,AI芯片需求可分为训练和推理,目前推理端算力需求的增长动力显著更强。
这样看来,传统产业经济学里的“规模效应”失效了吗?
传统SaaS的定价逻辑建立在边际成本递减的假设之上——用户越多,单位成本越低。但AI推理的边际成本结构截然不同,根源在于算力的边际成本并非算法决定的,而是由物理供应链决定的。高带宽内存的产能、先进封装的吞吐量、电力供应的规模——这些物理约束在供给侧设置了刚性天花板,导致“需求越大、成本越高”的现象持续存在。
谁的产能,谁的壁垒?
算力“荒”的本质并非芯片不够,而是整个物理供应链的“木桶效应”正在集中显形。从晶圆到封装,从内存到光模块,每一个环节都在构成一道硬约束。
在AI芯片生产链条中,CoWoS先进封装是当前最关键的瓶颈。摩根士丹利研报显示,台积电2026年CoWoS总产能约93kwpm,较2025年底的70k增长33%。但更关键的是,新增产能几乎被辉达与博通两大国际客户包走,仅部分少量产能分配给联发科。据台媒报道,台积电已全面上调2026至2027年CoWoS产能目标,机构推估台积电先进封装产能将从今年的130万片增至2027年的200万片。即便如此,供给仍远远无法满足井喷式的需求。
高带宽内存(HBM)是AI算力另一项核心成本,根据SemiAnalysis的存储模型测算,2026年第一季度,LPDDR5合约价格同比涨幅预计将达约4倍,DDR5合约价格同比涨幅预计将达约5倍。
AI服务器的内存成本占比正在急剧攀升,一台配备8颗H100 GPU的高端AI服务器,仅HBM内存的采购成本就可能占整机成本的30%以上。当内存价格以数倍的幅度跳涨时,整机成本被成倍推高。
除了芯片和内存,AI基础设施中的“毛细血管”同样面临短缺,800G以上光收发模块2026年预计增至6300万组,但EML激光器产能被英伟达等巨头垄断,交期已排至2027年之后。Paddle Card等关键PCB组件的交期从正常的6周拉长到6个月。
SemiAnalysis报告指出,更高的服务器采购成本压缩了项目预期回报,迫使部分运营商放缓甚至搁置新部署计划。换言之,原本应进入市场的新增供给被迫滞后,进一步收紧了租赁市场的供给格局。
当供给侧每个环节——晶圆、封装、内存、光模块——都形成寡头壁垒时,算力就从“可复制的商品”变成“需排队争夺的稀缺品”。
定价权转移下的产业链博弈
涨价潮最深刻的变革不在于价格本身,而在于它重新定义了AI产业链中的权力关系。
过去十年,云计算行业遵循“只降不升”的铁律——规模效应驱动价格持续下行,厂商以低价获客、以规模取胜。然而2026年,阿里云、腾讯云、百度云等头部厂商集体打破这一惯例。
所谓的定价权转移主要体现在三个层面:
云厂商从“规模扩张优先”转向“价值定价优先”,将稀缺的GPU资源向高毛利的模型即服务(MaaS)与核心API集中。东吴证券研报分析,当前算力紧缺下,算力租赁厂商的议价权有望提升,其业务正从单纯的裸算力出租升级为模型服务或Token分成模式,即从“卖算力”转向“卖词元”。
大模型厂商的商业模式也在发生根本性转变,智谱年内三次提价,整体涨幅超60%。Anthropic从固定订阅转向按量计费,标志着大模型公司从“烧钱换增长”向“精细化运营”的转型。
硬件厂商是这轮涨价的最大受益者,SemiAnalysis数据显示,部分2至3年前签署的H100租赁合约,正以原价完成续约,有的合约甚至直接续约4年至2028年。一款2022年发布的芯片,在四五年后仍能以原价锁定长期租约——这在半导体行业历史上极为罕见。
谁在承受成本压力呢?
重度用户是这场涨价中最直接的“受害者”,Anthropic新定价模式下,重度用户的成本可能翻倍甚至三倍。
开发者与中小企业正在面临“算力鸿沟”的挤压,国内模型厂和云平台纷纷下调Coding Plan的额度和优惠,智谱等厂商的Coding Plan产品出现了限购现象。
二线云厂商与大模型公司同样承压,仅有头部云厂商能够获得较为充足的先进算力资源,中小型厂商在算力争夺中处于明显劣势。
在此背景下,算力正在制造新的社会分层。头部科技公司锁定长期协议和先进产能,享有稳定的算力供给和相对有利的价格;中小企业只能按小时租赁、按Token付费,在供需波动中承受更大的成本压力。
国产替代的加速窗口
算力短缺不仅带来涨价,也为国产算力产业链创造了历史性机遇。中信证券明确判断,AI应用爆发对应的国内算力荒将会加速国产卡放量,预计2026年国产算力芯片出货量至少实现翻倍以上增长,将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。
据IDC数据,2025年中国AI加速卡出货量约400万张,其中国产AI加速卡出货量165万张,市场份额约41%。华为出货量约81万张,市场份额约20%,已与英伟达形成实质性竞争格局。
![]()
在英伟达新的AI加速卡恢复对华销售之前,中国国产AI加速卡厂商有望持续替代英伟达的市场份额。
从推理端切入国产替代的逻辑同样清晰,中信证券分析指出,推理环节对算力产品综合性能要求相较训练端任务更低,国产算力芯片厂商通过与互联网厂商深度合作(针对特定需求定制化或优化),能够提供更适配需求的推理芯片,国产替代节奏相较于训练端进展更快。
国产算力产业正形成多强并驱的格局,除华为外,寒武纪计划在2026年交付50万件AI加速器,其中包含多达30万件最先进的思元590和690芯片,并计划将其芯片产量提高两倍以上。海光信息新一代芯片性能约为H100的45%,2026年计划量产近30万颗。
中银国际证券在研报中称,“十五五”规划建议明确提出“适度超前建设新型基础设施”,算力不再仅仅是技术圈的专业议题,而是上升为国家战略层面的核心竞争力。
结语
短期内,供需紧张的格局难以根本缓解。大摩预测2026年CoWoS产能仅增长33%,而Token消耗量同比已增长7-8倍——产能增速远落后于需求增速。关键问题集中在AI需求可能出现的问题以及除NVIDIA外的投资标的。当定价权加速向上游集中时,产业链的投资逻辑也在同步重构。
中长期来看,这轮涨价潮最深远的影响,可能在于AI产业成本结构的转变。
从“训练昂贵、推理便宜”到“训练平价、推理昂贵” 。随着模型架构创新和训练效率提升,训练成本在持续下降;但推理环节因Agent常驻负载和多模态交互的普及,正成为算力消耗和成本的核心来源。这意味着未来AI商业模式的盈利模型需要重新设计。
“算力效率”成为核心竞争力,当Token本身成为计价单位,如何降低每次交互的Token消耗、优化推理效率,将成为继模型能力之后企业竞争的第二条核心赛道。
参考资料
[1]Token量井喷导致算力荒,国产算力在推理端加速突围,中信证券
[2]电子行业国产算力全面突破:从芯片替代到系统架构创新,中银国际证券
[3]算力告急!SemiAnalysis深度解读:从GPU到内存再到光纤,AI供应链全线紧绷,华尔街见闻
[4]算力涨价潮席卷全球!阿里、Anthropic连续调价 严重算力荒再现,财联社
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.