网易首页 > 网易号 > 正文 申请入驻

大模型涨价潮来袭!算力变“战略资产”,谁在默默承受成本压力?

0
分享至

大模型越用越便宜的神话,在一轮又一轮涨价公告中宣告终结。



海外的涨价更为隐蔽但同样深刻,Anthropic调整了旗下Claude Enterprise订阅模式:从每月每用户最高200美元的固定费用,转变为每月20美元基础费加上按照实际算力消耗计费。对于重度用户而言,新定价可能导致成本翻倍甚至三倍。

这一轮涨价远非一次简单的成本传导,有人用“硅基通胀”一词来形容新型工业血液的价值重估,从这个角度来看,涨价的趋势也很难就此打住。算力正在从“可无限获取的公共资源”转变为“需竞价获取的战略资产”,定价权正在从应用层向基础设施层迁移。谁掌握算力,谁就掌握AI时代的铸币权。

2026年以来,全球算力需求增长曲线变得越发陡峭,据全球最大的API聚合平台OpenRouter数据,2026年4月其周度累计Token消耗量较一年前提升约7-8倍。国家统计局今天(4月16日)发布会上的最新数据显示,截至今年3月,日均词元(Token)调用量突破140万亿,比上年末增长超40%。

中信证券在研报中指出,Token调用量井喷带来的是算力需求极大爆发,与此同时供给侧受到各类硬约束短期边际增量有限,目前国内外均出现了严重的算力荒。

Agent的兴起是算力需求结构最深刻的变革,以OpenClaw为代表的AI Agent,单次任务消耗Token是ChatBot的10到100倍,国内厂商纷纷推出“国产龙虾”,进一步加速了“养虾”的普及。

关键转变在于传统ChatBot产生的算力负载是间歇性的——用户提问、模型回答、会话结束;而Agent的常态是持续运行,多步骤推理、信息检索、代码执行、结果迭代。这种“常驻负载”从根本上改变了算力需求的形态——从请求/响应的离散模式,转变为全天候持续的算力消耗。

这种转变也解释了为什么Agent和多模态应用的爆发对推理端算力需求拉动极大。中信证券认为,AI芯片需求可分为训练和推理,目前推理端算力需求的增长动力显著更强。

这样看来,传统产业经济学里的“规模效应”失效了吗?

传统SaaS的定价逻辑建立在边际成本递减的假设之上——用户越多,单位成本越低。但AI推理的边际成本结构截然不同,根源在于算力的边际成本并非算法决定的,而是由物理供应链决定的。高带宽内存的产能、先进封装的吞吐量、电力供应的规模——这些物理约束在供给侧设置了刚性天花板,导致“需求越大、成本越高”的现象持续存在。

算力“荒”的本质并非芯片不够,而是整个物理供应链的“木桶效应”正在集中显形。从晶圆到封装,从内存到光模块,每一个环节都在构成一道硬约束。

在AI芯片生产链条中,CoWoS先进封装是当前最关键的瓶颈。摩根士丹利研报显示,台积电2026年CoWoS总产能约93kwpm,较2025年底的70k增长33%。但更关键的是,新增产能几乎被辉达与博通两大国际客户包走,仅部分少量产能分配给联发科。据台媒报道,台积电已全面上调2026至2027年CoWoS产能目标,机构推估台积电先进封装产能将从今年的130万片增至2027年的200万片。即便如此,供给仍远远无法满足井喷式的需求。

高带宽内存(HBM)是AI算力另一项核心成本,根据SemiAnalysis的存储模型测算,2026年第一季度,LPDDR5合约价格同比涨幅预计将达约4倍,DDR5合约价格同比涨幅预计将达约5倍。

AI服务器的内存成本占比正在急剧攀升,一台配备8颗H100 GPU的高端AI服务器,仅HBM内存的采购成本就可能占整机成本的30%以上。当内存价格以数倍的幅度跳涨时,整机成本被成倍推高。

除了芯片和内存,AI基础设施中的“毛细血管”同样面临短缺,800G以上光收发模块2026年预计增至6300万组,但EML激光器产能被英伟达等巨头垄断,交期已排至2027年之后。Paddle Card等关键PCB组件的交期从正常的6周拉长到6个月。

SemiAnalysis报告指出,更高的服务器采购成本压缩了项目预期回报,迫使部分运营商放缓甚至搁置新部署计划。换言之,原本应进入市场的新增供给被迫滞后,进一步收紧了租赁市场的供给格局。

当供给侧每个环节——晶圆、封装、内存、光模块——都形成寡头壁垒时,算力就从“可复制的商品”变成“需排队争夺的稀缺品”。

涨价潮最深刻的变革不在于价格本身,而在于它重新定义了AI产业链中的权力关系。

过去十年,云计算行业遵循“只降不升”的铁律——规模效应驱动价格持续下行,厂商以低价获客、以规模取胜。然而2026年,阿里云、腾讯云、百度云等头部厂商集体打破这一惯例。

所谓的定价权转移主要体现在三个层面:

云厂商从“规模扩张优先”转向“价值定价优先”,将稀缺的GPU资源向高毛利的模型即服务(MaaS)与核心API集中。东吴证券研报分析,当前算力紧缺下,算力租赁厂商的议价权有望提升,其业务正从单纯的裸算力出租升级为模型服务或Token分成模式,即从“卖算力”转向“卖词元”。

大模型厂商的商业模式也在发生根本性转变,智谱年内三次提价,整体涨幅超60%。Anthropic从固定订阅转向按量计费,标志着大模型公司从“烧钱换增长”向“精细化运营”的转型。

硬件厂商是这轮涨价的最大受益者,SemiAnalysis数据显示,部分2至3年前签署的H100租赁合约,正以原价完成续约,有的合约甚至直接续约4年至2028年。一款2022年发布的芯片,在四五年后仍能以原价锁定长期租约——这在半导体行业历史上极为罕见。

谁在承受成本压力呢?

重度用户是这场涨价中最直接的“受害者”,Anthropic新定价模式下,重度用户的成本可能翻倍甚至三倍。

开发者与中小企业正在面临“算力鸿沟”的挤压,国内模型厂和云平台纷纷下调Coding Plan的额度和优惠,智谱等厂商的Coding Plan产品出现了限购现象。

二线云厂商与大模型公司同样承压,仅有头部云厂商能够获得较为充足的先进算力资源,中小型厂商在算力争夺中处于明显劣势。

在此背景下,算力正在制造新的社会分层。头部科技公司锁定长期协议和先进产能,享有稳定的算力供给和相对有利的价格;中小企业只能按小时租赁、按Token付费,在供需波动中承受更大的成本压力。

算力短缺不仅带来涨价,也为国产算力产业链创造了历史性机遇。中信证券明确判断,AI应用爆发对应的国内算力荒将会加速国产卡放量,预计2026年国产算力芯片出货量至少实现翻倍以上增长,将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。

据IDC数据,2025年中国AI加速卡出货量约400万张,其中国产AI加速卡出货量165万张,市场份额约41%。华为出货量约81万张,市场份额约20%,已与英伟达形成实质性竞争格局。



在英伟达新的AI加速卡恢复对华销售之前,中国国产AI加速卡厂商有望持续替代英伟达的市场份额。

从推理端切入国产替代的逻辑同样清晰,中信证券分析指出,推理环节对算力产品综合性能要求相较训练端任务更低,国产算力芯片厂商通过与互联网厂商深度合作(针对特定需求定制化或优化),能够提供更适配需求的推理芯片,国产替代节奏相较于训练端进展更快。

国产算力产业正形成多强并驱的格局,除华为外,寒武纪计划在2026年交付50万件AI加速器,其中包含多达30万件最先进的思元590和690芯片,并计划将其芯片产量提高两倍以上。海光信息新一代芯片性能约为H100的45%,2026年计划量产近30万颗。

中银国际证券在研报中称,“十五五”规划建议明确提出“适度超前建设新型基础设施”,算力不再仅仅是技术圈的专业议题,而是上升为国家战略层面的核心竞争力。

短期内,供需紧张的格局难以根本缓解。大摩预测2026年CoWoS产能仅增长33%,而Token消耗量同比已增长7-8倍——产能增速远落后于需求增速。关键问题集中在AI需求可能出现的问题以及除NVIDIA外的投资标的。当定价权加速向上游集中时,产业链的投资逻辑也在同步重构。

中长期来看,这轮涨价潮最深远的影响,可能在于AI产业成本结构的转变。

从“训练昂贵、推理便宜”到“训练平价、推理昂贵” 。随着模型架构创新和训练效率提升,训练成本在持续下降;但推理环节因Agent常驻负载和多模态交互的普及,正成为算力消耗和成本的核心来源。这意味着未来AI商业模式的盈利模型需要重新设计。

“算力效率”成为核心竞争力,当Token本身成为计价单位,如何降低每次交互的Token消耗、优化推理效率,将成为继模型能力之后企业竞争的第二条核心赛道。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6岁男孩为躲母亲殴打,离家出走22年,长大后才得知母亲悲惨人生

6岁男孩为躲母亲殴打,离家出走22年,长大后才得知母亲悲惨人生

哄动一时啊
2026-04-19 14:38:19
任前公示!福建一县委书记拟任新职

任前公示!福建一县委书记拟任新职

人民资讯
2026-04-21 13:15:03
我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

草莓解说体育
2026-04-12 17:05:01
今天才知道:冰箱冷冻室不能放这4样,放了冰箱容易炸,真可怕

今天才知道:冰箱冷冻室不能放这4样,放了冰箱容易炸,真可怕

Home范
2026-04-20 11:07:38
苹果手表睡眠评分:一个设置让我从新鲜到上瘾

苹果手表睡眠评分:一个设置让我从新鲜到上瘾

硬核玩家2哈
2026-04-20 22:31:25
中方不再伺候了!对荷光刻机优待全部取消,450亿芯片不做了!

中方不再伺候了!对荷光刻机优待全部取消,450亿芯片不做了!

泠泠说史
2026-04-21 21:13:01
688309,一季度业绩大增超400%!股价年内涨幅逾200%

688309,一季度业绩大增超400%!股价年内涨幅逾200%

证券时报e公司
2026-04-21 21:08:31
民众党提名蔡壁如选彰化县长? 周榆修:还是要看地方意向

民众党提名蔡壁如选彰化县长? 周榆修:还是要看地方意向

郭茂辰海峡传真
2026-04-21 22:19:42
奇怪!飞机改成硬座、高铁也在降速,交通工具为何集体降级?

奇怪!飞机改成硬座、高铁也在降速,交通工具为何集体降级?

丁丁鲤史纪
2026-04-16 14:07:38
俄罗斯已耗尽可翻新的T-72B坦克,现开始拆解上世纪70年代的T-72A

俄罗斯已耗尽可翻新的T-72B坦克,现开始拆解上世纪70年代的T-72A

零度Military
2026-04-20 07:25:49
近10年崩得最狠的专业:从年薪几十万到月薪两千五!

近10年崩得最狠的专业:从年薪几十万到月薪两千五!

灯锦年
2026-04-21 13:28:31
002763,股息率高达9.86%!高股息+高增长+低PE股出炉

002763,股息率高达9.86%!高股息+高增长+低PE股出炉

数据宝
2026-04-21 11:51:39
哈兰德:我背上很多抓痕,女朋友不太高兴;父亲教我不能假摔

哈兰德:我背上很多抓痕,女朋友不太高兴;父亲教我不能假摔

懂球帝
2026-04-20 23:25:16
突传大利好,要谈成了?

突传大利好,要谈成了?

隔壁老投
2026-04-21 14:39:35
有效限制了约老师!森林狼内线大闸对于比赛的影响力相当惊人?

有效限制了约老师!森林狼内线大闸对于比赛的影响力相当惊人?

稻谷与小麦
2026-04-21 22:52:08
袁世凯墓地起初取名“袁陵”,遭众人反对,徐世昌改一字完美解决

袁世凯墓地起初取名“袁陵”,遭众人反对,徐世昌改一字完美解决

浩渺青史
2026-04-21 17:06:24
李春江是被做掉的?杨毅曝三年前假球内幕:李楠讲义气史琳杰活该

李春江是被做掉的?杨毅曝三年前假球内幕:李楠讲义气史琳杰活该

大嘴爵爷侃球
2026-04-20 20:56:47
1-1,2-1!曼城拿下4分!夺冠条件曝光,阿森纳7大优势,期待加冕

1-1,2-1!曼城拿下4分!夺冠条件曝光,阿森纳7大优势,期待加冕

小徐讲八卦
2026-04-21 06:00:42
三星堆瞒了我们这么久?其实考古队早就全挖明白了!

三星堆瞒了我们这么久?其实考古队早就全挖明白了!

爱竞彩的小周
2026-04-21 07:48:23
江苏省北部曾有多个湖泊,有的面积堪比太湖,为何今天均已消失

江苏省北部曾有多个湖泊,有的面积堪比太湖,为何今天均已消失

浔阳咸鱼
2026-04-21 15:10:09
2026-04-21 23:24:49
十夏九漓
十夏九漓
人生似海,起落浮沉
521文章数 40关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

商家网售"宣威火腿"被诉侵权:我就是宣威人为何不能卖

头条要闻

商家网售"宣威火腿"被诉侵权:我就是宣威人为何不能卖

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

本地
家居
手机
健康
军事航空

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

家居要闻

诗意光影 窥见自然之境

手机要闻

一加Ace 6至尊版新配色公布,游戏体验持续升级

干细胞抗衰4大误区,90%的人都中招

军事要闻

特朗普公开对伊开战真正原因

无障碍浏览 进入关怀版