网易首页 > 网易号 > 正文 申请入驻

AI算力通胀:云厂商密集涨价 Token经济重塑产业规则

0
分享至

21世纪经济报道记者雷晨

国内云计算进入“算力通胀”时代。

4月15日,阿里云宣布自7月15日起,DDoS高防(中国内地)弹性95费用上调50%(从每兆瓦月100元涨至150元),这是阿里云一个月内第三次调价。

腾讯云、百度智能云也同步跟进。腾讯云4月9日宣布AI算力、容器、EMR全线上调5%;百度智能云AI算力与存储上调5%~30%。这一轮全球涨价潮由海外率先引爆——亚马逊AWS年初率先上调AI算力价格,谷歌云随后跟进,最高涨幅达100%。

涨价背后最根本的驱动力,是Token消耗的爆发式增长。国家数据局局长刘烈宏在3月24日的国新办新闻发布会上披露:“到今年3月,我国日均Token的调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2024年底的100万亿,三个月时间又增长了40%多。”

对于“Token”,国家数据局已正式将其定名为“词元”。它正从AI技术的计量单位,加速转变为智能时代的产业“货币”,其消耗规模的激增直接推高了算力需求,进而带动云计算服务价格上涨。

OpenClaw是这轮Token需求爆发的核心因素之一。据OpenRouter平台数据,2026年3月16日至22日当周,平台接近四分之一的Token消耗由OpenClaw贡献。另据国金证券计算机行业周报,截至2026年3月9日至15日的周度数据,OpenRouter平台内20%的Token消耗由OpenClaw贡献,OpenClaw单周Token消耗量已相当于2025年第四季度全平台周均Token消耗量的60%。

Token消耗量的快速攀升,首先暴露了一个深层矛盾:消耗量增长,并不等同于智能水平同步提升。智能体与传统Chatbot的业务逻辑存在本质差异。传统Chatbot遵循用户提问到模型回答的单轮交互模式,Token消耗与对话轮次呈线性关系。而智能体具备感知、决策、执行的闭环能力,需要自主拆解复杂任务、调用外部工具、多轮迭代验证,直至任务完成。这种业务逻辑的差异,直接导致了Token消耗量的数量级放大。

这个问题在商业层面已经产生了真实冲突。2026年4月初,Anthropic停止了订阅用户通过OpenClaw等第三方工具接入ClaudeAPI的许可。Anthropic官方解释称,部分重度用户每月仅支付200美元订阅费,却消耗了价值5000美元的算力资源,给公司带来巨大成本压力。一个OpenClaw代理运行一天,消耗的算力成本在1000美元到5000美元之间,受影响用户需切换至按用量付费的API模式。

商业模式与智能体算力消耗现实之间的核心矛盾已然爆发。智能体场景下的Token消耗不可预测,没有历史数据可以参考,任何固定月费都在对一个无法建模的变量做猜测。问题的根源不在于定价策略本身,而在于Token消耗的底层逻辑正在被智能体技术彻底改写。

今年3月下旬,火山引擎总裁谭待在接受21世纪经济报道等媒体采访时也指出,目前探索中的Token有一大半都是无谓的探索。他举例说,很多用户反馈智能体产品Token消耗快,核心问题不是单Token贵,而是它完成任务时的大量无效尝试——为了找到最终解法,超过一半的Token都消耗在探索中。如果单Token成本低但模型能力不足,需要消耗10倍甚至20倍的Token还无法完成任务,最终只会造成更大的浪费。

这标志着,智能体的普及正在以远超预期的速度消耗算力资源,而现有的计费体系和效率管理机制仍有完善空间。

近期,小米集团MiMo负责人罗福莉在社交平台发文指出,从宏观角度看,全球计算资源增长的脚步已跟不上Agent带来的Token需求增长。真正的出路不是提供更便宜的Token,而是让“更高效的Agent框架”ד更强大且更高效的模型”协同演进。

当前,推理正在取代训练成为算力消耗的主战场。德勤在2026年1月发布的《2026科技、传媒和电信行业预测》报告中指出,2026年AI推理将占算力三分之二,主要在近5000亿美元新数据中心及企业服务器进行。

而推理算力需求占比近七成之后,竞争规则正在改写。单Token成本、部署密度、能效比取代单纯峰值算力,成为客户选型的关键考量因素。

与此同时,算力供给的结构性缺口正在放大。根据半导体研究机构SemiAnalysis发布的数据,H100一年期租赁合同价格从2025年10月的低点1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。该指数基于对100多家云服务商、算力买家与卖家的月度直接调查构建。尽管价格上涨,相关GPU租赁容量已全部售罄,2026年初寻找新GPU算力资源的难度被比喻为“预订最后一班航班的机票”,不仅价格高昂且几乎无余量可选。

紧张的并不只有GPU。据报道,2026年3月下旬,英特尔与AMD相继通知客户上调处理器价格。过去几个月,CPU作为AI服务器调度与推理核心被云厂商大量采购,两大巨头2026年服务器CPU产能目前已基本售罄。

与此同时,头部互联网公司正在大幅加码资本支出。财报数据显示,腾讯资本支出在2024年迅速增加到768亿元,同比增长221%,2025年进一步增至792亿元;阿里巴巴资本支出从2023年244亿元增长至2025年的1039亿元,突破千亿。据媒体公开报道,字节跳动2026年资本支出计划约1600亿元,约一半投向AI芯片和数据中心。

算力紧张的另一个侧面,是中国AI芯片市场格局正在发生深刻变化。据IDC数据,2025年中国市场AI加速卡总出货量约为400万张。英伟达出货约220万张,市场份额55%;AMD出货约16万张,市场份额4%。中国本土厂商合计出货约165万张,市场份额约41%。

在中国厂商阵营中,华为处于领先地位。据IDC数据,2025年华为出货约81.2万颗AI芯片,约占整体市场20%,接近国内供应商总出货的一半。阿里巴巴旗下平头哥以约26.5万颗居次,市场份额约7%。百度昆仑芯与寒武纪各约11.6万颗,并列第三。

中信证券指出,Agent&多模态等应用爆发驱动Token调用量井喷,进而导致国内算力荒,国产大模型在推理端积极适配为国产算力厂商带来加速放量机遇,预计2026年国产算力芯片出货量至少实现翻倍以上增长,将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。

本土厂商的崛起,正在逐步改变中国AI芯片市场的供给格局,为缓解算力缺口提供了新的可能。

Token经济的最后一块拼图是商业模式。当Token消耗量从万亿级迈向百万亿级,如何定价、如何收费,直接关系到产业的商业闭环能否跑通。

回顾行业发展,2024年下半年至2025年初,中国大模型市场深陷价格战,字节豆包报价低至0.0008元/千Tokens,智谱自己也曾将GLM-4-Plus大幅降价。

但这一格局在2026年正在发生根本性变化。智谱成为国产头部模型厂商中首个在推出新模型的同时,执行实质性提价的公司。2月发布GLM-5时,CodingPlan套餐价格上调30%起,3月发布GLM-5-Turbo时再涨20%,相对GLM-4.7累计涨幅达83%。

涨价并未抑制需求。据智谱公开披露,2026年一季度API调用定价提升了83%,调用量反而增长400%。智谱MaaSAPI平台ARR约17亿元,在过去12个月提升60倍。截至2026年3月,平台注册用户已突破400万,覆盖全球218个国家和地区。智谱CEO张鹏表示,当模型足够强,API本身就是最好的商业模式,定价权是由技术实力以及长期趋势所带来的领先地位决定的。

当前,Token计费正成为行业标准。今年3月,刘烈宏在中国发展高层论坛年会上指出,一套以词元(Token)计费为基础的新型商业逻辑正在加速演进,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成。

但Token定价面临的真正难题,不在于收费标准,而在于智能体场景下的Token消耗目前高度不可预测。与电力或钢铁等传统生产要素不同,Token具备独特的可编程性。英伟达创始人兼CEO黄仁勋在2026年3月的一篇署名文章中,将Token定义为现代AI的基本单位,并指出它同时具有两种属性:作为语言,它是计算过程的原子;作为货币,它是价值流通的媒介。

谭待在受访时指出,判断行业阶段可以用终局倒推——看所有Tokens未来能产生的收入规模,再对比当前全球行业的实际收入,可以看出所处位置。目前OpenAI、Anthropic等企业的收入已知,全球行业收入大概是这些企业收入的三倍。

整体来看,AI算力与Token经济仍处于极早期阶段,定价机制、效率管理、供给能力等方面,仍有巨大的完善和提升空间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比锂矿、稀土,更疯狂的行情!

比锂矿、稀土,更疯狂的行情!

君临财富
2026-04-21 16:08:48
连车企的名字都不敢报道,这样的新闻有什么意义

连车企的名字都不敢报道,这样的新闻有什么意义

林中木白
2026-04-21 15:51:28
4月21日俄乌最新:俄罗斯创造的神话

4月21日俄乌最新:俄罗斯创造的神话

西楼饮月
2026-04-21 20:24:18
最高院:小贷公司通过互联网异地发放贷款,第三方大量受让不良债权并取得网络仲裁裁决,能否申请执行?

最高院:小贷公司通过互联网异地发放贷款,第三方大量受让不良债权并取得网络仲裁裁决,能否申请执行?

新浪财经
2026-04-21 18:26:38
华为疯狂发布24款新品,从128到29999全都有,你喜欢哪款?

华为疯狂发布24款新品,从128到29999全都有,你喜欢哪款?

科技堡垒
2026-04-21 09:17:48
主动抢西部第三挑对手,没想到却碰钉子!西决悬念或许越来越小

主动抢西部第三挑对手,没想到却碰钉子!西决悬念或许越来越小

老梁体育漫谈
2026-04-22 00:50:08
湖北松滋市教育局通报“某学校要求走读生将背包改为透明书袋”:已责令涉事学校立即纠正、认真整改

湖北松滋市教育局通报“某学校要求走读生将背包改为透明书袋”:已责令涉事学校立即纠正、认真整改

环球网资讯
2026-04-21 12:17:57
Shams:东契奇预计无缘出战首轮 里夫斯进度更快有望首轮末复出

Shams:东契奇预计无缘出战首轮 里夫斯进度更快有望首轮末复出

罗说NBA
2026-04-22 05:03:31
解决掉提问的人,问题就解决了?北师大“神操作”火了

解决掉提问的人,问题就解决了?北师大“神操作”火了

虔青
2026-04-20 14:07:53
巴基斯坦消息人士:美方谈判相关人员陆续抵达巴基斯坦

巴基斯坦消息人士:美方谈判相关人员陆续抵达巴基斯坦

财联社
2026-04-21 23:39:45
中方不再伺候了!对荷光刻机优待全部取消,450亿芯片不做了!

中方不再伺候了!对荷光刻机优待全部取消,450亿芯片不做了!

错过美好
2026-04-21 19:01:41
不是高价,而是白菜价!3月,中国低价向日本出口7.5万吨天然气

不是高价,而是白菜价!3月,中国低价向日本出口7.5万吨天然气

南生今世说
2026-04-21 16:34:03
世锦赛战报:中国4胜3负2落后!吴宜泽10-2,下轮对手也基本确定

世锦赛战报:中国4胜3负2落后!吴宜泽10-2,下轮对手也基本确定

小火箭爱体育
2026-04-21 22:52:59
浙江,一女子买了8年彩票终于中得500万巨奖,彩票店老板当面将彩票扔进垃圾桶,事后竟悄悄兑奖,女子将彩票店告上法庭,法院判了!

浙江,一女子买了8年彩票终于中得500万巨奖,彩票店老板当面将彩票扔进垃圾桶,事后竟悄悄兑奖,女子将彩票店告上法庭,法院判了!

大爱三湘
2026-04-21 21:00:58
中国战舰坦荡过航这条水道,释放什么信号?

中国战舰坦荡过航这条水道,释放什么信号?

补壹刀
2026-04-21 14:06:24
严打来了,5月起8种行为直接入刑,退休老人需格外注意!

严打来了,5月起8种行为直接入刑,退休老人需格外注意!

小谈食刻美食
2026-04-21 07:52:09
随着海港1-2铜梁龙,泰山+蓉城皆2-1赢球,中超最新积分:3队争冠

随着海港1-2铜梁龙,泰山+蓉城皆2-1赢球,中超最新积分:3队争冠

球场没跑道
2026-04-21 22:04:02
三国取消飞航许可,赖清德无法窜访斯威士兰

三国取消飞航许可,赖清德无法窜访斯威士兰

参考消息
2026-04-21 21:20:14
重庆一大叔火车上崩溃大哭,同车男子买盒饭转账500元:他赶回老家见大儿子最后一面

重庆一大叔火车上崩溃大哭,同车男子买盒饭转账500元:他赶回老家见大儿子最后一面

潇湘晨报
2026-04-21 13:00:15
特朗普不演了,警告中国有大麻烦,话音刚落,美国人推动罢免总统

特朗普不演了,警告中国有大麻烦,话音刚落,美国人推动罢免总统

混沌录
2026-04-21 21:10:15
2026-04-22 05:31:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
244172文章数 744124关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

本地
亲子
房产
手机
时尚

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

亲子要闻

为什么幼儿园里,很多小朋友会做不好的事?

房产要闻

年薪40-50万!海南地产圈还在猛招人

手机要闻

iOS 26.5 Beta 3新版体验:改进解锁流畅度,信号也变好了?

顶流复工,已判若两人

无障碍浏览 进入关怀版