网易首页 > 网易号 > 正文 申请入驻

Token吞金兽发力,BAT做出了“违背祖训”的决定

0
分享至


(文/陈济深 编辑/张广凯)

3月18日,阿里云和百度智能云同日宣布AI算力和存储产品涨价,涨幅最高达34%。一周前,腾讯云刚刚将混元大模型Token价格上调超450%。

中国四大云厂商中的三家,不到十天内集体涨价。而涨价,曾经是云计算行业字典里不存在的词汇。

作为行业领军者,亚马逊AWS用二十年间近百次的降价奠定了整个产业"只降不涨"的历史基调。贝佐斯那句"降价是我们的核心策略",让微软Azure与谷歌云不得不长期祭出激进的降价打法被动迎战。

传导至国内,价格战演绎得更为惨烈。从早年震惊业界的"一分钱中标",一年18轮降价的疯狂,再到动辄腰斩乃至降价90%的"基操",直至近期大模型战场上从"以分计价"迅速跌至免费的新一轮厮杀,降价早已融入了云厂商的血液。

降价的底层逻辑是一个自我强化的飞轮:摩尔定律驱动成本下降→降价获取更大市场份额→规模效应摊薄成本→更有底气降价→规模更大。二十年来,这个飞轮越转越快,没有人敢踩刹车。

直到2026年初,亚马逊做出了一个"违背祖训"的决定,对AI算力容量块实施约15%的价格上调。五天后,谷歌宣布全球大幅上调数据传输及AI基础设施服务价格;随后欧洲头部云服务商Hetzner、OVHcloud相继跟进;国内网宿科技、优刻得、智谱也在2月先后宣布涨价,一个季度内API价格近翻倍。

阿里云在18日的公告中明确指出了转向的原因:"因全球AI需求爆发、供应链涨价",其平头哥真武810E等算力卡产品上涨5%~34%,文件存储产品CPFS(智算版)上涨30%。百度智能云不仅给出了几乎一致的涨幅(AI算力上调约5%~30%,并行文件存储上调约30%),甚至连新价格的生效日期都与阿里默契地选在了同一天——4月18日。

而先行一步的腾讯云,动作更为彻底。除了将混元HY2.0 Instruct的输入价格从每千Token 0.0008元暴涨至0.004505元外,其平台上的GLM 5、MiniMax 2.5、Kimi 2.5三个模型也宣告结束限时免费公测,转为正式商用计费。

观察者网获悉,字节火山引擎虽未发布正式涨价公告,但已全面收紧优惠政策、暂停首购特惠活动,通过取消补贴实现变相控价,成为行业集体转向的隐性信号。

从AWS到谷歌,从欧洲到国内,从二线厂商到头部巨头,整个云计算产业链在同一个季度里完成了看似不可思议的集体转向。

为什么是现在?

某家头部云厂商负责人对观察者网表示:"供应链是这轮涨价的核心原因。成本涨到这个程度,行业内谁都不可能再亏损换客户了。"

最直观的压力来自GPU。截至2月底,英伟达H200、H100等高端GPU租金环比上涨15%~30%。

这背后是核心存储组件对整个算力硬件的成本倒逼。全球95%的HBM产能被三星、SK海力士、美光三家垄断,行业普遍认为这一短缺可能持续至2028年,成为AI行业结构性约束。

这也直接导致2026年Q1传统DRAM合约价格环比暴涨约90%~95%,DDR5内存芯片现货价格半年最高涨近6倍,服务器级合约价单季翻倍。

与此同时,物理基础设施的成本同样在失控。

智算中心单机柜功耗从传统数据中心的5kW飙升至120kW以上,数据中心电力及散热成本占运营总成本的比例已高达40%~60%。

阿里和百度云的公告也印证了这一趋势。阿里云强调"全球AI需求爆发、供应链涨价",百度智能云则直接指出"核心硬件及相关基础设施成本出现显著上涨"。

但单纯的成本压力并不足以支撑全行业的集体提价,真正的驱动力来自需求端的爆发与结构性转变。

2025年上半年中国公有云上大模型调用量达536.7万亿Tokens,较2024年全年增长近400%。到2026年2月,中国日均Token消耗已到180万亿级别。3月9日至15日这一周,中国AI大模型周调用量更是首次超过美国。

更关键的是需求结构的变化:AI应用大规模落地后,推理需求占总算力需求首次突破70%,取代训练成为算力消耗的第一驱动力。训练需求是间歇性的、可预测的;推理需求是持续性的、实时的——算力消耗从"可调度的批量任务"变成了"随时随地的实时负载",对供给侧形成的压力完全不同。

龙虾改变了一切

龙虾(OpenClaw)的爆火则进一步加剧了云计算资源的紧张。

2026年春节期间,OpenClaw这款AI助手项目爆火。猎豹移动CEO傅盛透露,他的"龙虾"采用最高配置,每天高频调度,一个月花费近3万元。有用户反映重度使用下1亿Token大概只够撑一个月,成本约7000元。一位开发者在社区分享:使用OpenClaw做自动化任务,2个小时就消耗了100美元。

这种Agent级别的算力吞噬力,直接打乱了云厂商的产品节奏。 “龙虾”的爆火引发了外部API调用量的海啸,而云厂商自家的AI原生应用也同样面临着算力挤兑。春节前后,阿里云上线的Coding Plan订阅服务,首购优惠仅推出十天,就因调用量暴涨被迫改为每日限时限量供应。

腾讯云面临着同样的算力水位压力,但动因更为复杂:除了外部Agent应用密集上线带来的推理端消耗骤增,腾讯还在全面推进微信生态的AI化。其自研的WorkBuddy、QClaw等内部智能体对算力有着极高且确定性的需求——在外部亏本赚吆喝和内部保供给之间,涨价本质上就是通过价格杠杆调节资源配置,优先保障自有核心生态。

但这不只是一个爆款带来的短期波动。从全民养"龙虾",到影视行业拥抱视频大模型,再到各类AI原生工作平台的发布,Agent时代的Token消耗量是传统问答的数十倍乃至百倍。当刚性需求爆发到了不需要再用低价吸引用户的地步,云厂商终于有了彻底终结这场价格战的筹码。

在供应链的共性压力与需求侧的底气之上,头部厂商还在做一件事:把商业模式从"出租算力"向"出售Token"迁移。

过去,云厂商的生意是把GPU按卡时租出去,客户自己部署模型、自己做推理优化,云厂商赚的是硬件差价。现在,头部厂商开始把大模型封装成API,按Token数计费,模型研发、推理优化、调度分配全部由云厂商搞定。

这种迁移将深刻改变云厂商的利润结构与竞争逻辑。

从厂商侧的利润结构来看。卖算力时,硬件成本是透明的,GPU是标准品,你家H200和我家H200没有区别,利润空间几乎固定。但卖Token时,推理优化变成了一个"黑箱"——同一张GPU卡,如果你的推理引擎比别人快3倍,你就能用同样的硬件成本产出3倍的Token,多出来的部分就是利润。客户只看到每千Token多少钱,看不到你背后的成本结构。

而更关键的在于智能体时代,客户侧的迁移成本将大幅上升。表面上看,Token API的切换成本不高,换一个节点、微调一下prompt,就能从千问切到混元。但这个逻辑只在2024年"单轮对话、简单问答"的时代成立。在Agentic AI时代,当企业客户将模型深度接入自身业务工作流,涉及到复杂的系统调优、功能适配、JSON格式化输出的稳定性——不同模型处理复杂指令的表现差异极大,一旦业务线基于某个模型跑通了闭环,切换模型的隐性成本极其高昂,现在重度Agent客户的迁移成本不是变低了,而是变得深不可测。这也是云厂商敢于按下提价键的真正底牌。

Token时代的新逻辑

但头部厂商的算盘不止于此。

英伟达CEO黄仁勋在近期GTC大会上提出了"Token工厂经济学"——未来的数据中心不再是存储文件的仓库,而是生产Token的"工厂"。

当Token消耗量到了每天180万亿的量级,Token本身就变成了一种基础生产资料——类似电力之于工业时代,石油之于汽车时代。谁控制了Token的生产、分发和定价链路,谁就控制了AI时代的"电网"。而未来的定价权不仅在芯片手里,更在并网容量和液冷散热的统筹能力里——因为算力基础设施的物理约束,往往比芯片短缺更难突破。

3月16日,阿里成立全新的Alibaba Token Hub(ATH)事业群,由CEO吴泳铭直接负责,整合通义实验室、千问事业部、百炼MaaS业务线,覆盖从基础模型研发到AI应用的完整链路。吴泳铭在内部信中写道:"大量数字化工作将由数以百亿计的AI Agent来支撑,而这些AI Agent将由模型产生的Token支撑运行。"

阿里的算盘是打通底层的"Token水电话费",腾讯的算盘则打在另一处——生态闭环与高毛利SaaS。

腾讯高层曾多次明确表示AI是全业务的"乘数"。腾讯云率先敢将Token价格上调450%,其真正的底气在于,混元大模型已经深度接入微信、广告、游戏等数百个内部核心业务。当外部的算力"亏本买卖"做不下去时,收缩价格战战线、优先保障腾讯庞大内部生态的算力供给,并将外部商业模式从低毛利的IaaS(基础设施)向高毛利的MaaS和SaaS转移,成为了极其清晰的战略。目前腾讯云SaaS收入增速持续跑赢IaaS,正是这一逻辑的兑现。

百度则在全力压榨先发优势与软硬协同的利润空间。百度内部已将AI相关收入目标增速从100%大幅上调至200%,其底层支撑正是昆仑芯的大规模部署带来的成本对冲能力。

阿里重兵押注全栈基础设施,腾讯收网聚焦生态与SaaS,百度死磕软硬协同。但大方向完全一致——短期靠提价与推理效率扩大利润空间,长期靠全链路卡位争夺Token时代的基础设施位置。

值得注意的是,从阿里云官网的涨价列表看,平头哥真武810E芯片涨幅34%,是本轮涨幅最高的产品。真武810E已服务国家电网、中国科学院、小鹏汽车、新浪微博等400多家客户——自研芯片不仅是这轮涨价周期里的成本对冲工具,更是通过软硬协同优化提升Token生产效率、放大利润空间的底层底座。2025年谷歌的价值重估,很大程度上得益于自研TPU的广泛使用;今年,自研芯片在AI涨价周期中的战略价值正在凸显,同样的逻辑正在中国的头部云厂商身上展开。

BAT集体做出了违背祖宗的决定不是因为某一家厂商想涨价,而是整个行业被同一股力量推到了一个临界点——供应链成本涨到了没有人再亏得起的地步,AI需求又爆发到了不需要再用低价吸引用户的地步。

云计算的下半场,不再是比谁更便宜,而是比谁更智能。

火山引擎会不会跟进?

但这场转向中最大的悬念,或许不是已经涨价的三家,而是还没有涨价的那一家——字节跳动旗下的火山引擎。

2024年,正是火山引擎打出"低于行业均价99.3%"的豆包定价,点燃了那一轮惨烈的降价战。但进入2026年,火山引擎自身的战略也在发生剧变:销售考核从GPU算力转向大模型及AI工具,MaaS业务收入目标从2025年的20亿量级直指百亿规模——它自己也在从"卖算力"转向"卖Token"。

这就是火山引擎面对的两难:一边是百亿MaaS收入的激进冲量目标,逻辑上需要继续低价抢市场;另一边是三大同行集体涨价、硬件成本飙升,连亏损换客户的空间都被压缩了。更何况,2025年火山引擎Token消耗总量超过9000万亿,但绝大多数Token都是"免费送出"的,真正产生扣费的付费流量比例极低。

更深的差异在于底牌厚度。阿里有平头哥真武、百度有昆仑芯,自研算力芯片已形成规模商业化部署,在这轮硬件成本上涨周期中拥有真实的成本对冲能力。火山引擎虽有DPU和算力芯片方向的研发投入,但尚无可规模部署的自研AI算力芯片——面临的可能不只是"要不要继续做价格屠夫"的战略选择,而是在硬件成本重压、算力受制于人的处境下,被迫跟随整个行业的节奏。下半场的牌桌上,没有自己"印钞机"的玩家,连打价格战的资格都会被逐渐剥夺。

当整个行业的Token定价开始回归合理水平,火山引擎是继续用亏损冲规模,还是顺势跟涨、把庞大的调用量转化为真实收入?这个选择的答案,将比三家涨价本身更能说明问题——它将决定这轮涨价到底是一次短期的成本传导,还是整个行业告别"免费午餐"的真正起点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
镜报:若本菲卡解雇穆里尼奥,阿莫林或将成为本菲卡新帅

镜报:若本菲卡解雇穆里尼奥,阿莫林或将成为本菲卡新帅

懂球帝
2026-03-20 13:24:04
机关事业单位车补改革:2026年底前必须完成,你那边开始发了吗?

机关事业单位车补改革:2026年底前必须完成,你那边开始发了吗?

解说阿洎
2026-03-20 15:17:53
外媒:特朗普证实五角大楼申请紧急追加2000亿军费,声称这是“小小的代价”

外媒:特朗普证实五角大楼申请紧急追加2000亿军费,声称这是“小小的代价”

环球网资讯
2026-03-20 10:11:12
郑爽疑精神失常!34岁满头白发,与张恒家人街头争吵,孩子吓得大哭

郑爽疑精神失常!34岁满头白发,与张恒家人街头争吵,孩子吓得大哭

八卦王者
2026-03-19 11:48:39
19岁临危接指挥!带21人绝境突围,泽连斯基亲授乌克兰英雄

19岁临危接指挥!带21人绝境突围,泽连斯基亲授乌克兰英雄

老马拉车莫少装
2026-03-19 00:34:50
浙江人对赚钱的敏感度有多高?网友:真想跟你们浙江人做朋友啊

浙江人对赚钱的敏感度有多高?网友:真想跟你们浙江人做朋友啊

带你感受人间冷暖
2026-03-20 00:25:01
菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

小丸说故事
2026-03-17 14:23:29
警惕 | 13名学生在夜店同时感染,2死11病危!上海一医院发文!

警惕 | 13名学生在夜店同时感染,2死11病危!上海一医院发文!

天津广播
2026-03-19 10:11:03
央视放出《澎湖海战》最新预告,我敢说:拿下60亿票房不是没可能

央视放出《澎湖海战》最新预告,我敢说:拿下60亿票房不是没可能

糊咖娱乐
2026-03-20 16:50:35
60+7只是基本操作!欧文:我见过他训练砍60+18+18,3分钟砍24分

60+7只是基本操作!欧文:我见过他训练砍60+18+18,3分钟砍24分

你的篮球频道
2026-03-20 14:40:40
钱再多有什么用?2个女儿惨死 3个儿子反目,千亿家产换不来亲情

钱再多有什么用?2个女儿惨死 3个儿子反目,千亿家产换不来亲情

睿鉴历史
2026-03-19 20:35:03
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
翁晓玲质疑赖清德是“日本人后代”,让绿鹰犬们气急败坏

翁晓玲质疑赖清德是“日本人后代”,让绿鹰犬们气急败坏

郭茂辰海峡传真
2026-03-19 20:52:43
黄金连续走低,银行金条销售紧俏,黄金ETF华夏(518850)连续14天获资金净申购12亿

黄金连续走低,银行金条销售紧俏,黄金ETF华夏(518850)连续14天获资金净申购12亿

界面新闻
2026-03-20 10:59:52
梁洛施原来没撒谎,这次郭嘉文的特殊举动,没给李泽楷留一丝体面

梁洛施原来没撒谎,这次郭嘉文的特殊举动,没给李泽楷留一丝体面

手工制作阿歼
2026-03-20 18:00:43
女篮世界杯12人名单,7人基本稳了,2人待定,宫鲁鸣有望重召3人

女篮世界杯12人名单,7人基本稳了,2人待定,宫鲁鸣有望重召3人

萌兰聊个球
2026-03-20 10:18:53
34岁女子泰国遇害新进展:凶手有钱有案底,闺蜜聊天记录才是关键

34岁女子泰国遇害新进展:凶手有钱有案底,闺蜜聊天记录才是关键

笑谈历史阿晡
2026-03-20 13:00:16
六国发表联合声明:准备采取措施保障霍尔木兹海峡安全

六国发表联合声明:准备采取措施保障霍尔木兹海峡安全

新京报
2026-03-20 07:22:13
强援已到,加拿大拉5国结盟,让中国白捡机会,美国霸权摇摇欲坠

强援已到,加拿大拉5国结盟,让中国白捡机会,美国霸权摇摇欲坠

小嵩
2026-03-20 17:36:06
中国女篮6大颜值女神,王思雨第2,李月汝第5,第1斩男又斩女!

中国女篮6大颜值女神,王思雨第2,李月汝第5,第1斩男又斩女!

我就是一个说球的
2026-03-18 21:16:17
2026-03-20 18:36:49
观察者网 incentive-icons
观察者网
全球视野,中国关怀
136843文章数 1850204关注度
往期回顾 全部

科技要闻

新SU7只涨4千!雷军:真怕交车慢挨骂

头条要闻

母亲带1岁儿子看病如厕时把娃交人照看 儿子失踪36年

头条要闻

母亲带1岁儿子看病如厕时把娃交人照看 儿子失踪36年

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

蔡康永小S“康熙合体”,两人拥抱落泪

财经要闻

金融法草案向社会公开征求意见

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

房产
健康
亲子
教育
军事航空

房产要闻

三亚安居房,悄悄爆了!

转头就晕的耳石症,能开车上班吗?

亲子要闻

4800 元无痛被拒,产妇硬扛 4 小时,出房将丈夫打至骨裂:谁之过

教育要闻

落实“健康第一”,北京各区这样做③ ——

军事要闻

特朗普会晤高市早苗 把美国袭击伊朗比作偷袭珍珠港

无障碍浏览 进入关怀版