![]()
![]()
撰文 | 程书书、李信马
编辑 | 李信马
题图 | 豆包AI
2026年5月4日 , 当大多数 人还在享受假期的最后一 时 天,一道来自苹果 AppStore 的更新通知,在科技圈炸开了锅。
拥有3.45亿月活的国民级AI应用豆包正式推出三档付费服务:标准版(68元/月)、加强版(200元/月)、专业版(500元/月)。付费墙主要针对PPT生成、数据分析、影视制作等复杂生产力场景,免费版虽保留,但在高价值任务上被“降级”为体验版。
消息一出,“豆包付费”瞬间冲上微博热搜榜首,话题阅读量迅速破亿。评论区更是直接成了大型声讨现场。很多人不解:豆包为什么要收费?
表面看是豆包“突然想赚钱”,但回到行业语境就会发现,这并不是一次孤立的商业动作,而是Token价格持续攀升后的一次必然传导。尤其是AI智能体广泛落地之后,Token消耗规模呈爆发式增长,底层算力需求被直接推高,成本压力沿着“硬件→云→应用”的链条一路向下游流动,最终抵达用户面前。
数据也验证了这一点。截至2026年3月,豆包大模型日均Token使用量已突破120万亿,相比2024年5月发布时增长了整整1000倍。浙商证券测算显示,2025年字节跳动资本开支约1600亿元,其中900亿元用于AI算力采购——相当于每天4.38亿元的投入强度。
而相较于传统互联网的逻辑——用户越多,广告越值钱,边际成本趋近于零——AI产品的经济模型是“颠倒”的——每多一个活跃用户,不是多了一个广告位,而是多了一行实打实的算力账单。
所以,豆包不是“突然想赚钱了”,而是到了“不得不赚钱”的时候。
01.
曾经的“白菜价”
事实上,早在两个月前,算力涨价的信号就已经响彻整个行业。
3月11日,腾讯云率先宣布上调两款自研模型TencentHY2.0Instruct和TencentHY2.0Think的价格。以HY2.0Instruct为例,输入价格从0.0008元/千Token上涨到0.004505元/千Token,涨幅达463%。同时,腾讯云结束对GLM-5、MiniMax2.5、Kimi2.5三款模型的免费公测,转为正式商用服务。
紧随其后,智谱AI在3月16日上调GLM-5-Turbo的API价格,幅度为20%。这也是智谱短期内的二次涨价。
3月18日,行业迎来涨价高潮——阿里云与百度智能云在同步宣布涨价,阿里云明确,平头哥真武810E等AI算力卡产品价格上涨5%-34%,文件存储产品CPFS(智算版)上涨30%;百度智能云则上调AI算力相关产品服务价格5%-30%,并行文件存储等产品价格同样上调30%,两家均将涨价生效时间定在2026年4月18日,为老客户留出一个月的缓冲期。
短短数天,国内三大云厂商集体提价,传递的信号再明显不过:AI算力的价格重估,已经从试探变成了行业动作。如今豆包推出付费订阅,不过是把这种成本压力从“厂商端”延伸到了“用户端”。
但把时间轴拨回一年多前,情况完全是另一幅光景——彼时国内大模型市场正深陷惨烈的价格战,Token价格一路跌进“毫厘时代”。
2024年5月,字节在火山引擎发布会上宣布:豆包通用模型pro-32k,输入价格0.0008元/千Tokens,而当时市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。
字节逼得所有国产大模型价格集体跳水。阿里云迅速跟进,通义千问主力模型价格直降97%,最低至0.0005元/千Token,1元可兑换200万Token,相当于5本《新华字典》的文字量。
这场价格战愈演愈烈:2024年下半年,阿里云三度降价,视觉理解模型降幅超80%;豆包视觉理解模型定价0.003元/千Token,1元可处理284张720P图片。短短半年,国内大模型API价格从0.1-0.12元/千Token跌至0.001元级别。
火山引擎总裁谭待在宣布豆包大模型价格时曾表示:“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。将大模型使用从以分计价推进到以厘计价,将助力企业以更低成本加速业务创新。大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值。”
话虽如此,但这场价格战,本质上还是头部厂商的零和博弈——用低价抢占市场份额,逼退中小玩家,为后续掌握定价权埋下伏笔,这不是终点,而是一次战略铺垫。
02.
涨价背后的深层原因
据IDC发布的《中国大模型公有云服务市场分析,2025H1》显示,2025年上半年,火山引擎以49.2%的市场份额位居第一,阿里云百炼平台以27.0%排名第二,百度智能云千帆平台以17.0%位列第三,三家头部厂商合计占据83.2%的市场份额。
价格战的成果已经显现——大模型公有云的头部格局基本定型,定价权也随之向少数玩家高度集中,厂商们拥有了从“以价换量”走向“以供定价”的现实基础。而供需的失衡,又为企业战略转向提供了最佳窗口。
沙利文2026年2月发布的报告显示,2025年下半年中国企业级大模型日均调用量飙升至37.0万亿Token,较上半年的10.2万亿Token暴涨263%,半年实现近3倍扩容。
这一增长的背后,是AI从“对话模式”向“Agent模式”的演进。一个复杂Agent任务的Token消耗量,可达普通对话模式的几十甚至上百倍。Agent深度融入工作流后,Token成为AI时代的核心生产资料与价值衡量标尺。
以OpenClaw为代表的AI应用迎来部署热潮,Token调用量激增。根据在线AI托管平台OpenRouter发布的数据,在2026年3月9日至15日这一周,中国AI大模型的周调用量飙升至4.69万亿Token,环比大涨11.83%;而同期美国大模型调用量则下滑9.33%,降至3.294万亿Token。
全球调用量前三被中国模型霸榜:MiniMaxM2.5以1.75万亿Token五连冠,阶跃星辰Step3.5Flash摘得榜眼,DeepSeekV3.2以1.04万亿Token稳居第三。
摩根大通预测,中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。
需求暴涨的同时,供给侧却面临瓶颈。
阿里云在公告中明确表示,涨价原因是“全球AI需求爆发、供应链涨价,行业核心硬件采购成本显著上涨”。据知情人士透露,此轮涨价另一个重要原因是"Token调用量暴涨",阿里云正在将紧缺的AI算力资源向Token业务倾斜。
网宿科技、优刻得等也于2026年2-3月相继发布涨价函。
IDC中国研究经理崔婷婷表示:“AI需求爆发导致国际和国内核心硬件相关供应链供货紧张,交付周期拉长。全球AI基础设施主要玩家纷纷官宣在未来3-5年之内加大AI战略投资,导致缺口巨大,硬件供应商在供需预判调转情况下加速涨价,这也加剧供应链涨价趋势,使得云计算市场成本提升。”
这一趋势是全球性的。2026年1月,亚马逊AWS将其EC2机器学习容量块服务价格上调约15%,打破了AWS二十年“只降不涨”的定价传统。谷歌云宣布自2026年5月1日起上调全球数据传输服务价格,北美地区每GB费率从0.04美元翻倍至0.08美元。
2026年3月18日,腾讯发布2025年四季度及全年财报,腾讯董事会主席兼CEO马化腾宣布,2025年腾讯云实现规模化盈利。腾讯扭转了此前的保守投入策略,明确提出2026年AI新产品投入将至少翻倍增长。
阿里巴巴则成立了由CEO吴泳铭亲自挂帅的AlibabaTokenHub(ATH)事业群,希望打通Token创造、输送、应用的全链条。这意味着阿里云的商业化收入需在五年内翻7倍,年均增速超40%。
03.
影响与未来:Token经济的新时代
当头部厂商把竞争重心从“抢份额”切换到“抢定价权”,涨价就不再只是财报数字上的调整,而会沿着产业链向上下游同时传导——不同环节的企业,正面临截然不同的处境。
对中小企业而言,成本压力开始显性化。一家运营小型网站的企业技术负责人告诉DoNews:“我们用的是百度智能云,但没有采购AI算力和并行文件存储。”言下之意,这轮涨价对他们影响有限。但对于深度依赖AI算力的企业,压力将显著上升。
应对路径主要有两条:一是通过模型蒸馏、缓存复用等手段优化Token使用效率,降低单位任务消耗;二是不再盲目追求"最大最强",而是按场景选择性价比更高的模型。
对云厂商而言,分化正在加剧。阿里、腾讯、百度三家步调一致,形成“涨价联盟”。而京东云等追赶者,则用"不涨价"策略差异化竞争,试图从头部厂商手中抢夺对价格敏感的客户。
这种分化并非坏事——它意味着云市场正从单一价格战走向分层定价:高端市场讲“优质优价”,中低端市场讲"性价比",两端各取所需,反而比一味的“价格战”更有利于行业长期健康发展。
对算力产业链而言,一轮新的收获期正在到来。涨价潮的另一面,是AI芯片、服务器、数据中心、云计算整条链路的业绩兑现。国盛证券分析认为,随着国内市场Token消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导。投资建议关注AI Infra产业链,包括深信服、海光信息、寒武纪、海天瑞声、并行科技、青云科技等。
把视角拉长,还能看到三条更确定的趋势。
其一,Token正式成为AI时代的核心生产资料。AI进入Agent时代的核心特征,就是Token的海量消耗。Token不再仅仅是计价单位,而是价值衡量的标尺。也正因此,巨头们纷纷把Token经济纳入战略层面:腾讯计划翻倍加码AI新产品投入;阿里设立ATH事业群打通Token全链条;联通宣布抢抓Token经济创新机遇。
其二,云计算的定价逻辑,已从“规模降价”切换为“供需定价”。过去,云厂商靠“规模-降价-扩量”的正向循环不断做大市场;但当AI算力成为稀缺资源,价格便不再由单一厂商主导,而是由真实供需决定。业内人士也直言,未来如果供应链成本继续上升,不排除云计算厂商再次涨价的可能性。涨价可能是新常态,而非短期波动。
其三,Token经济的市场规模将呈指数级扩张。摩根大通预测,中国AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,五年增幅约370倍。这意味着,能够在这一浪潮中存活的企业,不是那些依赖"白菜价"算力的玩家,而是能够创造真实价值、优化Token使用效率的应用方。
回到开始关于豆包付费的舆论风暴,答案已经不言自明。豆包宣布收费的那一刻,舆论看到的是价格,但真正值得关注的,是AI行业底层货币体系的切换——Token不再是廉价的流量耗材,而是新一轮数字经济的核心计价单位。
结语:
告别幻想,回归价值
Token大降价时代的结束,不是AI发展的倒退,而是产业成熟的标志。
回顾历史,从OpenAI在2020年开创Token计价模式,到2024年中国云厂商的“价格战”,再到2026年的"涨价潮",这一轮回背后是AI产业从技术探索到商业落地的完整周期。
对企业而言,幻想“白菜价”算力持续存在已不现实。正确的策略是:正视成本上升的现实,优化AI应用效率,将Token用在真正创造价值的场景上。
Token经济爆发的大幕刚刚拉开。在这个新时代,只有真正创造价值的应用,才能在这场从“价格战”到“价值战”的转型中存活下来。
![]()
![]()
![]()
![]()
「创新无边界」是我们的slogan,我们不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向大胆迈进。因此,「打造行业新标杆、解读商业新动向」是我们秉持的方向之一。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.