来源:市场资讯
(来源:晚点LatePost)
![]()
文丨高洪浩
编辑丨宋玮
《晚点 LatePost》独家获悉,自今年春节以来,字节跳动云计算业务火山引擎的日均云端大模型调用量已超过 100 万亿 Tokens(词元),不到两个月上涨了超 60%。来自个人用户的 Token 消耗近期也明显增长。
据了解,全球目前只有三家公司的 Token 消耗量超过 100 万亿,分别是 OpenAI、Google 与字节跳动。不过字节跳动的 Token 消耗主要来自中国市场,海外市场则在快速增长阶段。
一位火山引擎人士告诉我们,火山目前的增长还是在一定约束条件下实现的——字节跳动旗下的视频生成模型 Seedance 2.0 API 尚未在海外正式上线。
Token 是 AI 理解和生成文本的最小语义处理单元,使用者每一次与大模型的交互(提问、生成的代码、生成的图片和视频等),最终都要被拆解成 Token 来完成运算。因此 Token 调用量成为了衡量 AI 模型活跃度、AI 企业算力承载力的关键指标。
过去一年里,Claude Code 等编程智能体(Agent)产品的走红让许多科技公司进一步意识到了 Token 的重要性——一次智能体任务往往包含多轮推理、工具调用和任务执行,Token 消耗通常显著高于普通 AI 对话。OpenClaw 则将 Agent 推向了更广泛的大众用户,进一步放大了 Token 的价值。
当地时间 3 月 16 日,英伟达创始人兼 CEO 黄仁勋在英伟达 GPU 技术大会(NVIDIA GTC)上称,Token 将是未来数字世界最核心、最值钱的大宗商品;Token 的相关指标(吞吐量、生成速度)将成为全球企业 CEO 追踪的核心经营数据,它的表现会直接反映在企业后续的收入中。
提供 MaaS(模型即服务)业务的云厂商是这一轮 Token 大爆发最大的受益者之一。它们通过出售模型调用服务、推理能力和配套工具获利;市场对 Token 需求的激增会直接推高它们的模型调用量,并带动收入增长。
2025 年起,围绕 Token 的 AI 云战争已经打响。亚马逊 AWS 管理层在 10 月的财报电话会议披露,长远来看,MaaS 的收入贡献将与 EC2(亚马逊 AWS 的 CPU 和 GPU 计算实例业务,总营收占比超过 30%)不相上下。
阿里云则在 11 月末启动了 “百炼战役”,目标是短期内将百炼(阿里云的 MaaS 平台)Token 调用规模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事业群,由集团 CEO 吴泳铭直接带队。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在接受我们的访谈时曾提到,过去取得了什么成绩并不重要,下一年增量的 10% 都会大于上一年的全量。2026 年,阿里云的目标是拿下中国 AI 云市场增量的 80%。
《晚点 LatePost》独家了解到,火山引擎此前曾定下了 2026 年 MaaS 业务收入超百亿元的目标,随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火,团队已提升了收入目标。就在上一年,火山引擎也曾因这块业务增长迅猛,两度上调收入目标。
从边缘走向竞争中心的 MaaS 业务
2022 年底,随着新一轮生成式 AI 浪潮卷起,云厂商迎来了一个新的机会:将大模型封装成可调用、可计费的云服务,卖给企业与开发者,并借此打开新的收入来源。
在早期,国内的几家头部云厂商中,只有火山引擎对于推进 MaaS 业务最为积极,也始终将 MaaS 放在了很高的战略位置。2024 年,火山引擎甚至调整了销售团队的业绩考核指标,把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报,要比卖传统云服务更高。
相比阿里、华为与腾讯,字节在云计算上起步最晚,很难在传统的云服务上突围,新兴的 MaaS 业务因而成了它最有可能实现弯道超车的机会——先切入模型服务市场,进而拉动 IaaS、PaaS 以及上层应用服务的增长。
这在海外已有先例。比如对微软的云服务 Azure 来说,出售 OpenAI 模型的 API 只是第一步。客户一旦开始把大模型真正接进业务,往往就不只购买模型能力本身,还会继续采购检索、数据库、数据平台等配套云服务,这将直接提升他们在 Azure 上的整体支出。
推广 MaaS 业务也有助于字节的大模型能力迭代。一位火山引擎人士告诉我们,模型只有通过 MaaS 进入真实的 B 端场景,团队才能持续获得真实反馈,比如模型是否被用起来了、被用在什么场景、哪些地方做得好、哪些地方还不够好,并据此优化模型效果。
上述火山引擎人士透露,火山引擎很早就通过与客户开展协作计划意识到,B 端的企业客户会更多用 AI 来做长线程任务,有大量 Agentic Coding(智能体式编程)的需求,这在一定程度上反向推动了字节模型能力的演进。
许多传统的云厂商虽然也很早发布了自己的 MaaS 业务,但推进的节奏并不算快。部分原因在于,它们原有的收入和组织能力,仍主要建立在 CPU 时代的传统云计算生意上,包括 IaaS、数据库、存储、网络、安全以及各类企业软件服务。大模型带来的这套新需求,无论是底层算力结构,还是上层产品形态,都和过去很不一样。转型需要时间。
此外在国内大模型能力相对有限的阶段,全行业的 Token 消耗规模还不大且价格较低——百万 Tokens 在一元钱左右,这就导致 MaaS 业务的营收规模很小,不被市场所看好。
根据国际数据公司(IDC)公布的数据,2024 年中国整体公有云服务市场规模则超过了 3000 亿元,MaaS 市场规模仅为 7.1 亿元。
直到 2025 年初,MaaS 在中国终于迎来第一次显著提速。DeepSeek 的出现让大模型走出技术圈,进入更广泛的应用场景,越来越多企业和开发者开始通过云端调用模型。
另一个驱动力是多模态模型的成熟,生图、生视频的需求在快速增长。一位火山引擎人士回忆,字节的视频生成模型 Seedance 1.0 刚上线的时候,内部感觉它可能还不能很好地被使用在一些特别专业的创作上。但后来的实际情况是,有相当多的用户会用它来创作整部漫剧,这极大带动了火山引擎 Token 消耗量的增长。
国家数据局 2025 年 8 月数据显示,2024 年初中国日均 Token 消耗量为 1000 亿。截至 2025 年 6 月底,中国日均 Token 消耗量突破 30 万亿,一年半时间增长了 300 多倍。
MaaS 也开始从云服务行业的边缘走向中心。
《财经》曾报道,2025 年 12 月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称,MaaS 收入在云厂商整体收入的占比,有可能达到 30% 甚至更高。
我们了解到,火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。
Agent 的爆发带动 AI 云市场扩容
2025 年 5 月,Anthropic 推出的 Claude Code 在开发者群体与企业间流行了起来。它提供了一种全新的服务——让 AI 真正进入工作流,成为能读代码、调工具、跑任务的 Agent,从根本上改变了构建软件的方式。
Claude Code 等产品还带动了 Coding Plan 这类面向开发者的付费模式开始快速成型。它把原本按次、按量调用的 AI 编程能力,变成了可以高频使用的服务,进一步加快了 Agent 在开发者中的普及,并持续推高了 Token 消耗。
半导体与算力研究机构 SemiAnalysis 估算,目前 GitHub 上约 4% 的公开代码提交(commit)由 Claude Code 完成;按这一趋势,到 2026 年底,Claude Code 占 GitHub 每日公开提交总量的比例可能超过 20%。
年底,OpenClaw 的出现又将 Agent 带入到了更广泛的大众群体中,Agent 也开始从 Coding 走向更广泛场景,包括搜索资料、处理邮件、撰写文档、安排日常事务。
2026 年初,Agent 风潮来到中国,硅谷此前经历过的一切又在这里重演了一遍。
最先受益的是几家 AI 创业公司。2 月,智谱将面向开发者的 GLM Coding Plan 价格上调至少 30%,直接原因便是开发者对 AI 编程工具的需求上升;长期聚焦 C 端产品的 MiniMax 也在其招股书和第一次财报中重点介绍了自己的 Coding Plan 模式。3 月 23 日,MiniMax 宣布将自己的 Coding Plan 升级为 Token Plan,成为了全球首个支持全模态模型的统一订阅计划。
国内的一众类 OpenClaw 涌现后,Agent 进入大众视野。一位火山引擎人士告诉我们,过去一个多月,来自个人用户的 Token 消耗增长了约 16 倍。
Agent 的普及、Token 的暴涨也在带动 MaaS 和 AI 云市场扩容。
对企业来说,通过公有云调用(MaaS)是当前使用大模型最实用、也最有效的方式。企业真正需要的不是自己维护机器,而是按 Token 灵活调用模型能力;同时,大模型迭代极快、不同模型的最佳部署方式又各不相同,只有 MaaS 这类持续升级的平台,才能更快接入新模型,并把背后的部署、适配和运维复杂度一并接住。
继亚马逊 AWS、谷歌云年初释放涨价信号后,腾讯云、阿里云、百度智能云密集跟进,主流云计算服务商基本上全都加入涨价行列。
不过 Agent 时代对云厂商带来的挑战也不小。过去的云平台基本都是为 Web、App 场景服务的,现在则要转向围绕着 Agent 设计。
火山引擎智能算法负责人吴迪曾在火山引擎 FORCE 原动力大会上提到,下一代 Agent 应用绝不能只停留在探索层面,最终要真正走进企业的生产和业务需求里。这就要求 Agent 需要具备三大核心能力,长期记忆的能力,随业务数据变化的自我进化能力,以及准确执行多步骤复杂任务的能力。
对任何一家云厂商而言,这注定是一场艰难的攻坚战。“(MaaS)这个事还太早期了。” 火山引擎总裁谭待此前曾跟我们提到。他也会告诉团队 “马拉松才跑 500 米,别取得一点点小成绩就满意了。”
题图来源:《银翼杀手》
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.