网易首页 > 网易号 > 正文 申请入驻

晚点独家丨火山引擎豆包大模型日均调用量破百万亿 Tokens

0
分享至



Token 与 Agent 爆发带来的新机会。

文丨高洪浩

编辑丨宋玮

《晚点 LatePost》独家获悉,自今年春节以来,字节跳动云计算业务火山引擎的豆包大模型日均调用量已超过 100 万亿 Tokens(词元),不到两个月上涨了超 60%。来自个人用户的 Token 消耗近期也明显增长。

据了解,全球目前只有三家公司的 Token 消耗量超过 100 万亿,分别是 OpenAI、Google 与字节跳动。不过字节跳动的 Token 消耗主要来自中国市场,海外市场则在快速增长阶段。

一位火山引擎人士告诉我们,火山目前的增长还是在一定约束条件下实现的——字节跳动旗下的视频生成模型 Seedance 2.0 API 尚未在海外正式上线。

Token 是 AI 理解和生成文本的最小语义处理单元,使用者每一次与大模型的交互(提问、生成的代码、生成的图片和视频等),最终都要被拆解成 Token 来完成运算。因此 Token 调用量成为了衡量 AI 模型活跃度、AI 企业算力承载力的关键指标。

过去一年里,Claude Code 等编程智能体(Agent)产品的走红让许多科技公司进一步意识到了 Token 的重要性——一次智能体任务往往包含多轮推理、工具调用和任务执行,Token 消耗通常显著高于普通 AI 对话。OpenClaw 则将 Agent 推向了更广泛的大众用户,进一步放大了 Token 的价值。

当地时间 3 月 16 日,英伟达创始人兼 CEO 黄仁勋在英伟达 GPU 技术大会(NVIDIA GTC)上称,Token 将是未来数字世界最核心、最值钱的大宗商品;Token 的相关指标(吞吐量、生成速度)将成为全球企业 CEO 追踪的核心经营数据,它的表现会直接反映在企业后续的收入中。

提供 MaaS(模型即服务)业务的云厂商是这一轮 Token 大爆发最大的受益者之一。它们通过出售模型调用服务、推理能力和配套工具获利;市场对 Token 需求的激增会直接推高它们的模型调用量,并带动收入增长。

2025 年起,围绕 Token 的 AI 云战争已经打响。亚马逊 AWS 管理层在 10 月的财报电话会议披露,长远来看,MaaS 的收入贡献将与 EC2(亚马逊 AWS 的 CPU 和 GPU 计算实例业务,总营收占比超过 30%)不相上下。

阿里云则在 11 月末启动了 “百炼战役”,目标是短期内将百炼(阿里云的 MaaS 平台)Token 调用规模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事业群,由集团 CEO 吴泳铭直接带队。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在接受我们的访谈时曾提到,过去取得了什么成绩并不重要,下一年增量的 10% 都会大于上一年的全量。2026 年,阿里云的目标是拿下中国 AI 云市场增量的 80%。

《晚点 LatePost》独家了解到,火山引擎此前曾定下了 2026 年 MaaS 业务收入超百亿元的目标,随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火,团队已提升了收入目标。就在上一年,火山引擎也曾因这块业务增长迅猛,两度上调收入目标。

从边缘走向竞争中心的 MaaS 业务

2022 年底,随着新一轮生成式 AI 浪潮卷起,云厂商迎来了一个新的机会:将大模型封装成可调用、可计费的云服务,卖给企业与开发者,并借此打开新的收入来源。

在早期,国内的几家头部云厂商中,只有火山引擎对于推进 MaaS 业务最为积极,也始终将 MaaS 放在了很高的战略位置。2024 年,火山引擎甚至调整了销售团队的业绩考核指标,把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报,要比卖传统云服务更高。

相比阿里、华为与腾讯,字节在云计算上起步最晚,很难在传统的云服务上突围,新兴的 MaaS 业务因而成了它最有可能实现弯道超车的机会——先切入模型服务市场,进而拉动 IaaS、PaaS 以及上层应用服务的增长。

这在海外已有先例。比如对微软的云服务 Azure 来说,出售 OpenAI 模型的 API 只是第一步。客户一旦开始把大模型真正接进业务,往往就不只购买模型能力本身,还会继续采购检索、数据库、数据平台等配套云服务,这将直接提升他们在 Azure 上的整体支出。

推广 MaaS 业务也有助于字节的大模型能力迭代。一位火山引擎人士告诉我们,模型只有通过 MaaS 进入真实的 B 端场景,团队才能持续获得真实反馈,比如模型是否被用起来了、被用在什么场景、哪些地方做得好、哪些地方还不够好,并据此优化模型效果。

上述火山引擎人士透露,火山引擎很早就通过与客户开展协作计划意识到,B 端的企业客户会更多用 AI 来做长线程任务,有大量 Agentic Coding(智能体式编程)的需求,这在一定程度上反向推动了字节模型能力的演进。

许多传统的云厂商虽然也很早发布了自己的 MaaS 业务,但推进的节奏并不算快。部分原因在于,它们原有的收入和组织能力,仍主要建立在 CPU 时代的传统云计算生意上,包括 IaaS、数据库、存储、网络、安全以及各类企业软件服务。大模型带来的这套新需求,无论是底层算力结构,还是上层产品形态,都和过去很不一样。转型需要时间。

此外在国内大模型能力相对有限的阶段,全行业的 Token 消耗规模还不大且价格较低——百万 Tokens 在一元钱左右,这就导致 MaaS 业务的营收规模很小,不被市场所看好。

根据国际数据公司(IDC)公布的数据,2024 年中国整体公有云服务市场规模则超过了 3000 亿元,MaaS 市场规模仅为 7.1 亿元。

直到 2025 年初,MaaS 在中国终于迎来第一次显著提速。DeepSeek 的出现让大模型走出技术圈,进入更广泛的应用场景,越来越多企业和开发者开始通过云端调用模型。

另一个驱动力是多模态模型的成熟,生图、生视频的需求在快速增长。一位火山引擎人士回忆,字节的视频生成模型 Seedance 1.0 刚上线的时候,内部感觉它可能还不能很好地被使用在一些特别专业的创作上。但后来的实际情况是,有相当多的用户会用它来创作整部漫剧,这极大带动了火山引擎 Token 消耗量的增长。

国家数据局 2025 年 8 月数据显示,2024 年初中国日均 Token 消耗量为 1000 亿。截至 2025 年 6 月底,中国日均 Token 消耗量突破 30 万亿,一年半时间增长了 300 多倍。

MaaS 也开始从云服务行业的边缘走向中心。

《财经》曾报道,2025 年 12 月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称,MaaS 收入在云厂商整体收入的占比,有可能达到 30% 甚至更高。

我们了解到,火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。

Agent 的爆发带动 AI 云市场扩容

2025 年 5 月,Anthropic 推出的 Claude Code 在开发者群体与企业间流行了起来。它提供了一种全新的服务——让 AI 真正进入工作流,成为能读代码、调工具、跑任务的 Agent,从根本上改变了构建软件的方式。

Claude Code 等产品还带动了 Coding Plan 这类面向开发者的付费模式开始快速成型。它把原本按次、按量调用的 AI 编程能力,变成了可以高频使用的服务,进一步加快了 Agent 在开发者中的普及,并持续推高了 Token 消耗。

半导体与算力研究机构 SemiAnalysis 估算,目前 GitHub 上约 4% 的公开代码提交(commit)由 Claude Code 完成;按这一趋势,到 2026 年底,Claude Code 占 GitHub 每日公开提交总量的比例可能超过 20%。

年底,OpenClaw 的出现又将 Agent 带入到了更广泛的大众群体中,Agent 也开始从 Coding 走向更广泛场景,包括搜索资料、处理邮件、撰写文档、安排日常事务。

2026 年初,Agent 风潮来到中国,硅谷此前经历过的一切又在这里重演了一遍。

最先受益的是几家 AI 创业公司。2 月,智谱将面向开发者的 GLM Coding Plan 价格上调至少 30%,直接原因便是开发者对 AI 编程工具的需求上升;长期聚焦 C 端产品的 MiniMax 也在其招股书和第一次财报中重点介绍了自己的 Coding Plan 模式。3 月 23 日,MiniMax 宣布将自己的 Coding Plan 升级为 Token Plan,成为了全球首个支持全模态模型的统一订阅计划。

国内的一众类 OpenClaw 涌现后,Agent 进入大众视野。一位火山引擎人士告诉我们,过去一个多月,来自个人用户的 Token 消耗增长了约 16 倍。

Agent 的普及、Token 的暴涨也在带动 MaaS 和 AI 云市场扩容。

对企业来说,通过公有云调用(MaaS)是当前使用大模型最实用、也最有效的方式。企业真正需要的不是自己维护机器,而是按 Token 灵活调用模型能力;同时,大模型迭代极快、不同模型的最佳部署方式又各不相同,只有 MaaS 这类持续升级的平台,才能更快接入新模型,并把背后的部署、适配和运维复杂度一并接住。

继亚马逊 AWS、谷歌云年初释放涨价信号后,腾讯云、阿里云、百度智能云密集跟进,主流云计算服务商基本上全都加入涨价行列。

不过 Agent 时代对云厂商带来的挑战也不小。过去的云平台基本都是为 Web、App 场景服务的,现在则要转向围绕着 Agent 设计。

火山引擎智能算法负责人吴迪曾在火山引擎 FORCE 原动力大会上提到,下一代 Agent 应用绝不能只停留在探索层面,最终要真正走进企业的生产和业务需求里。这就要求 Agent 需要具备三大核心能力,长期记忆的能力,随业务数据变化的自我进化能力,以及准确执行多步骤复杂任务的能力。

对任何一家云厂商而言,这注定是一场艰难的攻坚战。“(MaaS)这个事还太早期了。” 火山引擎总裁谭待此前曾跟我们提到。他也会告诉团队 “马拉松才跑 500 米,别取得一点点小成绩就满意了。”

题图来源:《银翼杀手》

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
经济复苏的三个标志

经济复苏的三个标志

生命可以承受之轻
2026-05-11 09:05:02
抢在访华登机前,特朗普随行名单生变,英伟达第一个被踢出局

抢在访华登机前,特朗普随行名单生变,英伟达第一个被踢出局

奇思妙想生活家
2026-05-12 19:09:49
上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

新民晚报
2026-05-12 18:07:01
送妻子出差我含泪告别,当晚偶遇她同事:你妻子根本没去外地

送妻子出差我含泪告别,当晚偶遇她同事:你妻子根本没去外地

千秋文化
2026-05-08 10:20:32
国家德比时亚马尔造型吸睛,爱马仕胸包大约7000至13000欧元

国家德比时亚马尔造型吸睛,爱马仕胸包大约7000至13000欧元

懂球帝
2026-05-12 09:44:11
我故意在家里跑两套Wi-Fi,不只是为了安全

我故意在家里跑两套Wi-Fi,不只是为了安全

我是一个养虾人
2026-05-12 07:36:25
老佛爷:现在不是聊穆帅的时候;有人想让我离开皇马但我不会走

老佛爷:现在不是聊穆帅的时候;有人想让我离开皇马但我不会走

懂球帝
2026-05-13 02:02:28
今年俄罗斯胜利日阅兵,为何唯独朝鲜派兵参加?中国怎么没派

今年俄罗斯胜利日阅兵,为何唯独朝鲜派兵参加?中国怎么没派

刘振起观点
2026-05-10 16:05:00
新鹏城官方:因出现严重言行失当,撤销姜至鹏一线队队长职务

新鹏城官方:因出现严重言行失当,撤销姜至鹏一线队队长职务

懂球帝
2026-05-12 19:02:39
阿森纳官方:本-怀特内侧膝关节韧带严重受伤,球员本赛季报销

阿森纳官方:本-怀特内侧膝关节韧带严重受伤,球员本赛季报销

懂球帝
2026-05-12 23:20:08
离婚一年后,女子再次思念前夫,发了句“在干嘛”,他立马回复:你要是再多说一句话,明天我就找你复婚!

离婚一年后,女子再次思念前夫,发了句“在干嘛”,他立马回复:你要是再多说一句话,明天我就找你复婚!

犀利辣椒
2026-05-13 06:21:33
A·史密斯认为尼克斯队,是勒布朗·詹姆斯5亿美元合同的最佳选择

A·史密斯认为尼克斯队,是勒布朗·詹姆斯5亿美元合同的最佳选择

好火子
2026-05-13 00:41:17
女子因18元奶茶被亲姐拉黑,崩溃大哭:离婚带娃5年,都看不起我

女子因18元奶茶被亲姐拉黑,崩溃大哭:离婚带娃5年,都看不起我

辣媒专栏记录
2026-05-11 08:21:59
出乎所有人预料!中方官宣,特朗普更改访华行程,在北京多留一天

出乎所有人预料!中方官宣,特朗普更改访华行程,在北京多留一天

月亮睡在雾里
2026-05-13 00:14:47
贵阳女子1880元办不限次数的瑜伽季卡,连上20多天课后被教练踢出群聊:天天来,你不累吗?

贵阳女子1880元办不限次数的瑜伽季卡,连上20多天课后被教练踢出群聊:天天来,你不累吗?

观威海
2026-05-11 20:46:40
苏神发威+梅西策动,迈阿密国际客场带走三分稳不稳

苏神发威+梅西策动,迈阿密国际客场带走三分稳不稳

大四喜看球
2026-05-13 00:20:04
创业板迎来第二只千元股!中际旭创一度突破1000元,近一年上涨956%

创业板迎来第二只千元股!中际旭创一度突破1000元,近一年上涨956%

界面新闻
2026-05-12 11:58:06
狄龙前排观战湖人雷霆,宿敌戏码延续到场边

狄龙前排观战湖人雷霆,宿敌戏码延续到场边

体育硬核说
2026-05-13 07:42:40
中足联:申花球员马纳法停赛3场并罚款3万元

中足联:申花球员马纳法停赛3场并罚款3万元

五星体育
2026-05-12 23:04:55
湖北一酒店内消杀人员开错房门,事发时房内女子未着衣物,个人隐私遭泄露,消杀企业:承认失误,愿按房费三十倍标准进行赔付

湖北一酒店内消杀人员开错房门,事发时房内女子未着衣物,个人隐私遭泄露,消杀企业:承认失误,愿按房费三十倍标准进行赔付

扬子晚报
2026-05-12 14:20:17
2026-05-13 08:00:49
晚点LatePost
晚点LatePost
晚一点,好一点。商业的真相总是在晚点。《晚点LatePost》官方账号
3202文章数 21932关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
时尚
数码
本地
游戏

教育要闻

600分以下想要本科就业,如何报志愿

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

数码要闻

首发883.15元!小米路由器BE7200 Pro开售:全2.5GE网口 家里网关都省了

本地新闻

用苏绣的方式,打开江西婺源

曝PS6或将被迫缩减内存规格 以应对零部件涨价

无障碍浏览 进入关怀版