作者:高飞
大模型领域有两个关于翻译的段子。
一个是LLM。早期的模型经常把它翻译成"法学硕士",所以AI博主们(比如我),经常调侃自己自带研究生学历。另一个是Token,围绕它的翻译版本更多,"令牌""代币""标记",搞区块链的、做网络安全的、写编译器的各有各的叫法,而且听起来都很合理。
这两个问题现在都不存在了。把LLM叫法学硕士的模型越来越少了。Token也有了正式中文名:词元。3月下旬,官方在中国发展高层论坛上给它盖了章。
不过我猜大家还是会继续叫Token。中文名本身不是重点,伴随命名一起落地的那个定性才是:可计量、可定价、可交易。这是经济学语言。当一个技术概念被官方赋予经济计量属性,它的身份就变了。同期公布的数字:中国日均Token调用量突破140万亿,两年增长超千倍。
说到统计Token这件事,已经有公司在追踪这个数字的变化了,而且追踪了两年,它就是火山引擎。4月2日武汉巡展上,火山引擎公布了豆包大模型最新的日均Token调用量:超过120万亿,三个月翻了一倍。两年前这个数字是1200亿,1000倍。
![]()
两年一条曲线
1200亿到120万亿,这条曲线的起点是2024年5月。火山引擎首次对外推出豆包大模型,同一时间做了一个决定:把MaaS,也就是按Token调用量计费的模型服务,放到战略最高优先级,而且开始持续、公开地披露调用量数据。
当时没有第二家云厂商这么干。别的厂商还在讲GPU算力规模和IaaS营收,Token调用量这个指标连被正经看待的资格都没拿到。2024年中国MaaS市场总规模7亿出头,整个公有云盘子3000亿,MaaS连零头都不算。
火山引擎总裁谭待的逻辑倒是简单:模型只有被调用才能发挥价值,Token调用量是AI时代的DAU,比GPU数量更能反映产业的真实温度。
后来的事大家都看到了。火山持续更新这条曲线:2024年5月日均1200亿,2025年5月16.4万亿,12月50万亿,年底63万亿,到今天120万亿。创投圈专门跟踪它,拿来当尺子量中国AI应用落地的进度。
![]()
当年只有火山一家在讲Token调用量。今天呢?Kimi模型服务收入破亿,智谱涨价83%,MiniMax模型服务营收占比升到三分之一。阿里3月成立了Alibaba Token Hub事业群,集团CEO直接带队。连官方也把Token计费定调为"正在加速演进的新型商业逻辑"了。围绕Token,必然会出现一个更有看点的竞技场。
IDC数据显示,2025年上半年火山引擎在中国大模型公有云服务市场的调用量份额达到49.2%,第一名。
Agent的"虾粮"和人类的"注意力"
位置拿到了,但120万亿日均Token到底怎么涨上来的?
我把Token的消耗按来源分成两种形态:人类的注意力和Agent的虾粮。人在用Token,Agent也在用Token。两股力量几乎同时起量,叠加出了这个数字。
人类消耗Token的驱动力是什么?我的判断是多模态,不是聊天框。聊天框当然也在消耗Token,但真正把量级拉上来的,是语音和视频对人类注意力的捕获。
豆包是国内较早支持自然语音交流的AI应用。用户跟它打交道的常见方式是说话,不打字。看起来只是体验上的改善,但对Token消耗的影响是量级上的。语音交互要把每一秒的音频切分成大量片段,音调、音量、音色分别向量化,再送进模型。一句话用文字可能十几个Token就够了,换成语音,同样的意思消耗翻几十倍。
语音带来的不只是Token消耗的变化,还有一个没预料到的东西:情感连接。豆包是全球唯一一个用真人脸做产品logo的AI应用,它的"小姐姐"形象和声音已经变成了一种文化现象。用户给它"捏崽"、做"豆包吃播"和"豆包换装"短片,甚至有人做出了"豆包痛包"。痛包是二次元粉丝给喜欢的角色做的徽章挂件包,通常只给动漫角色和偶像做,给一个AI应用做痛包,说明它在用户心里已经不是工具,而是一个有人格感的IP。这些二创内容本身又在消耗Token,AI的自我造血。
视频更猛。这几个月大家一定在短视频平台上刷到过"雪山救狐狸"的系列。侠客在雪山救了一只白狐,留下酱板鸭当食物,观众以为接下来是狐狸报恩的老套路,结果网友用Seedance 2.0接力改编,剧情拐向了"酱板鸭的复仇",文旅账号、普法账号纷纷入场,全网传播量破50亿。一个AI视频生成模型催生了一场全民追更的武侠连续剧。火山引擎的Seedance 2.0是目前视频生成领域全球排名第一的模型,刚在武汉巡展上宣布面向企业公测。生成一段一分钟720P的视频,Token消耗百万以上。你跟AI打一句字才几百Token,一分钟视频百万Token,差三个数量级。
![]()
视频Token的需求有多真实?讲一个行业里流传的段子。做AI漫剧和AI短剧的团队,现在流行熬夜跑视频。Seedance 2.0上线后,高峰时段排队人数超过9万,有的团队把开工时间调到凌晨3点避开拥堵,个人创作者凌晨4点爬起来抢算力。一个视频生成模型把创作者逼成了"赛博农民",按凌晨时段作息。Token的需求不是在PPT里画出来的,是在产线上跑出来的。
这些消耗不是在烧钱玩。语音让AI进入了不会打字或者懒得打字的人群,视频生成让创作者几句话就能让画面动起来。火山在这个方向上的优势清楚:豆包的语音交互、Seedream的图像创作、Seedance的视频生成,一条完整的多模态链,每一环都在拉Token的量。B端也一样,企业客户拿Seedream做营销图,拿Seedance做短视频,拿豆包的视觉理解做巡检和质检。从火山官方披露的数据看,多模态已经是Token消耗的主力。
人类的注意力撑起了Token消耗的一面,另一面是Agent的"虾粮"。增量更大。
去年12月上海Force原动力大会上,谭待讲过一个判断:Agent场景的Token调用必然是未来的趋势。逻辑也简单,AI正在从"能回答"走向"能规划、能调用、能执行",每一次工具调用、每一轮推理循环都在消耗Token。两三轮简单调用几千Token就够了,但几十上百轮的复杂任务,消耗到几十万。
这个判断很快就有了验证。龙虾,也就是OpenClaw,春节前后在中国爆发。它引发的效应跟去年DeepSeek对大模型的普及有几分相似。在它出现之前,绝大多数中国用户对Agent没有概念。企业里说"我们搞了Agent",打开一看就是一套提示词。龙虾让所有人第一次直观地看到Agent可以推理、循环、自主执行任务。这不是Demo,是能装在电脑上实际干活的东西。
龙虾还带来了一个附带效果:大量个人用户第一次体验了买模型API的过程。以前个人不会去买模型服务,现在各家Coding Plan都上了,199、499、1991,各种价位。Token第一次从开发者的术语变成了普通人花钱时看到的东西。火山的数据显示,春节后Coding Plan相关调用涨了15倍以上。
我把这种因龙虾和各类Agent产生的Token消耗增量叫做"虾粮生意"。在龙虾之前这个生意不存在。龙虾充当了Token消费的中间层:人给Agent下任务,Agent调模型消耗Token。Agent越能干,Token消耗越大。
武汉巡展上,火山引擎和OpenClaw创始人Peter Steinberger共同宣布ClawHub中国镜像站正式运营。Peter还用火山的ArkClaw龙虾给自己生成了一段视频,最后对着镜头说了句"请大家在武汉多吃龙虾"。在中国,龙虾和小龙虾已经是同义词了。
![]()
龙虾只是Agent浪潮的一个切面。火山同时在推企业级Agent落地:ArkClaw做敏态场景的个人生产力工具,HiAgent做稳态场景的组织级Agent管理。谭待在武汉提了"养虾三要素":模型、Skill、安全。火山刚通过信通院Agent类产品的两项权威安全认证,国内唯一同时拿到两项的厂商。
人类的注意力加Agent的虾粮,两股力量在不同时间点先后引爆、最终汇流。120万亿就是这么来的
比电复杂
Token有了中文名,官方给了它经济计量单位的定位。这让我想到一段更老的历史。
1888年,西屋电气有个叫Shallenberger的工程师在摆弄一盏弧光灯,一根弹簧掉在灯内搁板上。他注意到弹簧在转。三周后,他根据旋转磁场原理做出了第一个实用的交流电瓦时表。在那之前,爱迪生给客户算电费的方式是数灯头,你家几个灯泡就收你多少钱。瓦时表让电力第一次有了按量计费的商业模式。五年后的1893年芝加哥世博会,国际电气大会把千瓦时确立为电能的商业计量标准。从"数灯头"到"计千瓦时",电力产业的商业逻辑被重写。定价、交易、输配、监管,全围绕这个计量单位长出来了。
Token正在经历类似的时刻。两年前还是NLP工程师的内部术语,今天官方已经在国新办发布会上用"词元"统计产业数据了。"日均词元调用量140万亿"这种表述,听起来已经和"日产粗钢300万吨"是同一种句式。
但Token比电复杂得多。
一度电就是一度电。照明、炼钢、开电动车,物理属性不变,计量方式不变,价格只跟时段和区域有关。电是一维的:数量乘以单价,就是账单。
Token不一样,武汉巡展上的几个细节就能说明问题。
Seedance 2.0这次面向企业公测,火山引擎专门为它建了一套肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程,防侵权、防Deepfake。谭待在武汉的采访中提到,Seedance 2.0的API之所以到现在才对外开放,就是为了等这套版权保护系统搭好。你买一度电不需要关心这度电会不会侵犯谁的肖像权,但你消耗一百万Token生成一段视频,这个问题就跑不掉。
同样是消耗Token的Agent,管理方式也完全不同。谭待在武汉把企业Agent分成两类:敏态Agent和稳态Agent。敏态Agent强调探索,让员工拿ArkClaw这类工具去试新做法,是"创新试验场";稳态Agent强调流程化,在合同交易、生产线这类场景中把AI的最佳实践固定下来,用HiAgent做规模化管理。同样都在消耗Token,但一个追求灵活,一个追求确定,对模型能力、安全标准、运营方式的要求截然不同。
安全问题就更具体了。随着龙虾的使用量上升,沙箱权限失控、提示词注入、Skills插件投毒,这些威胁不断冒出来。之前Meta的AI安全总监把OpenClaw接了自己的工作邮箱,结果邮件被疯狂删除。一度电不会自己去删你的邮件,但一个Agent可能会。
电是一维的,数量乘以单价就是账单。Token是多维的:性能、模态、安全、工程复杂度,每一个维度都在影响这个计量单位的实际价值。谭待在采访中还讲了一个角度:不能抛开模型能力谈Token价格。seed 2.0 Lite比上一代的1.8 Pro能力更强,但定价更低,单个Token的"智力水平"在提升。同样花一块钱买Token,买到的东西和半年前已经不一样了。这种复杂性是机遇。谭待说过:如果把AI发展看作一场马拉松,现在才跑了500米,Token经济也是。
其实,连大模型领域的翻译工作都还没结束。OpenClaw很快就有了中文名"龙虾",但OpenClaw所属的AI领域Agentic AI到现在还没有一个让人满意的中文译名。叫"代理式AI",总觉得奇奇怪怪的;叫"智能体AI",又丢了原文里agentic那个自主行动、主动出击的劲儿。
不过,有时候,没有名字,也是一件好事。名字只是一个符号,就像左手指月,左手不是月。这代表我们可以更自由的想象它,也代表这个行业跑的太快,有Token量表的指针为证。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.