网易首页 > 网易号 > 正文 申请入驻

论Token的爆发:火山引擎、虾粮和一个新的计量单位

0
分享至

作者:高飞

大模型领域有两个关于翻译的段子。

一个是LLM。早期的模型经常把它翻译成"法学硕士",所以AI博主们(比如我),经常调侃自己自带研究生学历。另一个是Token,围绕它的翻译版本更多,"令牌""代币""标记",搞区块链的、做网络安全的、写编译器的各有各的叫法,而且听起来都很合理。

这两个问题现在都不存在了。把LLM叫法学硕士的模型越来越少了。Token也有了正式中文名:词元。3月下旬,官方在中国发展高层论坛上给它盖了章。

不过我猜大家还是会继续叫Token。中文名本身不是重点,伴随命名一起落地的那个定性才是:可计量、可定价、可交易。这是经济学语言。当一个技术概念被官方赋予经济计量属性,它的身份就变了。同期公布的数字:中国日均Token调用量突破140万亿,两年增长超千倍。

说到统计Token这件事,已经有公司在追踪这个数字的变化了,而且追踪了两年,它就是火山引擎。4月2日武汉巡展上,火山引擎公布了豆包大模型最新的日均Token调用量:超过120万亿,三个月翻了一倍。两年前这个数字是1200亿,1000倍。


两年一条曲线

1200亿到120万亿,这条曲线的起点是2024年5月。火山引擎首次对外推出豆包大模型,同一时间做了一个决定:把MaaS,也就是按Token调用量计费的模型服务,放到战略最高优先级,而且开始持续、公开地披露调用量数据。

当时没有第二家云厂商这么干。别的厂商还在讲GPU算力规模和IaaS营收,Token调用量这个指标连被正经看待的资格都没拿到。2024年中国MaaS市场总规模7亿出头,整个公有云盘子3000亿,MaaS连零头都不算。

火山引擎总裁谭待的逻辑倒是简单:模型只有被调用才能发挥价值,Token调用量是AI时代的DAU,比GPU数量更能反映产业的真实温度。

后来的事大家都看到了。火山持续更新这条曲线:2024年5月日均1200亿,2025年5月16.4万亿,12月50万亿,年底63万亿,到今天120万亿。创投圈专门跟踪它,拿来当尺子量中国AI应用落地的进度。


当年只有火山一家在讲Token调用量。今天呢?Kimi模型服务收入破亿,智谱涨价83%,MiniMax模型服务营收占比升到三分之一。阿里3月成立了Alibaba Token Hub事业群,集团CEO直接带队。连官方也把Token计费定调为"正在加速演进的新型商业逻辑"了。围绕Token,必然会出现一个更有看点的竞技场。

IDC数据显示,2025年上半年火山引擎在中国大模型公有云服务市场的调用量份额达到49.2%,第一名。

Agent的"虾粮"和人类的"注意力"

位置拿到了,但120万亿日均Token到底怎么涨上来的?

我把Token的消耗按来源分成两种形态:人类的注意力和Agent的虾粮。人在用Token,Agent也在用Token。两股力量几乎同时起量,叠加出了这个数字。

人类消耗Token的驱动力是什么?我的判断是多模态,不是聊天框。聊天框当然也在消耗Token,但真正把量级拉上来的,是语音和视频对人类注意力的捕获。

豆包是国内较早支持自然语音交流的AI应用。用户跟它打交道的常见方式是说话,不打字。看起来只是体验上的改善,但对Token消耗的影响是量级上的。语音交互要把每一秒的音频切分成大量片段,音调、音量、音色分别向量化,再送进模型。一句话用文字可能十几个Token就够了,换成语音,同样的意思消耗翻几十倍。

语音带来的不只是Token消耗的变化,还有一个没预料到的东西:情感连接。豆包是全球唯一一个用真人脸做产品logo的AI应用,它的"小姐姐"形象和声音已经变成了一种文化现象。用户给它"捏崽"、做"豆包吃播"和"豆包换装"短片,甚至有人做出了"豆包痛包"。痛包是二次元粉丝给喜欢的角色做的徽章挂件包,通常只给动漫角色和偶像做,给一个AI应用做痛包,说明它在用户心里已经不是工具,而是一个有人格感的IP。这些二创内容本身又在消耗Token,AI的自我造血。

视频更猛。这几个月大家一定在短视频平台上刷到过"雪山救狐狸"的系列。侠客在雪山救了一只白狐,留下酱板鸭当食物,观众以为接下来是狐狸报恩的老套路,结果网友用Seedance 2.0接力改编,剧情拐向了"酱板鸭的复仇",文旅账号、普法账号纷纷入场,全网传播量破50亿。一个AI视频生成模型催生了一场全民追更的武侠连续剧。火山引擎的Seedance 2.0是目前视频生成领域全球排名第一的模型,刚在武汉巡展上宣布面向企业公测。生成一段一分钟720P的视频,Token消耗百万以上。你跟AI打一句字才几百Token,一分钟视频百万Token,差三个数量级。


视频Token的需求有多真实?讲一个行业里流传的段子。做AI漫剧和AI短剧的团队,现在流行熬夜跑视频。Seedance 2.0上线后,高峰时段排队人数超过9万,有的团队把开工时间调到凌晨3点避开拥堵,个人创作者凌晨4点爬起来抢算力。一个视频生成模型把创作者逼成了"赛博农民",按凌晨时段作息。Token的需求不是在PPT里画出来的,是在产线上跑出来的。

这些消耗不是在烧钱玩。语音让AI进入了不会打字或者懒得打字的人群,视频生成让创作者几句话就能让画面动起来。火山在这个方向上的优势清楚:豆包的语音交互、Seedream的图像创作、Seedance的视频生成,一条完整的多模态链,每一环都在拉Token的量。B端也一样,企业客户拿Seedream做营销图,拿Seedance做短视频,拿豆包的视觉理解做巡检和质检。从火山官方披露的数据看,多模态已经是Token消耗的主力。

人类的注意力撑起了Token消耗的一面,另一面是Agent的"虾粮"。增量更大。

去年12月上海Force原动力大会上,谭待讲过一个判断:Agent场景的Token调用必然是未来的趋势。逻辑也简单,AI正在从"能回答"走向"能规划、能调用、能执行",每一次工具调用、每一轮推理循环都在消耗Token。两三轮简单调用几千Token就够了,但几十上百轮的复杂任务,消耗到几十万。

这个判断很快就有了验证。龙虾,也就是OpenClaw,春节前后在中国爆发。它引发的效应跟去年DeepSeek对大模型的普及有几分相似。在它出现之前,绝大多数中国用户对Agent没有概念。企业里说"我们搞了Agent",打开一看就是一套提示词。龙虾让所有人第一次直观地看到Agent可以推理、循环、自主执行任务。这不是Demo,是能装在电脑上实际干活的东西。

龙虾还带来了一个附带效果:大量个人用户第一次体验了买模型API的过程。以前个人不会去买模型服务,现在各家Coding Plan都上了,199、499、1991,各种价位。Token第一次从开发者的术语变成了普通人花钱时看到的东西。火山的数据显示,春节后Coding Plan相关调用涨了15倍以上。

我把这种因龙虾和各类Agent产生的Token消耗增量叫做"虾粮生意"。在龙虾之前这个生意不存在。龙虾充当了Token消费的中间层:人给Agent下任务,Agent调模型消耗Token。Agent越能干,Token消耗越大。

武汉巡展上,火山引擎和OpenClaw创始人Peter Steinberger共同宣布ClawHub中国镜像站正式运营。Peter还用火山的ArkClaw龙虾给自己生成了一段视频,最后对着镜头说了句"请大家在武汉多吃龙虾"。在中国,龙虾和小龙虾已经是同义词了。


龙虾只是Agent浪潮的一个切面。火山同时在推企业级Agent落地:ArkClaw做敏态场景的个人生产力工具,HiAgent做稳态场景的组织级Agent管理。谭待在武汉提了"养虾三要素":模型、Skill、安全。火山刚通过信通院Agent类产品的两项权威安全认证,国内唯一同时拿到两项的厂商。

人类的注意力加Agent的虾粮,两股力量在不同时间点先后引爆、最终汇流。120万亿就是这么来的

比电复杂

Token有了中文名,官方给了它经济计量单位的定位。这让我想到一段更老的历史。

1888年,西屋电气有个叫Shallenberger的工程师在摆弄一盏弧光灯,一根弹簧掉在灯内搁板上。他注意到弹簧在转。三周后,他根据旋转磁场原理做出了第一个实用的交流电瓦时表。在那之前,爱迪生给客户算电费的方式是数灯头,你家几个灯泡就收你多少钱。瓦时表让电力第一次有了按量计费的商业模式。五年后的1893年芝加哥世博会,国际电气大会把千瓦时确立为电能的商业计量标准。从"数灯头"到"计千瓦时",电力产业的商业逻辑被重写。定价、交易、输配、监管,全围绕这个计量单位长出来了。

Token正在经历类似的时刻。两年前还是NLP工程师的内部术语,今天官方已经在国新办发布会上用"词元"统计产业数据了。"日均词元调用量140万亿"这种表述,听起来已经和"日产粗钢300万吨"是同一种句式。

但Token比电复杂得多。

一度电就是一度电。照明、炼钢、开电动车,物理属性不变,计量方式不变,价格只跟时段和区域有关。电是一维的:数量乘以单价,就是账单。

Token不一样,武汉巡展上的几个细节就能说明问题。

Seedance 2.0这次面向企业公测,火山引擎专门为它建了一套肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程,防侵权、防Deepfake。谭待在武汉的采访中提到,Seedance 2.0的API之所以到现在才对外开放,就是为了等这套版权保护系统搭好。你买一度电不需要关心这度电会不会侵犯谁的肖像权,但你消耗一百万Token生成一段视频,这个问题就跑不掉。

同样是消耗Token的Agent,管理方式也完全不同。谭待在武汉把企业Agent分成两类:敏态Agent和稳态Agent。敏态Agent强调探索,让员工拿ArkClaw这类工具去试新做法,是"创新试验场";稳态Agent强调流程化,在合同交易、生产线这类场景中把AI的最佳实践固定下来,用HiAgent做规模化管理。同样都在消耗Token,但一个追求灵活,一个追求确定,对模型能力、安全标准、运营方式的要求截然不同。

安全问题就更具体了。随着龙虾的使用量上升,沙箱权限失控、提示词注入、Skills插件投毒,这些威胁不断冒出来。之前Meta的AI安全总监把OpenClaw接了自己的工作邮箱,结果邮件被疯狂删除。一度电不会自己去删你的邮件,但一个Agent可能会。

电是一维的,数量乘以单价就是账单。Token是多维的:性能、模态、安全、工程复杂度,每一个维度都在影响这个计量单位的实际价值。谭待在采访中还讲了一个角度:不能抛开模型能力谈Token价格。seed 2.0 Lite比上一代的1.8 Pro能力更强,但定价更低,单个Token的"智力水平"在提升。同样花一块钱买Token,买到的东西和半年前已经不一样了。这种复杂性是机遇。谭待说过:如果把AI发展看作一场马拉松,现在才跑了500米,Token经济也是。

其实,连大模型领域的翻译工作都还没结束。OpenClaw很快就有了中文名"龙虾",但OpenClaw所属的AI领域Agentic AI到现在还没有一个让人满意的中文译名。叫"代理式AI",总觉得奇奇怪怪的;叫"智能体AI",又丢了原文里agentic那个自主行动、主动出击的劲儿。

不过,有时候,没有名字,也是一件好事。名字只是一个符号,就像左手指月,左手不是月。这代表我们可以更自由的想象它,也代表这个行业跑的太快,有Token量表的指针为证。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
密歇根大学凶猛火力创历史 和康大会师疯三决赛!

密歇根大学凶猛火力创历史 和康大会师疯三决赛!

体坛周报
2026-04-05 11:49:13
深圳楼市再传利好!深圳闲置商业办公等非居住建筑可改公共服务设施或学生宿舍

深圳楼市再传利好!深圳闲置商业办公等非居住建筑可改公共服务设施或学生宿舍

深圳梦
2026-04-05 20:15:57
川媒嘲讽德尔加多:去年坑我蓉,不原谅!鲁媒:他早该被罚下

川媒嘲讽德尔加多:去年坑我蓉,不原谅!鲁媒:他早该被罚下

建哥说体育
2026-04-05 08:15:20
王楚钦首夺世界杯冠军!三大赛第2冠 距离大满贯只差奥运金牌

王楚钦首夺世界杯冠军!三大赛第2冠 距离大满贯只差奥运金牌

念洲
2026-04-05 22:25:00
终于明白为啥大家都换苹果了,这5个核心优势,用过就再也回不去

终于明白为啥大家都换苹果了,这5个核心优势,用过就再也回不去

复转这些年
2026-03-15 23:05:42
俄外交部:美方放弃最后通牒式措辞有助于推动波斯湾局势缓和

俄外交部:美方放弃最后通牒式措辞有助于推动波斯湾局势缓和

财联社
2026-04-06 00:00:10
吴石案中一个被忽略的关键人物,如果不是她,很有可能大家都没事

吴石案中一个被忽略的关键人物,如果不是她,很有可能大家都没事

抽象派大师
2026-04-05 17:33:48
【蒙太古杯】U16女足0比4日本U16女足 无缘冠军

【蒙太古杯】U16女足0比4日本U16女足 无缘冠军

体坛周报
2026-04-06 02:08:13
洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

阿龙美食记
2026-02-28 10:49:43
消失的彭加木:一场精心策划的逃亡?隐藏在罗布泊的离奇秘密!

消失的彭加木:一场精心策划的逃亡?隐藏在罗布泊的离奇秘密!

观史搜寻着
2026-03-31 05:47:17
国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

南权先生
2026-02-12 15:41:39
贝克汉姆家大布:学历颜值双平平,却娶到白富美娇妻

贝克汉姆家大布:学历颜值双平平,却娶到白富美娇妻

述家娱记
2026-03-21 14:23:38
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
山东“跨界天花板”:这县一脚跨四省,本地人都分不清在哪省

山东“跨界天花板”:这县一脚跨四省,本地人都分不清在哪省

王二哥老搞笑
2026-04-05 06:17:29
61岁男子,坚持饿肚子不吃晚饭,6个月之后,血糖和体重情况如何

61岁男子,坚持饿肚子不吃晚饭,6个月之后,血糖和体重情况如何

蜉蝣说
2026-02-03 15:04:01
“我毫无优势” 赵心童回应赔率看好他掀翻世界第1 生涯奖金909万

“我毫无优势” 赵心童回应赔率看好他掀翻世界第1 生涯奖金909万

风过乡
2026-04-05 09:35:40
菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

小丸说故事
2026-03-17 14:23:29
河南女生午睡5小时被警告,硬气回怼引热议

河南女生午睡5小时被警告,硬气回怼引热议

水泥土的搞笑
2026-04-05 14:17:11
唏嘘!49岁前中超名将送外卖:1天收入三四百 李玮锋知情后伸援手

唏嘘!49岁前中超名将送外卖:1天收入三四百 李玮锋知情后伸援手

观察鉴娱
2026-03-16 09:36:46
伊朗外交部:已向调解方表达立场

伊朗外交部:已向调解方表达立场

上观新闻
2026-04-01 15:05:04
2026-04-06 03:23:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17425文章数 49697关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗官员提开放霍尔木兹海峡条件

头条要闻

伊朗官员提开放霍尔木兹海峡条件

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
游戏
家居
亲子
旅游

本地新闻

跟着歌声游安徽,听古村回响

三天鼠标干坏两个,你这还是自走棋嘛?

家居要闻

温馨多元 爱的具象化

亲子要闻

小英自曝给女儿剪短发原因!怕头发抢营养长不高,想剃光头太真实

旅游要闻

文明旅游|清明出游请注意!莫让这些不文明行为煞风景!

无障碍浏览 进入关怀版