这个世界生成与消耗的token正在激增,。AI的价值开始从芯片流向包括云服务与模型调用的AI基础设施,但是进一步流向应用,依然是雷声大雨点小。
进入2025年的最后一个季度,AI巨头每个月消耗的token数量,已经来到了千万亿(Quadrillion)的量级。这一数字很快还会继续倍增、以数量级增加。网页上的内容,AI生的已经开始超过人类发布的。
月初,谷歌AI Studio负责人Logan Kilpatrick披露,公司最近一个月消耗了1300万亿tokens。OpenAI也在宣传旗下API每分钟调用了60亿tokens,按该业务占公司收入25%折算,整个公司也达到了每月消耗1080万亿tokens水平。上周,字节跳动称,过去一个月的日均token调用超过30万亿,相当于每个月900万亿,动态来看,相当于跻身“千万亿俱乐部”。
![]()
如此庞大的token消耗量,真正爆发,也就几个月的时间。与这段时间相对应的,是多模态与智能体相关产品的渗透。它们都太吃token了。如果说,用户与AI进行一次对话,消耗的token数量为1个单位,那么,生成一段10秒钟的视频,消耗的token差不多是前者的3000倍,如果是深度研究,那么更是消耗了单次对话的百万倍之巨。
![]()
无论是视频生成,还是智能体应用,都将继续引领行业的token消耗。OpenAI想把自己的独立应用Sora打造成短视频的TikTok,开启新的货币化路径;奥特曼甚至想学马斯克,后者的Grok在X上通过“擦边”,吸引了不少流量;OpenAI甚至开始推出成人内容,可能想起了互联网早期是如何打开流量局面的。谷歌上周匆忙发布了Veo 3.1,它的Shorts已经加入了AI。字节跳动则通过豆包海外版Cici,悄然抢占拉美与东南亚市场。所有这些,都成为消纳token的新出口。
如果视频生成试图牢牢占据消费者心智与时间,那么智能体想蚕食的就是软件世界。就在这半个月内,OpenAI、Google、Anthropic三家大模型企业,都在智能体领域有所动作。在开发者日,OpenAI提出了AgentKit等一系列工具。几天后,谷歌发布了Gemini CLI Extensions,打造智能体的Gemini生态。又过了一周,Anthropic新推出更轻量级的Claude Skills,将智能体功能“封装”在“文件夹系统” 里,方便低门槛地嵌入工作流。
消耗token数量,已经成为一家企业AI含量的评估指标之一。已经至少30家企业,在OpenAI的平台上,调用了超过1万亿的tokens;此外,还有70家企业消耗了1千亿以上。
按去年的标准,万亿token这一数量级,可以吓人一跳。如果一次简单对话,平均输入输出1000个tokens,那么,单个用户足够对话10亿次;如果主要是输出,每秒钟吐出100个token,单个用户需要盯着屏幕300多年。但是,按照最近的标准,万亿tokens也就够产出1000份深度研究报告,一家咨询机构的研究员们想拿它做点早期调研工作,很快就花完了。如果按GPT-5的API价格计费,这差不多花费百万美元左右。
B2B服务正在积极买单。穿透到它们所服务的终端用户,OpenAI这些万亿token消耗量的大客户们,往往拥有庞大的用户规模与高频的调用需求;它们往往非常害怕错过,被时代所抛弃,愿意花钱试一试。事实上,它们也往往不依赖单一模型。
在OpenAI公布出来的名单中,开发者工具占比最高。代码审查的CodeRabbit、AI软件工程师的Cognition、AI终端的Warp,以及IDE和开发工具的JetBrains等等,都消耗了海量token,肯定远超万亿级别。其次就是鼓吹AI-First的传统SaaS服务,包括Salesforce、HubSpot与Zendesk等。大模型带来了垂直深度的企业服务市场,法律AI助手的Harvey,医疗AI文档的Abridge等AI原生应用也由此诞生。
但是,问题在于收益,尤其是具备用户黏性的经常性收益。以光速获得的收益,也许也会以光速失去。买家的热情可能是情绪性的。部分AI企业对外宣传的年度经常性收益(ARR),很可能是一次性的实验性收益。智能体服务更深地嵌入到客户系统与工作流中,需要花费大量时间与精力,也是维持用户粘性的摩擦成本。
最典型的之一,就是曾经的“氛围编码”(Vibe Coding),红极一时。但人们在尝试、付费之后开始流失。仅用8个月就成为AI独角兽的Lovable,已经开始回归12周前的热度。RolystAI与Datainsta创始人认为,过去的“氛围编码”明星都在“死去”;除了Base44,因为它还在烧钱打广告。
谷歌开发者智能高级总监Nicole Forsgren认为,代码行数是衡量生产力的糟糕的指标,AI生成代码加速并不意味着项目开发加速。美国METR研究所分析开发者的实际工作产出时,发现使用AI的开发者完成任务的速度,竟比不使用AI时慢了20%。
![]()
关键在于用了这些token都干什么了,能带来什么收益。消耗的token越多,意味着花费的成本越高。要想token经济学成立,而且不是在芯片厂商与AI基础设施厂商之间空转,要打通token经济学最后一环,提升并兑现这些token的价值。
目前,行业做的并不好。投资者兼作家Azeem Azhar估算,2025年与人工智能相关的数据中心年度支出约为4000亿美元,而同期人工智能收入约600亿美元。入不敷出,比互联网早期的光纤基建的泡沫时期还严重,后者资本支出仅为收入的4倍。
这也包括那些拿到了OpenAI万亿token消耗奖章的公司。它们当中有不少上市公司,包括语言学习应用Duolingo,设计软件Figma,企业服务HubSpot与Salesforce,在今年的AI泡沫浪潮中,市值不升反降。Duolingo是最积极拥抱AI的企业之一,从2021年开始就与OpenAI达成合作,也是OpenAI官网公布的首批GPT-4用例企业。但是,它大幅减少人工内容,引发了社区争议;它的部分功能的本身,也可以逐步被大模型所取代。事实上,按照常识,愿意如此公开的,往往已是AI应用的佼佼者,更多的企业收益或许更低。
而那些未上市的AI独角兽企业,估值仍在膨胀。企业搜索聊天机器人Glean,去年年度经常性收入约1亿美元,今年年中融资后估值72亿美元;AI搜索平台Perplexity的ARR约1.5亿美元,当前估值约200亿美元。FT报道说,还有不少年经常性收入约为 500 万美元的初创企业正在寻求 5 亿美元以上的估值;这令当年的SaaS热潮也相形见绌。
它们许多在工作中并不好用,没有兑现最值钱的那部分价值。有的可以部分增强人类的工作,但完全不是它所宣传的那样能替代员工。
行业对AI促进基础科研与完成经济价值任务,充满了过度的期待。OpenAI一位高管在推文中宣称 GPT-5 “解决”了多个长期未解的数学难题,但事实证明,这些问题其实已有解,只是未被收录或广为人知,GPT-5做的,不过是检索到了这些文献检索,而非创新证明。这遭到了哈萨比斯 (Demis Hassabis)、杨立昆(Yann LeCun)等竞争对手的嘲讽。
这当然并不意味着,AI最终无法如最狂热的支持者所宣称的那样,变成一场新的技术革命。但“最终”可能意味着漫长的等待。要实现token经济,打通最后一环,仍然需要解决很多技术问题与产品问题。
业内的大佬们正在冷静下来。年中的时候,苹果指出了大模型思考的幻象(The Illusion of Thinking),但由于,AI追赶迟缓了,还被质疑酸葡萄心理。但最近,强化学习之父 Richard Sutton的发言真的震撼到业界。他认为大模型根本没有学到“”,智能应该从“运行时”的经验中生长出来。此言一出,那些奉“苦涩的教训”为“圣经”的人们,不得不重新各自解读。
大神卡帕西是的一位。上周,他也对智能体、强化学习与AGI泼了一盆冷水。在他看来,传统的强化学习,信号效率极低,反馈又极其嘈杂,短期内不再看好,未来需要几次重要的算法更新;他还认为,智能体的能力还没跟上,工具却已经做得过头,没有现实地匹配当前能力和行业需求。即使乐观地看,我们离所谓的AGI也还要10年。
OpenAI研究副总裁Jerry Tworek则打了个圆场,认为自己正在做的事情离AGI可能不远,但对另一部分人来说可能并不如是。团队正在完善预训练方法,也在对强化学习作大量研究。OpenAI内部正在让模型工作更长时间,但还没找到合适的产品形态,来部署这种
黄仁勋把数据中心称为生产token的AI工厂,英伟达负责以越来越低的成本生产token。所有软硬件协同创新,都是为了以更少的GPU时间和更低的电力消耗产出更多的toke,但是,这些token能创造什么经济价值呢?
如果说2025年是AI基础设施真正爆发的一年,那么,2026年需要成为追逐token价值的一年。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.