记者观察丨Token经济学，正在锁定“闭环点”|黄仁勋|智能体|大模型|人工智能|token

记者观察丨Token经济学，正在锁定“闭环点”

分享至

21世纪经济报道记者赵云帆

最近，A股股民们突然发现，财报增长几乎停滞的中国电信（601728.SH），在5月刚刚过半时，股价竟然一度走出接近20%的历史级半月涨幅。

人们为其突然爆发寻找原因时发现，围绕电信行业十几年以来的叙事逻辑，正在因AI时代的到来而发生彻头彻尾的改变。

2026年，中国人工智能行业正以过去互联网时代从未有过的速度，从“免费模式”快速向“收费模式”过渡。

例如，国民级大语言模型“豆包”于今年5月初推出了付费订阅服务，标志着国内大模型“全免费”格局首次松动。

无独有偶，包括中国电信在内的国内三大运营商，也分别推出了面向个人、家庭和开发者、企业客户的试商用Token套餐，为AI算力进入“话费账单时代”写下了注脚。

此情此景，似乎印证了英伟达CEO黄仁勋在今年年初关于AI货币化的预言。

3月，黄仁勋在开发者大会上公开提出了“Token是新的货币”的理念；不久后，在摩根士丹利TMT论坛上，他又尝试给出了“算力即Token，Token即智能，智能即产值（output）”的中观经济框架。

弦外之音则是，黄仁勋认为，所有AI经济参与者，都必须锚定AI作为未来的生产方式，并在其中寻找自己的经济定位。

Token经济学其实不是一个新词。早在区块链时代，Tokenomics（代币经济学）一词就被用于描述某一种虚拟代币在发行、分配、激励规则下的微观经济形态。

然而，属于人工智能的“Tokenomics”，至少从目前的发展阶段来看，其产业分工尚未完全明确。混沌之中，所有AI产业相关方仍在摸索它的规则与边界。

与此同时，在百舸争流的时代洪流下，所有的玩家又显得极其焦虑。

上游：不甘寂寞的“云”

当黄仁勋将未来的数据中心定义为“Token工厂”时，他想描绘的是一幅算力直接变现的图景：固定的电力输入，通过最高效的算电协同架构，转化为源源不断的Token产出。

谁是其中的胜利者？按照黄仁勋在摩根士丹利TMT大会上的提法：能将单位电力转化为更多、更高效Token的云厂商，有望拔得头筹。

或许这是一个非常务实的、立足云服务厂商自身定位和未来趋势的判断——但它却忽略了玩家们发现新大陆之后，试图加速“圈地”的冲动。

5月17日，上海电信、上海联通等分别宣布推出试商用多档位Token套餐。同日，上海移动也加入战局，喊出“1元40万tokens”的价格。

需要稍作解释的是，Token是基于训练完毕模型的“推理代币”。但三大运营商本身并未研发第一梯队的人工智能模型，因此他们售卖的是其他头部模型公司基于其云计算集群所产生的Token。

简而言之，云商的玩法，是与模型厂商的一种“竞合”。

作为背景，国家数据局的统计数据显示，自2024年以来，国内日均Token调用量从1000亿跃升至2025年底的100万亿，到2026年3月已突破140万亿，两年增长超千倍。

在需求大增的背景下，DeepSeek等开源模型的涌现，使得大模型能力足够普惠，也让AI能力先天不足的运营商得以“借力打力”。

近日，中国电信董事长柯瑞文公开表示，公司以Token经营为主线，在生产端打造高并发、低时延的Token规模化生产能力。中国电信的野心还不止于此，柯瑞文称，中国电信在应用端服务3.7万家行业客户，已打造110余个行业大模型和350余个智能体，未来也将以解决方案供应商的模式，直接打通从云算力到AI生产力的全套链路。

正如东吴证券分析，目前算力租赁厂商的业务模式正从单纯的裸算力出租，升级为模型服务或Token分成模式，即从“卖算力”转向“卖Token”。

而对于正在快速消耗巨大现金流的AI模型公司，服务货币化已是一个迫在眉睫的问题。

5月，字节跳动旗下“豆包”在苹果App Store更新订阅声明，推出标准版（连续包月68元）、加强版（连续包月200元）、专业版（连续包月500元）三档付费套餐。对此，豆包官方回应称，基础版仍完全免费，付费功能将主要聚焦于复杂任务和生产力场景，如PPT生成、影视脚本制作、数据分析等。

面对目前货币化最顺畅的代码/智能体需求，每家基础模型公司都在针对性提供套餐。

例如，3月以来，MiniMax推出了全模态“TokenPlan”，阶跃星辰上线了25元/月起的4档“StepPlan”，智谱则推出了“CodingPlan”系列，月费最高达150元。这些套餐多聚焦于AI智能体开发、编程辅助等B端场景。

侧重智能体开发和应用的套餐也被各大模型厂商重点推荐，比如腾讯的特色打法就是基于智能体开发的Workbuddy和智能体应用平台QClaw——这一打法的底层逻辑自然与智能体类产品“可以不知不觉消耗大量Token”的特性有关。

货币化策略除了“开源”，也要“节流”，而其带来的用户体验滑坡显而易见。

社交媒体上，大量用户发现AI对话中断概率突然增加。各大基模厂商动态限流的“公开操作”与“暗箱操作”层出不穷：公开层面如限制访问次数、限制Token使用上限等；系统层面，利用各类技术手段阻断复杂思考请求、限制输出长度的做法也屡见不鲜。

黄仁勋在演讲中指出，2026年以来，AI市场最核心的转变是从“训练”全面走向“推理”，他更预言在推理时代，所需的Token量和计算量相比训练阶段将增加约一万倍。

同时，他还为基础模型Token价格设定了其认为的五级模型：免费级、中等级、高层级、高速级和顶层级。每个级别自第二级开始，价格从每百万Token 3美元，到顶层150美元不等。

这一言论，在随后几个月中影响了当前基础模型市场的定价格局，比如Anthropic和OpenAI的顶级模型服务均已按约150美元/百万Token的标准收费。

但是，Token的“度量衡”仍然极不统一——因其具备独属于特定模型的可编程特性，加上技术尚未收敛，各家Token能达到的效果和性价比仍然大相径庭。

下游：没有锚点的“端”

与如火如荼的云计算、大模型领域不同，“Token经济学”的最下游，也就是智能体应用经济，目前仍然处于一片混沌。

一个普遍认知是，当下AI的终端需求绝大部分来自代码相关需求。例如，根据OpenRouter 2025至2026年的追踪数据，编程相关任务的Token消耗占比从去年的11%飙升至50%以上。

这些Token消耗量，大部分被全球（含硅谷）开发者用于智能体编程、深层代码审查（decoding）等工具相关场景。这些任务的Token消耗，相比单纯的“写代码”要高出数个量级。

这有点像产业下游的互相消化，却找不到终端客户的样子。

2025年初，我们一度认为找到了AI终端需求的突破口。来自中国的通用AI智能体Manus（蝴蝶效应）凭借一段演示视频一夜爆火，体验码一度被炒至数万元人民币，被业界视作“DeepSeek级别的现象级突破”。2025年12月，Manus高调宣布将被Meta以约20亿美元的价格收购。但不久之后，这场交易在次年4月被中国相关部门依法叫停，成为《外商投资安全审查办法》实施后首个被公开叫停的AI领域外资收购案。

有意思的是，对于Manus交易被叫停，AI圈子里的反应却与许多圈外人的思考方式不同。

“扎克伯格可能要感谢中国，既获得了热度，又不用真的花钱。”——AI圈子里充斥着类似交易“货不对板”的讨论，认为Manus在大量实际使用中，虽展现较好的泛用性，但实用性和完成度远远不足。

部分市场人士甚至认为，Meta计划耗资数十亿美元，或许只是为了弥补公司在AI基模与AI应用端的缺位，更像是一场借题发挥。

另一个标志性事件是“小龙虾”OpenClaw的快速遇冷。

它曾被誉为“人类历史上最受欢迎的开源项目”，被认为在几周内就超越了Linux过去30年的成就。但是，当人们尝试用自己的套餐接入该智能体时却发现，大模型厂商们对其态度显得极其“暧昧”。

例如，在OpenClaw大火之时，Anthropic立即切断了第三方工具对其订阅套餐的访问权限。这迫使用户转向按量付费接口调用，导致OpenClaw使用成本暴涨10至50倍，大量用户被劝退。

当然，OpenClaw远没有凉透，开源社区的代码仍在被不同用户不断上传更新，但所有使用者都得小心翼翼地掐着自己的“Token水表”，防止突发的请求溢出导致天价账单。

这其实引出了一个更根本的问题：在互联网时代，我们见证了从淘宝、微信到抖音等各类杀手级应用的出现。

但在AI时代，什么样的应用，能成为消耗海量Token、并创造相应价值的“锚点”？

近期，阿里宣布已将“通义千问”与淘宝深度打通。在阿里的构想中，通过千问打造的淘宝智能体，实现智能推荐、点单、购物，或许能增加电子货架的消费频次，或者提升商铺佣金的货币化潜力。

但是，至少从现在来看，人们无法完全信任智能推荐，无法相信AI会给自己找到最实惠的价格，甚至无法确认智能体是否用对了该用的优惠券。

更不用说，我们期待一个完全AI原生的智能体应用，能让我们心甘情愿地为之付出大量真金白银。

而“Token经济学”，至今仍缺失那个令人信服的“商业闭环”。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.