21世纪经济报道记者 赵云帆
最近,A股股民们突然发现,财报增长几乎停滞的中国电信(601728.SH),在5月刚刚过半时,股价竟然一度走出接近20%的历史级半月涨幅。
人们为其突然爆发寻找原因时发现,围绕电信行业十几年以来的叙事逻辑,正在因AI时代的到来而发生彻头彻尾的改变。
2026年,中国人工智能行业正以过去互联网时代从未有过的速度,从“免费模式”快速向“收费模式”过渡。
例如,国民级大语言模型“豆包”于今年5月初推出了付费订阅服务,标志着国内大模型“全免费”格局首次松动。
无独有偶,包括中国电信在内的国内三大运营商,也分别推出了面向个人、家庭和开发者、企业客户的试商用Token套餐,为AI算力进入“话费账单时代”写下了注脚。
此情此景,似乎印证了英伟达CEO黄仁勋在今年年初关于AI货币化的预言。
3月,黄仁勋在开发者大会上公开提出了“Token是新的货币”的理念;不久后,在摩根士丹利TMT论坛上,他又尝试给出了“算力即Token,Token即智能,智能即产值(output)”的中观经济框架。
弦外之音则是,黄仁勋认为,所有AI经济参与者,都必须锚定AI作为未来的生产方式,并在其中寻找自己的经济定位。
Token经济学其实不是一个新词。早在区块链时代,Tokenomics(代币经济学)一词就被用于描述某一种虚拟代币在发行、分配、激励规则下的微观经济形态。
然而,属于人工智能的“Tokenomics”,至少从目前的发展阶段来看,其产业分工尚未完全明确。混沌之中,所有AI产业相关方仍在摸索它的规则与边界。
与此同时,在百舸争流的时代洪流下,所有的玩家又显得极其焦虑。
上游:不甘寂寞的“云”
当黄仁勋将未来的数据中心定义为“Token工厂”时,他想描绘的是一幅算力直接变现的图景:固定的电力输入,通过最高效的算电协同架构,转化为源源不断的Token产出。
谁是其中的胜利者?按照黄仁勋在摩根士丹利TMT大会上的提法:能将单位电力转化为更多、更高效Token的云厂商,有望拔得头筹。
或许这是一个非常务实的、立足云服务厂商自身定位和未来趋势的判断——但它却忽略了玩家们发现新大陆之后,试图加速“圈地”的冲动。
5月17日,上海电信、上海联通等分别宣布推出试商用多档位Token套餐。同日,上海移动也加入战局,喊出“1元40万tokens”的价格。
需要稍作解释的是,Token是基于训练完毕模型的“推理代币”。但三大运营商本身并未研发第一梯队的人工智能模型,因此他们售卖的是其他头部模型公司基于其云计算集群所产生的Token。
简而言之,云商的玩法,是与模型厂商的一种“竞合”。
作为背景,国家数据局的统计数据显示,自2024年以来,国内日均Token调用量从1000亿跃升至2025年底的100万亿,到2026年3月已突破140万亿,两年增长超千倍。
在需求大增的背景下,DeepSeek等开源模型的涌现,使得大模型能力足够普惠,也让AI能力先天不足的运营商得以“借力打力”。
近日,中国电信董事长柯瑞文公开表示,公司以Token经营为主线,在生产端打造高并发、低时延的Token规模化生产能力。中国电信的野心还不止于此,柯瑞文称,中国电信在应用端服务3.7万家行业客户,已打造110余个行业大模型和350余个智能体,未来也将以解决方案供应商的模式,直接打通从云算力到AI生产力的全套链路。
正如东吴证券分析,目前算力租赁厂商的业务模式正从单纯的裸算力出租,升级为模型服务或Token分成模式,即从“卖算力”转向“卖Token”。
而对于正在快速消耗巨大现金流的AI模型公司,服务货币化已是一个迫在眉睫的问题。
5月,字节跳动旗下“豆包”在苹果App Store更新订阅声明,推出标准版(连续包月68元)、加强版(连续包月200元)、专业版(连续包月500元)三档付费套餐。对此,豆包官方回应称,基础版仍完全免费,付费功能将主要聚焦于复杂任务和生产力场景,如PPT生成、影视脚本制作、数据分析等。
面对目前货币化最顺畅的代码/智能体需求,每家基础模型公司都在针对性提供套餐。
例如,3月以来,MiniMax推出了全模态“TokenPlan”,阶跃星辰上线了25元/月起的4档“StepPlan”,智谱则推出了“CodingPlan”系列,月费最高达150元。这些套餐多聚焦于AI智能体开发、编程辅助等B端场景。
侧重智能体开发和应用的套餐也被各大模型厂商重点推荐,比如腾讯的特色打法就是基于智能体开发的Workbuddy和智能体应用平台QClaw——这一打法的底层逻辑自然与智能体类产品“可以不知不觉消耗大量Token”的特性有关。
货币化策略除了“开源”,也要“节流”,而其带来的用户体验滑坡显而易见。
社交媒体上,大量用户发现AI对话中断概率突然增加。各大基模厂商动态限流的“公开操作”与“暗箱操作”层出不穷:公开层面如限制访问次数、限制Token使用上限等;系统层面,利用各类技术手段阻断复杂思考请求、限制输出长度的做法也屡见不鲜。
黄仁勋在演讲中指出,2026年以来,AI市场最核心的转变是从“训练”全面走向“推理”,他更预言在推理时代,所需的Token量和计算量相比训练阶段将增加约一万倍。
同时,他还为基础模型Token价格设定了其认为的五级模型:免费级、中等级、高层级、高速级和顶层级。每个级别自第二级开始,价格从每百万Token 3美元,到顶层150美元不等。
这一言论,在随后几个月中影响了当前基础模型市场的定价格局,比如Anthropic和OpenAI的顶级模型服务均已按约150美元/百万Token的标准收费。
但是,Token的“度量衡”仍然极不统一——因其具备独属于特定模型的可编程特性,加上技术尚未收敛,各家Token能达到的效果和性价比仍然大相径庭。
下游:没有锚点的“端”
与如火如荼的云计算、大模型领域不同,“Token经济学”的最下游,也就是智能体应用经济,目前仍然处于一片混沌。
一个普遍认知是,当下AI的终端需求绝大部分来自代码相关需求。例如,根据OpenRouter 2025至2026年的追踪数据,编程相关任务的Token消耗占比从去年的11%飙升至50%以上。
这些Token消耗量,大部分被全球(含硅谷)开发者用于智能体编程、深层代码审查(decoding)等工具相关场景。这些任务的Token消耗,相比单纯的“写代码”要高出数个量级。
这有点像产业下游的互相消化,却找不到终端客户的样子。
2025年初,我们一度认为找到了AI终端需求的突破口。来自中国的通用AI智能体Manus(蝴蝶效应)凭借一段演示视频一夜爆火,体验码一度被炒至数万元人民币,被业界视作“DeepSeek级别的现象级突破”。2025年12月,Manus高调宣布将被Meta以约20亿美元的价格收购。但不久之后,这场交易在次年4月被中国相关部门依法叫停,成为《外商投资安全审查办法》实施后首个被公开叫停的AI领域外资收购案。
有意思的是,对于Manus交易被叫停,AI圈子里的反应却与许多圈外人的思考方式不同。
“扎克伯格可能要感谢中国,既获得了热度,又不用真的花钱。”——AI圈子里充斥着类似交易“货不对板”的讨论,认为Manus在大量实际使用中,虽展现较好的泛用性,但实用性和完成度远远不足。
部分市场人士甚至认为,Meta计划耗资数十亿美元,或许只是为了弥补公司在AI基模与AI应用端的缺位,更像是一场借题发挥。
另一个标志性事件是“小龙虾”OpenClaw的快速遇冷。
它曾被誉为“人类历史上最受欢迎的开源项目”,被认为在几周内就超越了Linux过去30年的成就。但是,当人们尝试用自己的套餐接入该智能体时却发现,大模型厂商们对其态度显得极其“暧昧”。
例如,在OpenClaw大火之时,Anthropic立即切断了第三方工具对其订阅套餐的访问权限。这迫使用户转向按量付费接口调用,导致OpenClaw使用成本暴涨10至50倍,大量用户被劝退。
当然,OpenClaw远没有凉透,开源社区的代码仍在被不同用户不断上传更新,但所有使用者都得小心翼翼地掐着自己的“Token水表”,防止突发的请求溢出导致天价账单。
这其实引出了一个更根本的问题:在互联网时代,我们见证了从淘宝、微信到抖音等各类杀手级应用的出现。
但在AI时代,什么样的应用,能成为消耗海量Token、并创造相应价值的“锚点”?
近期,阿里宣布已将“通义千问”与淘宝深度打通。在阿里的构想中,通过千问打造的淘宝智能体,实现智能推荐、点单、购物,或许能增加电子货架的消费频次,或者提升商铺佣金的货币化潜力。
但是,至少从现在来看,人们无法完全信任智能推荐,无法相信AI会给自己找到最实惠的价格,甚至无法确认智能体是否用对了该用的优惠券。
更不用说,我们期待一个完全AI原生的智能体应用,能让我们心甘情愿地为之付出大量真金白银。
而“Token经济学”,至今仍缺失那个令人信服的“商业闭环”。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.