![]()
©️新博弈
文丨 桨声
根据全球知名大模型API调用平台OpenRouter最新数据,3月30日至4月5日,中国AI大模型周调用量达12.96万亿Token,环比暴涨31.48%,连续五周超越美国。同期美国调用量仅3.03万亿Token,不及中国的四分之一。
这个数字意味着什么?平均每天有近2万亿Token的“智能”从中国模型流向全球开发者,相当于每天“吞吐”掉一个维基百科全部内容的好几倍。
![]()
图片来源:OpenRouter 官网
调用量前六的模型清一色来自中国——阿里的千问(占据第一和第三)、小米的MiMo、阶跃星辰、DeepSeek、MiniMax。有意思的是,支撑这些数据的“主力军”并非中国开发者:OpenRouter平台美国用户占47%,中国仅占6%。硅谷的程序员、欧洲的创业公司、东南亚的企业主,正在用真金白银给中国AI投票。
这场“逆袭”快得令人措手不及。其底层逻辑并非单纯的技术超越或价格战优势,那么,真正的原因究竟是什么?
电费单,一张底牌
先说一个让硅谷睡不着觉的事实:训练和运行AI模型,正在成为21世纪最耗电的工程之一。
英伟达创始人兼CEO黄仁勋在3月的一篇博客中,将AI产业拆解成五个层面:能源、芯片、基础设施、模型、应用。他特别强调:“能源是AI的第一性原理,也是系统能产生多少智能的根本约束。”
这话翻译成大白话就是:你想让AI变聪明,先问问电网答不答应。
而美国电网,最近有点“答不上来”了。
AI的算力膨胀正剧烈冲击美国电力系统。2026年初,微软因西弗吉尼亚州的数据中心电网接入延迟,被迫自建燃气轮机;谷歌则斥巨资签下核电合同,为AI“喂电”。
然而,并非所有成本都能由企业自身消化。在美国中西部多州,这场竞赛已开始推高民生电价,部分公用事业公司已申请新一轮涨价。AI竞赛的代价,正从科技巨头的财报,转移到美国普通家庭的账单上。
与此同时,中国的情况几乎是另一个故事。
根据国家能源局2026年1月公布的数据,2025年中国全社会用电量约10.37万亿千瓦时,超过美国的两倍,高于欧盟、俄罗斯、印度、日本的总和。
这个数字背后,是全球最大的电力基础设施和具有竞争力的电价水平。中国西部绿电(风电、光伏)的成本可以压到0.2元/度左右,工业用电整体成本低于欧美多数地区。
更关键的不是电价本身,而是“东数西算”工程带来的结构性优势。中国将数据中心直接建在西部绿电富集区,便宜的清洁能源就地转化为算力,再通过光纤输送到全国乃至全球。
这套模式实现了“电力不出境、价值已跨境”的商业闭环。西部的风,点亮了东部的屏幕,也支撑起了全球开发者的AI应用。
这套“电费优势”直接体现在了API价格上。
以OpenRouter平台为例:美国Claude Opus 4.6模型的输入价格为5美元/百万Token,输出价格高达25美元/百万Token;而中国MiniMax M2.5的输入价格仅为0.3美元/百万Token,输出价格低于2.5美元/百万Token。
同样是写代码的任务,用中国模型的成本只有美国竞品的十分之一。
一名硅谷开发者在社交媒体上算过账:他的团队每月调用约50亿Token,如果用美国模型,月账单约2500美元;切换到中国模型后,这个数字降到了200美元出头。
这就是调用量数据的底层逻辑。不是中国AI突然比美国AI“聪明”了,而是中国AI突然比美国AI“便宜”了一个数量级。
当便宜了一个数量级,“足够好用”就赢了“最好”。这不是国产情怀,是商业理性。全球开发者,正在用脚投票。
算得更巧,练得更实
传统大模型的问题在于:每次推理都要调动全部参数,无论问题是简单还是复杂。好比公司无论开什么会,都叫上所有人,效率自然低了。
包括DeepSeek在内,中国主流大模型普遍采用MoE(混合专家)架构,就像给庞大的“公司”配了一套门禁系统:它只让最相关的几位“专家”进场处理问题,其余继续待命。
![]()
图片来源:千问官网
这套“按需激活”的模式,让模型在保持庞大知识储备的同时,将实际计算量压缩到原来的几分之一。
以阿里千问为例,其MoE架构使得推理成本大幅降低,这也是千问敢推出“免费版”,并仍能维持商业可持续的核心原因。
但这还不是全部。中国AI的另一张底牌,在制造业的车间里。
如果说美国AI的“练兵场”是硅谷的实验室和华尔街的交易大厅,那么中国AI的“练兵场”则是全球最完整的工业产业链。
从精密电子制造到重型机械,从供应链管理到质量检测,每一个环节都孕育着真实、迫切且高价值的AI落地需求。这些需求不是实验室里的模拟场景,而是关乎企业生存的硬指标。
当AI技术被投入到这些真实环境中,它必须直面数据噪音、极端工况和成本控制的挑战。这种严苛的“实战”反而倒逼技术快速迭代。
更重要的是,工业场景产生的海量、多维、高质量数据,是训练和优化AI模型的宝贵燃料。
2026年3月,达摩院发布了一款名为玄铁C950的RISC-V架构CPU,首次在单颗CPU上跑通了DeepSeek V3 671B全量大模型推理,Qwen3 30B可达80 tokens/秒。
这是RISC-V阵营第一次真正进入顶级AI算力的“朋友圈”。玄铁的故事揭示了一个更深的趋势:当AI推理需求爆发、当物理AI(具身智能、机器人)成为新战场,定制化、低功耗、可扩展的芯片架构正在获得历史性机遇。
这套“从能源到芯片到模型到应用”的系统能力,最终凝结成Token的极致性价比。它不是某一项技术的单点突破,而是一个系统工程的胜利。
赢了吗?还早
数字漂亮,就是赢了吗?几个不容忽视的事实,需要先看清楚。
首先,调用量的领先不等于技术实力的全面超越。
![]()
图片来源:欧洲电子行业媒体”eeNews Europe”官网
在核心芯片领域,英伟达最新的Feynman架构GPU(预计2028年推出)单颗功耗将突破5千瓦,性能仍将领先行业一个身位。在基础算法创新上,美国依然保持着原创优势。调用量反映的是市场需求和商业化能力,而非基础研究的全部。
其次,价格战可以赢一时,但赢不了一世。
彭博社、《华尔街日报》分析指出,中国AI模型的海外用户中,相当一部分是冲着“便宜”来的。
这意味着,一旦美国模型的成本下降,比如通过更先进的芯片或更高效的架构,或者中国电价优势被削弱,这部分用户可能会迅速回流。
再者,AI的安全与治理问题正在成为新的竞争维度。
欧盟《AI法案》已经生效,美国各州也在加紧立法。中国AI出海,不仅要面对技术竞争,还要应对日益复杂的监管环境。
该法案要求“高风险”AI系统必须在投放前后进行合规评估,包括对非歧视性与基本权利影响的审查,提供必要的透明度与人类监督机制。
但不可否认的是,这场由“电费单”引发的权力转移,正在改写全球AI产业的游戏规则。
Token正在成为数字时代的新型“大宗商品”。就像石油之于工业时代,算力之于智能时代。而中国,凭借能源成本、基建能力和制造业生态的三重优势,正在成为Token的“世界工厂”。
值得关注的是,这可能是中国第一次在信息技术革命的基础设施层占据先机。
在PC时代,中国是英特尔和微软的“组装车间”;在移动互联网时代,中国是iOS和Android的“应用工厂”;但在AI时代,从能源到芯片到模型到应用,中国正在形成一套相对完整的闭环。
如今,这套闭环的初步成果已经显现。
OpenRouter数据显示,中国模型不仅在调用量上领先,在用户结构上也越来越“全球化”。美国开发者用中国模型写代码,欧洲创业公司用中国模型做产品,东南亚企业用中国模型降本增效。这是中国AI从未有过的全球影响力。
这场竞赛还没结束。高端芯片的瓶颈、品牌认知的短板、行业利润的压力,都是必须正视的挑战。但有一点是确定的:在AI这场“重工业化”的浪潮中,能源是最后的硬约束。
而中国手里,握着最硬的那张牌。剩下的,就看怎么打了。
新博弈(ID:newgametheory)原创
转载请注明来源、作者署名,违者必究
━━ 已入驻平台 ━━
━━ 视频号 已入驻平台 ━━
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.