近期,在海外主流的大模型API聚合平台OpenRouter的最新周度榜单中,出现了一个足以让行业侧目的数据:
平台Token总调用量前十名中,中国模型占据了四席,合计市场份额超过60%。
更具体的数据是,在平台前十模型约8.7万亿的总Token量中,中国模型独占了5.3万亿。其中,MiniMax的M2.5、月之暗面(Kimi)的K2.5以及智谱AI的GLM-5包揽了前三名,DeepSeek V3.2位列第五。
这一现象的背后,并非单一因素驱动。
首先,特定场景的爆发成为核心推手。
编程(Coding)和智能体(Agent)工作流成为主战场,这些模型不再仅仅是用来聊天,而是被大量用于代码生成和自动化任务。
例如,MiniMax M2.5被证实带动了100K至1M长文本区间的增量调用,这正是智能体处理复杂任务时的典型消耗场景。
其次,成本与性能的拐点让开发者“用脚投票”。
对于全球开发者而言,性价比是硬道理。有评价称,这些国产模型提供了“Sonnet(Claude中阶模型)级别的水准,但价格低了八成”,这种极低的推理成本,使得原本因为成本高昂而无法启动的开发者项目得以大规模落地。
这一数据背后的意义,远超“国产模型好用”这一表层信息,它标志着一种全新的出口模式正在形成。
传统上,中国的科技出口多以硬件(如手机、服务器)为主,但现在,通过API接口,中国正在向全球输送一种无形的商品——Token。
Token的本质是算力与电力的数字化交付,当一个美国开发者调用中国大模型的API时,数据跨越太平洋,但在国内的数据中心消耗电力完成计算,结果再传回。
在这个过程中,中国的电力和算力基础设施,通过Token的形式完成了跨境服务贸易。
这种通过API进行的电子传输,受益于WTO多年前确立的“电子传输关税豁免”规则,相当于为中国AI企业铺设了一条数字时代的“免税高速公路”,让算力成为了一种可以直接出口的标准化商品。
然而,客观审视这一现状,仍需保持冷静。
首先,OpenRouter是一个特殊的战场。
它是一个API聚合平台,主要用户是开发者、极客以及需要统一账单和技术集成的中小型企业。
那些直接使用ChatGPT或Claude官网的普通用户,或者直接与大厂签约的大型企业客户,并不在这个统计范围内。
因此,这个榜单反映的是“开发者市场”的偏好,尚不能完全等同于全球AI使用的全貌。
有观点指出,真正消耗海量Token的顶级企业客户,往往直接对接模型厂商,不会绕道聚合平台。
其次,免费与低价策略的双刃剑效应不容忽视。
此次中国模型的霸榜,与厂商的市场策略密不可分。例如,MiniMax M2.5发布初期在Cline和Kilo等平台有免费推广活动,这无疑吸引了大量尝鲜用户。
虽然免费是互联网通用的获客手段,但也意味着这种市场份额的维持需要巨大的资金支持。一旦补贴退去,留存率将面临考验。
此外,中外市场的错位竞争也需正视。
目前的格局反映了中外大模型市场的不同发展阶段。海外(美国)市场更成熟,企业级应用需求大,开发者对API的稳定性、长上下文处理能力要求极高。
国产模型目前主攻的编程和智能体场景,恰好切中了海外开发者最痛的“降本增效”需求。
而国内市场竞争极其内卷,且更多聚焦于C端应用和特定行业落地。虽然单个平台如豆包的日处理Token量远超OpenRouter整体规模,但国内市场的内卷与海外市场的拓展逻辑截然不同。
最后,基础设施的隐忧依然存在。虽然我们在应用层表现活跃,但底层逻辑依然受制于人。
Token的生产成本核心是算力(GPU折旧)和电力。
目前高端GPU依然面临供应限制,且部分国产模型在实测中被指出因底层依赖特定国产芯片,导致推理速度相对较慢。这意味着我们在“狂飙”Token产量的同时,底层基础设施的自主性和效率仍需追赶。
中国模型在OpenRouter上的表现,是中国AI产业的一次重要突围。它证明了在特定的技术路径(长文本、智能体)和极致的性价比策略下,中国模型已经具备了在全球开发者市场中成为“生产级工具”的能力。
但这并非终点,如何从“开发者喜爱”转化为“企业级依赖”,如何在去除补贴后依然保持竞争力,将是接下来更严峻的考验。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.