智造观察 | Token(词元)出海，国产大模型杀入美国B端市场|百川|kimi|b端市场|token

分享至

来源：市场资讯

（来源：洪泰智造）

智造观察 | Token(词元)出海，国产大模型杀入美国B端市场

作者：玻色子

导语

2026年3月，在奥斯汀举办的SXSW（西南偏南）大会上，Cloudflare CEO Matthew Prince抛出了一枚"重磅炸弹"：这家服务全球超过20%网站的互联网基础设施巨头，已全面将其AI推理服务从闭源模型迁移至月之暗面（Moonshot AI）的Kimi K2.5，推理成本直降77%。

这不是一个孤立事件。当我们将视线拉长，会发现一个清晰的趋势正在形成——中国大模型的"Token出海"时代已经到来。继DeepSeek以开源模型撬动全球市场后，以月之暗面、智谱AI、零一万物、百川智能、MiniMax为代表的"国产大模型五小龙"，正在以API调用的形式，悄然占领全球开发者的工具链。

这背后，是一场关于算力成本、模型性能与地缘博弈的深层较量。

一、Cloudflare的"投名状"：为什么选Kimi？

1.1 77%的成本降幅意味着什么？

让我们先算一笔账。

Cloudflare Workers AI平台每天处理的推理请求数以百亿计。以GPT-4级别的模型为例，每百万Token的输入成本约为30美元，输出成本约为60美元。而Kimi K2.5的定价策略极具侵略性——输入价格仅为每百万Token 3美元，输出价格为每百万Token 12美元。

简单的数学：同等性能下，Kimi的成本仅为闭源竞品的20%-30%。

对于Cloudflare这样的基础设施巨头而言，这意味着每年数亿美元的直接成本节约。Matthew Prince在SXSW演讲中没有掩饰这一选择的商业逻辑："企业客户不关心模型是谁训练的，他们只关心三件事——响应速度、准确率和账单金额。"

1.2 技术层面的"临门一脚"

成本只是表面，性能才是内核。

Kimi K2.5之所以能够通过Cloudflare的严格技术评估，关键在于其在长文本处理（Long Context）领域的突破。该模型支持高达256,000 Token的上下文窗口，在特定测试场景下更可扩展至200万汉字——这意味着它可以一次性处理整本长篇小说、完整代码库或数小时的视频会议记录。

对于Cloudflare的B端客户（主要是SaaS公司和开发者）而言，这一能力直接转化为产品竞争力。想象一下：一个法律Tech产品可以一次性分析数百页的合同文本；一个代码助手可以理解整个项目的架构而非单个文件；一个客服机器人可以记住用户过去一年的所有交互记录。

Kimi在长文本领域的技术壁垒，成为了打破欧美客户"品牌偏见"的利器。

二、Token出海的战略地图：四小龙的差异化路径

如果将大模型出海比作一场战役，那么DeepSeek打响的是"开源革命"的枪声，而五小龙正在打的是一场更为精细的"API渗透战"。

2.1 月之暗面：长文本+C端口碑的"双轮驱动"

出海路径：To C产品建立品牌认知 → To B API实现商业变现

月之暗面的策略可以概括为"农村包围城市"。在国内市场，Kimi智能助手已经积累了超过2000万月活用户，其"支持200万字长文本"的卖点深入人心。这种C端品牌势能，为其B端API出海提供了天然的信任背书。

在海外市场，月之暗面采取了"农村包围城市"的策略：

第一阶段：通过开发者社区（GitHub、Hacker News、Reddit）建立技术口碑
第二阶段：与Cloudflare、AWS等云平台合作，进入企业采购名单
第三阶段：直接服务海外SaaS公司，成为其AI能力的基础设施

关键数据：据OpenRouter平台数据，Kimi K2.5周调用量稳居全球前五；在Cloudflare上架后，海外开发者调用量持续增长，北美和欧洲市场贡献超过60%。

2.2 智谱AI：清华系的技术正统与开源生态

出海路径：开源模型建立生态 → 企业级服务收割价值

智谱AI的出海策略与其技术基因一脉相承——稳扎稳打，重视生态。

2024年，智谱先后开源了ChatGLM3-6B和GLM-4系列模型，在Hugging Face上的累计下载量超过3000万次。这一开源策略为其赢得了全球开发者社区的广泛认可。据智谱官方披露，其企业级API服务已覆盖超过50个国家和地区，海外收入占比从2024年初的5%提升至2026年初的35%。

智谱的核心优势在于其"全栈自研"的技术实力。从底层算子优化到上层应用框架，智谱拥有完整的自主知识产权。这在当前地缘政治日趋复杂的背景下，成为了其服务海外敏感行业客户（如金融、政务）的重要筹码。

2.3 零一万物：李开复的国际化视野与硬件协同

出海路径：海外市场优先 → 边缘计算+端侧AI

作为四小龙中国际化基因最浓的团队，零一万物从成立之初就将出海作为核心战略。创始人李开复的全球人脉和视野，使其在海外市场拓展上拥有天然优势。

零一万物的差异化竞争点在于端侧AI。其推出的Yi系列模型在量化压缩后，可以在消费级GPU甚至高端CPU上流畅运行。这一特性使其在边缘计算、IoT设备和私有化部署场景中具有独特竞争力。

据OpenRouter平台早期数据（2026年3月），零一万物Yi-34B Chat占据平台约**2.9%**的市场份额，在中小开发者中性价比优势突出。其端侧推理场景占比较高，是五小龙中仅次于MiniMax的端侧AI代表。

2.4 百川智能：垂直行业的深度渗透

出海路径：垂直场景切入 → 行业Know-how构建护城河

与前三者不同，百川智能选择了"垂直深耕"的出海路径。其重点发力的领域包括医疗、法律和金融——这些场景对模型的专业性和准确性要求极高，但客单价也相应更高。

百川的出海策略是"以点带面"：先在新加坡、香港等华语文化圈地区建立标杆案例，再逐步渗透至欧美主流市场。其医疗大模型Baichuan-Med已通过新加坡HSA（卫生科学局）的初步审核，有望成为首个在海外获得医疗AI资质的国产大模型。

2.5 MiniMax：语音与多模态的"出海先锋"

出海路径：To C应用出海 → 语音技术领先 → API生态构建

MiniMax（稀宇科技）是五小龙中国际化程度最高的一员。其推出的AI角色扮演应用Talkie（海外版星野）曾登顶全球AI伴侣类产品免费榜，2024年8月海外单月下载量曾达235万。虽然2025年四季度数据显示其月活有所回落，但其在海外市场的先发优势和语音技术壁垒依然显著。

这种C端产品的成功，为MiniMax的B端API出海奠定了独特优势：

语音技术壁垒：Talkie的核心竞争力在于超逼真的语音合成和情感表达，这一技术已通过API开放给海外开发者
多模态能力：MiniMax是国内最早实现"文本+语音+视觉"统一建模的大模型厂商之一
海外合规经验：通过Talkie的运营，MiniMax已积累了丰富的海外数据合规和用户运营经验

差异化定位：与其他厂商主攻文本大模型不同，MiniMax的API出海主打语音交互和多模态理解，避开了与Kimi、GLM的直接竞争。其语音API的价格仅为ElevenLabs的1/5，已在海外游戏、社交、教育应用中快速渗透。

关键数据：据OpenRouter平台数据，MiniMax M2.5周调用量高达1.75万亿Token，五连冠全球第一，超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和。其**语音Token占比超过60%**的差异化产品组合，使其在海外市场找到了独特生态位。

三、数据透视：Token出海的规模与增速

3.1 国产大模型Token调用量全景

重要说明：以下数据主要基于全球头部AI模型API聚合平台OpenRouter的公开统计，以及企业官方披露信息。OpenRouter平台汇集了全球开发者的API调用数据，是观察大模型调用趋势的重要窗口。

厂商周调用量（OpenRouter，万亿Token）排名数据来源MiniMax（M2.5）1.75 全球第1OpenRouter，2026-03-16阶跃星辰（Step 3.5 Flash）1.34 全球第2OpenRouter，2026-03-16DeepSeek（V3.2）1.04 全球第3OpenRouter，2026-03-16月之暗面（Kimi K2.5）0.9-1.21全球前3OpenRouter，2026-02至03月智谱AI（GLM-5）0.78+全球前5OpenRouter，2026-02-24

注：零一万物、百川智能等厂商主要发力企业级私有部署和端侧AI，OpenRouter平台数据无法完全反映其实际调用量。

关键统计数据（2026年3月）：

中国大模型周调用总量：9.82万亿Token（OpenRouter平台）
美国大模型周调用总量：2.99万亿Token（OpenRouter平台）
中国占比：约77%（OpenRouter平台头部模型）
全国日均Token调用量：140万亿Token（工信部数据）

⚠️ 数据说明：

OpenRouter数据仅代表该平台（全球主要API聚合平台之一）的调用情况，非全量数据
实际各厂商总调用量（含自有平台、企业私有化部署）远高于OpenRouter数据
海外占比数据因企业披露有限，文中为行业估算值，仅供参考
1万亿Token = 1,000,000,000,000 Token（10^12）

数据来源：OpenRouter平台公开数据、工信部公开信息、企业官方披露，截至2026年3月

3.2 关键洞察

（1）调用量已领先，海外占比持续提升

据OpenRouter平台数据，中国大模型周调用量已连续一个月超越美国（9.82万亿 vs 2.99万亿Token）。全国日均Token调用量已突破140万亿Token（工信部数据）。随着Cloudflare等国际平台陆续接入国产模型，海外占比有望从当前的个位数提升至20%以上。

（2）DeepSeek的"鲶鱼效应"

DeepSeek V3.2在OpenRouter平台周调用量超过1万亿Token，稳居全球前三。其开源策略和极致性价比正在重塑全球开发者的大模型选择——当开发者发现可以以1/24的成本获得接近GPT-5的性能时，迁移便不可避免。DeepSeek的存在，正在迫使其他厂商加速出海进程。

（3）北美是主战场，平台接入是关键

从地域分布来看，北美市场（美国+加拿大）是国产大模型出海的主战场。以Cloudflare Workers AI为例，其全球边缘计算节点覆盖超过330个城市，接入Kimi K2.5意味着国产模型已触达全球最具影响力的开发者群体。平台接入（如Cloudflare、AWS、Azure）正成为国产模型出海的关键路径。

四、深层逻辑：为什么是现在？

4.1 成本结构的质变

国产大模型能够实现"Token出海"，最根本的原因是推理成本的指数级下降。

以Kimi K2.5为例，其每百万Token的推理成本约为0.5美元（基于公开定价和合理的毛利率估算），而GPT-4 Turbo的同等成本约为10美元。这意味着，即使考虑到网络延迟、跨境合规等额外成本，国产大模型仍然有5-10倍的成本优势。

这一成本优势源于三个层面：

算力成本：国内GPU采购和运维成本低于美国（尽管受限于芯片禁令，但可通过架构优化和集群调度弥补）
工程优化：国产团队在模型量化、投机采样、PagedAttention等推理优化技术上处于全球第一梯队
商业模式：国内厂商普遍采取"薄利多销"策略，愿意以低毛利换取市场份额

4.2 模型能力的"及格线"跨越

成本优势需要性能支撑。2024年以来，以Kimi、GLM-4、Yi为代表国产大模型在主流评测基准（MMLU、HumanEval、C-Eval等）上的得分已经全面超越了GPT-3.5，并在特定领域（如中文理解、长文本处理）接近或超越GPT-4。

对于企业客户而言，"够用"比"最好"更重要。在大多数应用场景（客服、文案生成、代码辅助、知识问答）中，国产大模型的能力已经足够满足需求。

4.3 地缘政治的"意外红利"

吊诡的是，中美科技竞争的加剧，反而为国产大模型出海创造了"意外红利"。

一方面，海外企业开始寻求"多供应商"策略以分散地缘政治风险，国产大模型成为了OpenAI和Anthropic之外的"第三选择"。另一方面，部分国家（如中东、东南亚、拉美）出于数据主权和外交平衡的考虑，对非美国AI服务持更为开放的态度。

Cloudflare选择Kimi，某种程度上也是这一趋势的缩影——作为一家在全球多个国家运营的基础设施公司，它需要向客户展示"供应商多样性"的能力。

五、挑战与隐忧：Token出海的"三重门"

5.1 合规门槛：GDPR与数据主权的博弈

欧盟的GDPR（通用数据保护条例）是全球最严格的数据隐私法规。国产大模型要在欧洲市场大规模落地，必须解决数据跨境传输、模型训练数据溯源、用户"被遗忘权"等一系列合规问题。

目前，五小龙中仅有智谱AI和零一万物在欧盟设有数据中心，其他厂商仍依赖新加坡或香港节点服务欧洲客户。这种架构虽然可以绕过部分监管，但在面对严格的企业级合规审计时仍存在风险。

5.2 品牌认知：从"便宜货"到"可信赖"

尽管技术能力已经达标，但国产大模型在海外市场仍面临品牌认知的挑战。很多海外开发者对国产模型的印象仍停留在"便宜但不可靠"的阶段。

改变这一认知需要时间和案例积累。Cloudflare与Kimi的合作，是一个重要的转折点——当全球顶级的互联网公司开始公开采用国产模型，其他企业的疑虑将被逐步消解。

5.3 算力天花板：芯片禁令的达摩克利斯之剑

美国对华AI芯片出口管制，是悬在国产大模型头顶的达摩克利斯之剑。

虽然目前国产厂商通过囤积A100/H100、采用国产替代芯片（如华为昇腾）、以及算法优化等方式维持了算力供给，但如果未来管制进一步收紧，国产大模型的训练和推理成本优势可能会被削弱。

长期来看，算力自主可控是国产大模型出海的"必修课"。

六、未来展望：Token出海的"终局"想象

6.1 短期（6-12个月）：API调用的"军备竞赛"

预计未来一年，国产大模型的API价格将继续下降，海外调用量将保持高速增长。我们可能会看到：

更多国际云厂商（如AWS、Azure、Google Cloud）将国产大模型纳入官方模型市场
国产模型在OpenRouter等平台的周调用量突破15万亿Token
出现专门针对国产大模型的海外聚合平台（类似于国内的SiliconFlow）
国产模型在海外企业级市场的渗透率突破30%

6.2 中期（1-3年）：从API到"生态"

随着API调用规模的扩大，国产大模型厂商将开始构建海外开发者生态：

推出海外版的"大模型应用商店"
设立海外AI创业基金，投资基于国产模型的SaaS公司
与海外高校合作，建立联合实验室，培养下一代AI人才

6.3 长期（3-5年）：全球化AI基础设施的"多极格局"

最终，全球AI基础设施市场将形成"三足鼎立"或"多极格局"：

美国阵营：OpenAI、Anthropic、Google、Meta等，主导北美和西欧市场
中国阵营：四小龙、DeepSeek等，主导东南亚、中东、拉美和部分欧洲市场
区域玩家：如欧洲的Mistral、日本的Sakana、中东的Falcon等，在本土市场占据一定份额

在这一格局中，Token作为一种"数字商品"，将像石油、芯片一样成为全球贸易的重要组成部分。而中国，有望成为Token出口的全球第二大供应国。

结语

Cloudflare选择Kimi，是一个信号，更是一个开端。

它标志着国产大模型正在从"成本优势"向"价值认可"跃迁。当全球顶级的科技公司开始将核心业务负载迁移至中国模型，这意味着中国AI产业已经跨越了从"跟跑"到"并跑"的关键节点。

Token出海，不仅是技术的输出，更是中国AI产业自信的体现。在DeepSeek开源模型和五小龙的差异化出海策略推动下，全球AI市场的版图正在被重新绘制。

对于国产大模型厂商而言，出海之路才刚刚开始。前方的道路既有无限机遇，也有重重挑战。但可以确定的是，全球AI的"中国时刻"，已经到来。

作者：玻色子

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.