网易首页 > 网易号 > 正文 申请入驻

智造观察 | Token(词元)出海,国产大模型杀入美国B端市场

0
分享至

来源:市场资讯

(来源:洪泰智造)

智造观察 | Token(词元)出海,国产大模型杀入美国B端市场

作者:玻色子

导语

2026年3月,在奥斯汀举办的SXSW(西南偏南)大会上,Cloudflare CEO Matthew Prince抛出了一枚"重磅炸弹":这家服务全球超过20%网站的互联网基础设施巨头,已全面将其AI推理服务从闭源模型迁移至月之暗面(Moonshot AI)的Kimi K2.5,推理成本直降77%。

这不是一个孤立事件。当我们将视线拉长,会发现一个清晰的趋势正在形成——中国大模型的"Token出海"时代已经到来。继DeepSeek以开源模型撬动全球市场后,以月之暗面、智谱AI、零一万物、百川智能、MiniMax为代表的"国产大模型五小龙",正在以API调用的形式,悄然占领全球开发者的工具链。

这背后,是一场关于算力成本、模型性能与地缘博弈的深层较量。

一、Cloudflare的"投名状":为什么选Kimi?

1.1 77%的成本降幅意味着什么?

让我们先算一笔账。

Cloudflare Workers AI平台每天处理的推理请求数以百亿计。以GPT-4级别的模型为例,每百万Token的输入成本约为30美元,输出成本约为60美元。而Kimi K2.5的定价策略极具侵略性——输入价格仅为每百万Token 3美元,输出价格为每百万Token 12美元。

简单的数学:同等性能下,Kimi的成本仅为闭源竞品的20%-30%。

对于Cloudflare这样的基础设施巨头而言,这意味着每年数亿美元的直接成本节约。Matthew Prince在SXSW演讲中没有掩饰这一选择的商业逻辑:"企业客户不关心模型是谁训练的,他们只关心三件事——响应速度、准确率和账单金额。"

1.2 技术层面的"临门一脚"

成本只是表面,性能才是内核。

Kimi K2.5之所以能够通过Cloudflare的严格技术评估,关键在于其在长文本处理(Long Context)领域的突破。该模型支持高达256,000 Token的上下文窗口,在特定测试场景下更可扩展至200万汉字——这意味着它可以一次性处理整本长篇小说、完整代码库或数小时的视频会议记录。

对于Cloudflare的B端客户(主要是SaaS公司和开发者)而言,这一能力直接转化为产品竞争力。想象一下:一个法律Tech产品可以一次性分析数百页的合同文本;一个代码助手可以理解整个项目的架构而非单个文件;一个客服机器人可以记住用户过去一年的所有交互记录。

Kimi在长文本领域的技术壁垒,成为了打破欧美客户"品牌偏见"的利器。

二、Token出海的战略地图:四小龙的差异化路径

如果将大模型出海比作一场战役,那么DeepSeek打响的是"开源革命"的枪声,而五小龙正在打的是一场更为精细的"API渗透战"。

2.1 月之暗面:长文本+C端口碑的"双轮驱动"

出海路径:To C产品建立品牌认知 → To B API实现商业变现

月之暗面的策略可以概括为"农村包围城市"。在国内市场,Kimi智能助手已经积累了超过2000万月活用户,其"支持200万字长文本"的卖点深入人心。这种C端品牌势能,为其B端API出海提供了天然的信任背书。

在海外市场,月之暗面采取了"农村包围城市"的策略:

  • 第一阶段:通过开发者社区(GitHub、Hacker News、Reddit)建立技术口碑

  • 第二阶段:与Cloudflare、AWS等云平台合作,进入企业采购名单

  • 第三阶段:直接服务海外SaaS公司,成为其AI能力的基础设施

关键数据:据OpenRouter平台数据,Kimi K2.5周调用量稳居全球前五;在Cloudflare上架后,海外开发者调用量持续增长,北美和欧洲市场贡献超过60%。

2.2 智谱AI:清华系的技术正统与开源生态

出海路径:开源模型建立生态 → 企业级服务收割价值

智谱AI的出海策略与其技术基因一脉相承——稳扎稳打,重视生态。

2024年,智谱先后开源了ChatGLM3-6B和GLM-4系列模型,在Hugging Face上的累计下载量超过3000万次。这一开源策略为其赢得了全球开发者社区的广泛认可。据智谱官方披露,其企业级API服务已覆盖超过50个国家和地区,海外收入占比从2024年初的5%提升至2026年初的35%。

智谱的核心优势在于其"全栈自研"的技术实力。从底层算子优化到上层应用框架,智谱拥有完整的自主知识产权。这在当前地缘政治日趋复杂的背景下,成为了其服务海外敏感行业客户(如金融、政务)的重要筹码。

2.3 零一万物:李开复的国际化视野与硬件协同

出海路径:海外市场优先 → 边缘计算+端侧AI

作为四小龙中国际化基因最浓的团队,零一万物从成立之初就将出海作为核心战略。创始人李开复的全球人脉和视野,使其在海外市场拓展上拥有天然优势。

零一万物的差异化竞争点在于端侧AI。其推出的Yi系列模型在量化压缩后,可以在消费级GPU甚至高端CPU上流畅运行。这一特性使其在边缘计算、IoT设备和私有化部署场景中具有独特竞争力。

据OpenRouter平台早期数据(2026年3月),零一万物Yi-34B Chat占据平台约**2.9%**的市场份额,在中小开发者中性价比优势突出。其端侧推理场景占比较高,是五小龙中仅次于MiniMax的端侧AI代表。

2.4 百川智能:垂直行业的深度渗透

出海路径:垂直场景切入 → 行业Know-how构建护城河

与前三者不同,百川智能选择了"垂直深耕"的出海路径。其重点发力的领域包括医疗、法律和金融——这些场景对模型的专业性和准确性要求极高,但客单价也相应更高。

百川的出海策略是"以点带面":先在新加坡、香港等华语文化圈地区建立标杆案例,再逐步渗透至欧美主流市场。其医疗大模型Baichuan-Med已通过新加坡HSA(卫生科学局)的初步审核,有望成为首个在海外获得医疗AI资质的国产大模型。

2.5 MiniMax:语音与多模态的"出海先锋"

出海路径:To C应用出海 → 语音技术领先 → API生态构建

MiniMax(稀宇科技)是五小龙中国际化程度最高的一员。其推出的AI角色扮演应用Talkie(海外版星野)曾登顶全球AI伴侣类产品免费榜,2024年8月海外单月下载量曾达235万。虽然2025年四季度数据显示其月活有所回落,但其在海外市场的先发优势和语音技术壁垒依然显著。

这种C端产品的成功,为MiniMax的B端API出海奠定了独特优势:

  • 语音技术壁垒:Talkie的核心竞争力在于超逼真的语音合成和情感表达,这一技术已通过API开放给海外开发者

  • 多模态能力:MiniMax是国内最早实现"文本+语音+视觉"统一建模的大模型厂商之一

  • 海外合规经验:通过Talkie的运营,MiniMax已积累了丰富的海外数据合规和用户运营经验

差异化定位:与其他厂商主攻文本大模型不同,MiniMax的API出海主打语音交互和多模态理解,避开了与Kimi、GLM的直接竞争。其语音API的价格仅为ElevenLabs的1/5,已在海外游戏、社交、教育应用中快速渗透。

关键数据:据OpenRouter平台数据,MiniMax M2.5周调用量高达1.75万亿Token,五连冠全球第一,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和。其**语音Token占比超过60%**的差异化产品组合,使其在海外市场找到了独特生态位。

三、数据透视:Token出海的规模与增速

3.1 国产大模型Token调用量全景

重要说明:以下数据主要基于全球头部AI模型API聚合平台OpenRouter的公开统计,以及企业官方披露信息。OpenRouter平台汇集了全球开发者的API调用数据,是观察大模型调用趋势的重要窗口。

厂商周调用量(OpenRouter,万亿Token)排名数据来源MiniMax(M2.5)1.75 全球第1OpenRouter,2026-03-16阶跃星辰(Step 3.5 Flash)1.34 全球第2OpenRouter,2026-03-16DeepSeek(V3.2)1.04 全球第3OpenRouter,2026-03-16月之暗面(Kimi K2.5)0.9-1.21全球前3OpenRouter,2026-02至03月智谱AI(GLM-5)0.78+全球前5OpenRouter,2026-02-24

注:零一万物、百川智能等厂商主要发力企业级私有部署和端侧AI,OpenRouter平台数据无法完全反映其实际调用量。

关键统计数据(2026年3月):

  • 中国大模型周调用总量:9.82万亿Token(OpenRouter平台)

  • 美国大模型周调用总量:2.99万亿Token(OpenRouter平台)

  • 中国占比:约77%(OpenRouter平台头部模型)

  • 全国日均Token调用量:140万亿Token(工信部数据)

⚠️ 数据说明:

  1. OpenRouter数据仅代表该平台(全球主要API聚合平台之一)的调用情况,非全量数据

  2. 实际各厂商总调用量(含自有平台、企业私有化部署)远高于OpenRouter数据

  3. 海外占比数据因企业披露有限,文中为行业估算值,仅供参考

  4. 1万亿Token = 1,000,000,000,000 Token(10^12)

数据来源:OpenRouter平台公开数据、工信部公开信息、企业官方披露,截至2026年3月

3.2 关键洞察

(1)调用量已领先,海外占比持续提升

据OpenRouter平台数据,中国大模型周调用量已连续一个月超越美国(9.82万亿 vs 2.99万亿Token)。全国日均Token调用量已突破140万亿Token(工信部数据)。随着Cloudflare等国际平台陆续接入国产模型,海外占比有望从当前的个位数提升至20%以上。

(2)DeepSeek的"鲶鱼效应"

DeepSeek V3.2在OpenRouter平台周调用量超过1万亿Token,稳居全球前三。其开源策略和极致性价比正在重塑全球开发者的大模型选择——当开发者发现可以以1/24的成本获得接近GPT-5的性能时,迁移便不可避免。DeepSeek的存在,正在迫使其他厂商加速出海进程。

(3)北美是主战场,平台接入是关键

从地域分布来看,北美市场(美国+加拿大)是国产大模型出海的主战场。以Cloudflare Workers AI为例,其全球边缘计算节点覆盖超过330个城市,接入Kimi K2.5意味着国产模型已触达全球最具影响力的开发者群体。平台接入(如Cloudflare、AWS、Azure)正成为国产模型出海的关键路径。

四、深层逻辑:为什么是现在?

4.1 成本结构的质变

国产大模型能够实现"Token出海",最根本的原因是推理成本的指数级下降。

以Kimi K2.5为例,其每百万Token的推理成本约为0.5美元(基于公开定价和合理的毛利率估算),而GPT-4 Turbo的同等成本约为10美元。这意味着,即使考虑到网络延迟、跨境合规等额外成本,国产大模型仍然有5-10倍的成本优势。

这一成本优势源于三个层面:

  1. 算力成本:国内GPU采购和运维成本低于美国(尽管受限于芯片禁令,但可通过架构优化和集群调度弥补)

  2. 工程优化:国产团队在模型量化、投机采样、PagedAttention等推理优化技术上处于全球第一梯队

  3. 商业模式:国内厂商普遍采取"薄利多销"策略,愿意以低毛利换取市场份额

4.2 模型能力的"及格线"跨越

成本优势需要性能支撑。2024年以来,以Kimi、GLM-4、Yi为代表国产大模型在主流评测基准(MMLU、HumanEval、C-Eval等)上的得分已经全面超越了GPT-3.5,并在特定领域(如中文理解、长文本处理)接近或超越GPT-4。

对于企业客户而言,"够用"比"最好"更重要。 在大多数应用场景(客服、文案生成、代码辅助、知识问答)中,国产大模型的能力已经足够满足需求。

4.3 地缘政治的"意外红利"

吊诡的是,中美科技竞争的加剧,反而为国产大模型出海创造了"意外红利"。

一方面,海外企业开始寻求"多供应商"策略以分散地缘政治风险,国产大模型成为了OpenAI和Anthropic之外的"第三选择"。另一方面,部分国家(如中东、东南亚、拉美)出于数据主权和外交平衡的考虑,对非美国AI服务持更为开放的态度。

Cloudflare选择Kimi,某种程度上也是这一趋势的缩影——作为一家在全球多个国家运营的基础设施公司,它需要向客户展示"供应商多样性"的能力。

五、挑战与隐忧:Token出海的"三重门"

5.1 合规门槛:GDPR与数据主权的博弈

欧盟的GDPR(通用数据保护条例)是全球最严格的数据隐私法规。国产大模型要在欧洲市场大规模落地,必须解决数据跨境传输、模型训练数据溯源、用户"被遗忘权"等一系列合规问题。

目前,五小龙中仅有智谱AI和零一万物在欧盟设有数据中心,其他厂商仍依赖新加坡或香港节点服务欧洲客户。这种架构虽然可以绕过部分监管,但在面对严格的企业级合规审计时仍存在风险。

5.2 品牌认知:从"便宜货"到"可信赖"

尽管技术能力已经达标,但国产大模型在海外市场仍面临品牌认知的挑战。很多海外开发者对国产模型的印象仍停留在"便宜但不可靠"的阶段。

改变这一认知需要时间和案例积累。Cloudflare与Kimi的合作,是一个重要的转折点——当全球顶级的互联网公司开始公开采用国产模型,其他企业的疑虑将被逐步消解。

5.3 算力天花板:芯片禁令的达摩克利斯之剑

美国对华AI芯片出口管制,是悬在国产大模型头顶的达摩克利斯之剑。

虽然目前国产厂商通过囤积A100/H100、采用国产替代芯片(如华为昇腾)、以及算法优化等方式维持了算力供给,但如果未来管制进一步收紧,国产大模型的训练和推理成本优势可能会被削弱。

长期来看,算力自主可控是国产大模型出海的"必修课"。

六、未来展望:Token出海的"终局"想象

6.1 短期(6-12个月):API调用的"军备竞赛"

预计未来一年,国产大模型的API价格将继续下降,海外调用量将保持高速增长。我们可能会看到:

  • 更多国际云厂商(如AWS、Azure、Google Cloud)将国产大模型纳入官方模型市场

  • 国产模型在OpenRouter等平台的周调用量突破15万亿Token

  • 出现专门针对国产大模型的海外聚合平台(类似于国内的SiliconFlow)

  • 国产模型在海外企业级市场的渗透率突破30%

6.2 中期(1-3年):从API到"生态"

随着API调用规模的扩大,国产大模型厂商将开始构建海外开发者生态:

  • 推出海外版的"大模型应用商店"

  • 设立海外AI创业基金,投资基于国产模型的SaaS公司

  • 与海外高校合作,建立联合实验室,培养下一代AI人才

6.3 长期(3-5年):全球化AI基础设施的"多极格局"

最终,全球AI基础设施市场将形成"三足鼎立"或"多极格局":

  • 美国阵营:OpenAI、Anthropic、Google、Meta等,主导北美和西欧市场

  • 中国阵营:四小龙、DeepSeek等,主导东南亚、中东、拉美和部分欧洲市场

  • 区域玩家:如欧洲的Mistral、日本的Sakana、中东的Falcon等,在本土市场占据一定份额

在这一格局中,Token作为一种"数字商品",将像石油、芯片一样成为全球贸易的重要组成部分。而中国,有望成为Token出口的全球第二大供应国。

结语

Cloudflare选择Kimi,是一个信号,更是一个开端。

它标志着国产大模型正在从"成本优势"向"价值认可"跃迁。当全球顶级的科技公司开始将核心业务负载迁移至中国模型,这意味着中国AI产业已经跨越了从"跟跑"到"并跑"的关键节点。

Token出海,不仅是技术的输出,更是中国AI产业自信的体现。在DeepSeek开源模型和五小龙的差异化出海策略推动下,全球AI市场的版图正在被重新绘制。

对于国产大模型厂商而言,出海之路才刚刚开始。前方的道路既有无限机遇,也有重重挑战。但可以确定的是,全球AI的"中国时刻",已经到来。

作者:玻色子

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

阿龙美食记
2026-04-12 15:01:18
1955年,薄一波为何没出现在授衔名单中?假如参与,大将板上钉钉

1955年,薄一波为何没出现在授衔名单中?假如参与,大将板上钉钉

海佑讲史
2026-04-15 13:30:12
格列兹曼:第二个失球源于我丢了球权,我处理得太差了

格列兹曼:第二个失球源于我丢了球权,我处理得太差了

懂球帝
2026-04-15 06:16:06
体彩超级大乐透开出11注一等奖

体彩超级大乐透开出11注一等奖

吉刻新闻
2026-04-14 19:50:38
西安烤肉店闹剧:印度留学生跳着数串找茬,一句“滚回去”引热议

西安烤肉店闹剧:印度留学生跳着数串找茬,一句“滚回去”引热议

行者聊官
2026-04-14 16:20:36
婆婆3万买我9000万陪嫁房,我当即同意,半年后她悔不当初

婆婆3万买我9000万陪嫁房,我当即同意,半年后她悔不当初

奶茶麦子
2026-04-15 12:46:25
潜逃印度以贩卖艳照为生的女曱甴,拿BNO护照在中东被拒入境

潜逃印度以贩卖艳照为生的女曱甴,拿BNO护照在中东被拒入境

侠客栈
2026-04-14 11:36:31
1989年,85岁邓颖超,找到李鹏,开口就是5个字:我想安乐死

1989年,85岁邓颖超,找到李鹏,开口就是5个字:我想安乐死

玥来玥好讲故事
2026-04-13 20:54:18
原来温瑞博的爸爸是他!曾是乒乓球队顶梁柱,难怪19岁儿子这么牛

原来温瑞博的爸爸是他!曾是乒乓球队顶梁柱,难怪19岁儿子这么牛

林子说事
2026-04-15 11:34:09
丹麦男友去世后,东北姑娘仍为他生下遗腹子,还为了公婆定居丹麦

丹麦男友去世后,东北姑娘仍为他生下遗腹子,还为了公婆定居丹麦

星星没有你亮
2026-03-22 08:48:35
外媒:苏林对中国进行国事访问具有特殊意义

外媒:苏林对中国进行国事访问具有特殊意义

参考消息
2026-04-15 11:10:02
号称世界最好喝可乐单瓶售价29元 你会买单吗?

号称世界最好喝可乐单瓶售价29元 你会买单吗?

TechWeb
2026-04-15 12:33:05
陪玩陪睡算啥!继注射不明物后内娱又曝猛料,遭殃的何止迪丽热巴

陪玩陪睡算啥!继注射不明物后内娱又曝猛料,遭殃的何止迪丽热巴

草莓解说体育
2026-04-15 13:37:36
国务院825号令落地:终结电动车乱罚款,车主终于能安心上路了

国务院825号令落地:终结电动车乱罚款,车主终于能安心上路了

糖逗在娱乐
2026-04-15 12:00:42
哈里梅根空降澳洲开启巡演,当地民众冷脸开炮:真不明白他们来干嘛!

哈里梅根空降澳洲开启巡演,当地民众冷脸开炮:真不明白他们来干嘛!

动物奇奇怪怪
2026-04-15 01:07:49
苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

世界圈
2026-04-04 13:13:03
徐杰的2+1判罚正确吗?裁判专家给出答案,球迷:不是2+1也属违体

徐杰的2+1判罚正确吗?裁判专家给出答案,球迷:不是2+1也属违体

南海浪花
2026-04-15 06:41:10
狂赚26亿、裁员近千人、惊动五部门的BOSS直聘,能横行到几时?

狂赚26亿、裁员近千人、惊动五部门的BOSS直聘,能横行到几时?

数智研究社
2026-04-15 07:30:07
15号午评:沪指早间红盘震荡!所有人都注意,大盘后市或将这样走

15号午评:沪指早间红盘震荡!所有人都注意,大盘后市或将这样走

春江财富
2026-04-15 11:55:27
特朗普突然对中国汽车加征100%关税,中方强硬反制

特朗普突然对中国汽车加征100%关税,中方强硬反制

冷峻视角下的世界
2026-04-15 13:20:17
2026-04-15 14:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2868908文章数 6642关注度
往期回顾 全部

科技要闻

手机无死角上网?亚马逊砸百亿硬刚马斯克

头条要闻

上万美军封锁下 多艘货船成功通过霍尔木兹海峡

头条要闻

上万美军封锁下 多艘货船成功通过霍尔木兹海峡

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

曾志伟办73岁生日派对,逾百艺人到场

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

海豹08内饰首秀 大满配“海王”旗舰

态度原创

亲子
本地
旅游
时尚
公开课

亲子要闻

40岁了卵巢早衰还能生育吗?试管dhea哪个比较好?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

旅游要闻

国色天香!盐城珠溪古镇多处牡丹绽放

坏事做尽的疯女人,集体翻红了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版