网易首页 > 网易号 > 正文 申请入驻

中国大模型,调用量登顶

0
分享至



文/熊逾格

编辑/子夜

没有预热,没有倒计时海报,杨植麟首次亲自出镜。

1月27日下午,Kimi更新了自家最新的开源模型Kimi K2.5,视频里他语速不快,“我们重构了强化学习的基建,并专门优化了训练算法,以确保它能达到极致的效率和性能。”

上线第三天,K2.5登上了LMArena代码能力榜单全球开源第一,视觉能力榜单全球开源第一。而在Artificial Analysis榜单上,它在综合排名中位列第5,在所有开源模型中领跑。

最近爆火出圈的AI智能体OpenClaw也很快宣布,为用户开放Kimi K2.5的免费额度,Kimi K2.5成为首个被OpenClaw官方推荐的主力模型。2月4日至今,在OpenRouter排行中,Kimi K2.5一直位居OpenClaw调用量的榜首,超过Gemini 3 Flash、Claude Sonnet 4.5。

硅谷顶级播客All-In Podcast用大量时间讨论了Kimi K2.5上线这件事。常驻嘉宾、Social Capital创始人Chamath Palihapitiya给出了一个判断:

这是开源模型第一次在综合能力层面真正撼动由OpenAI、Anthropic、Google构建的闭源体系。他把这个时刻称为“Kimi K2.5时刻”。

而据公开报道,受K2.5上线带动,Kimi海外收入已超过国内,全球付费用户4倍增长。

1、为什么更强?

作为曾参与白宫科技圆桌、多次采访美国总统的硅谷意见领袖,Chamath的判断往往被视为资本、政策与产业交汇处的风向标。



Social Capital创始人Chamath Palihapitiya讨论Kimi K2.5,图源Youtube

针对自己提出的“Kimi K2.5时刻”,他特别指出,这是因为K2.5及其Agent Swarm技术,让原本只存在于超大规模闭源系统中的高阶推理能力,开始向更广泛的开发者释放。

如何理解Kimi K2.5对于整个大模型赛道的意义?

首先是性能的提升。

在LMArena榜单上,K2.5拿到了全球开源模型代码能力、视觉能力第一,视觉能力上仅次于Gemini和GPT系列模型,代码能力仅次于Claude和Gemini。



LMArena榜单全球大模型代码能力榜单,图源LMArena网站

其次是压缩到极致的成本。

“创业第一天起我们就知道,我们没有随意堆砌算力的条件”,2026年1月的达沃斯论坛上,Kimi总裁张予彤曾透露,Kimi大概只用了美国顶尖实验室1%的资源,就做出了性能相当的模型。K2.5的API定价只有Claude的五分之一,而在跑分上两者几乎持平。

当开源、低成本、出色表现结合,Kimi K2.5为开发者带来的是极高的性价比以及充足的自由。

正如Chamath在节目中总结的,不同于以往“性能略逊、但胜在便宜或可控”的开源模型,Kimi K2.5同时提供了顶级性能与完全透明——模型权重可审计、代码可修改、数据与基础设施掌握在用户手中。

在关乎生产力的平台上,Kimi K2.5的影响已经如涟漪散开。

发布三天,K2.5便在海外知名编程工具Kilo Code,全球最大的众包AI设计平台Design Arena都拿到了调用量全球第一的成绩。截止发稿,Kimi在知名大模型聚合平台OpenRouter上的多个榜单登顶。



K2.5登顶OpenRouter大模型编程类调用量排行榜,图源OpenRouter网站

除去模型本身的能力,K2.5大热的另一个原因,还有其独特的Agent技术。在Agent叙事爆发的背景下,K2.5不追赶热度,专注于革新Agent形态,其实相当难得。

与Cowork、OpenClaw的单Agent任务执行不同,K2.5首次引入“Agent Swarm”。面对复杂任务,模型不再单打独斗,而是自主调度多达100个分身并行处理1500个步骤。



K2.5的Agent集群能力,图源月之暗面Kimi视频号

据Kimi官方介绍,通过并行智能体强化学习(PARL),Agent集群将达成目标性能所需的关键步骤减少3到4.5倍,实际运行时间最高可缩短4.5倍。

此外,K2.5还从底层升级了多模态能力。过去,大多数AI模型处理图片的方式其实是拼装,文本理解用一个模型,图像识别用另一个模型,中间再加一层翻译对接,总会有信息在传递中损耗。

多项技术升级为K2.5带来的,或许可以称作大模型的“审美”。

月之暗面创始人杨植麟曾在AGI-Next前沿峰会上表示,做模型的过程本质上是在创造一种世界观,让AI有更好的taste。



K2.5根据视频直接生成网页,图源Kimi智能助手微信公众号

如今,在Agent集群、原生多模态能力的加持下,K2.5不仅能写代码,还能让写出来的东西具备“审美”。例如,用户传一张截图、一段录屏,K2.5就能理解交互逻辑并输出“带有设计审美”的代码,提供与其他大模型截然不同的体验。

2、为什么是这条路?

2025年初,DeepSeek-R1横空出世。低成本、开源、性能强悍,三个词砸下来,整个大模型行业玩家都在重新审视自家路线。

在浪潮之中,大模型公司也在浮沉,唯有快速决策,并坚定路线的玩家得以生存,并逐渐壮大。

2025年底,杨植麟在内部信中披露,月之暗面当前现金持有量超过100亿元,弹药依然充足。

此外,2025年7月的K2系列模型,使得Kimi在9-11月海外和国内付费用户数平均月环比增长超过170%,海外API收入增长4倍。

再到如今,K2.5发布后,Kimi海外收入已超过国内,全球付费用户4倍增长。

回顾这一年,Kimi的两个决策非常重要:

第一,是商业路径的重新校准。

Deepseek冲击后,Kimi内部快速做了一项决定:放弃流量战争,聚焦技术与生产力。

据彼时的媒体报道,月之暗面大幅收缩投放预算,暂停安卓渠道和第三方广告合作。杨植麟把“持续拿到SOTA结果”定为最重要的工作目标。

这是一条更难但更有价值的路,也这意味着,Kimi主动将自身评价体系与APP月活“解绑”。

随后,Kimi的选择浮出水面:“更强推理、更稳定输出”的生产力工具路线,从“投流换用户”转向“技术换专业用户”。

作为“生产力AI”,Kimi使用场景是“低频、高深度”的生产场景,网页端成为比APP端更重要的战场。相比APP,Researcher、Agent、PPT、Kimi Code等功能都更适用于网页端。



K2.5 Agent针对office场景优化,图源Kimi智能助手微信公众号

潜移默化中,Kimi的核心用户画像发生了改变,如今聚集在Web端的,显然是更需要生产力工具的专业人士。

第二,是对基座路线的坚持。

杨植麟在2025年底的内部信中写得很明确,“产品和商业化上聚焦agent,不以绝对用户数量为目标,持续追求智能上限。”

据晚点LatePost报道,DeepSeek出来之后,百川转向医疗,零一万物转向ToB,不少大模型玩家纷纷收缩战线。但月之暗面是少数仍坚持“基座模型+Agent”路径的公司。

坚持做基座意味着持续投入,但Kimi专注地走好了已经决定的路线:从K2到K2.5,技术翻盘的迹象已经显现。

回过头看,过去一年Kimi的缓投放、守基座、押Agent,都在为K2.5这张牌积攒势能。

3、还有哪些想象空间?

2026年初,Kimi面对的竞争格局比任何时候都更复杂。

特别在今天,GPT-5.3-Codex和Claude 4.6同时炸场,又把代码能力提到了新的高度。

一方面,K2.5发布后,Kimi的产品矩阵进一步丰富。

K2.5仍然聚焦Coding+Agent两大高频场景,同步发布了Kimi Code编程工具,可集成VSCode、Cursor等IDE;并将Agent能力扩展到Office领域,掌握Word、Excel、PPT、PDF的高阶技能,这和今早Claude呈现出的路线很像。

另一方面,还是中国模型的性价比,当性能接近而价格只有几分之一时,Kimi海外付费用户的增长迅速就是直观的证明。

在2025年底的内部信中,杨植麟写了一段话:“2026年Kimi会成为一个'与众不同'和'不被定义'的LLM。不管是别人没敢押注的技术无人区,还是需要一点偏执的审美坚持,我相信有更多Kimi-defined的创新能对人类文明加速发展产生独特贡献。”

他还提到,2026年K3模型将提升等效FLOPs至少一个数量级,追平世界前沿。

宏观来说,这是中国AI公司再次来到牌桌前,在技术封锁下的再次突围。

微观来说,这是月之暗面这家公司试图“下定义”,用Agent集群、审美、效率工具来定义一套属于自己的产品哲学。

不管如何,基座能力、生产力场景、开源生态,正将足够优秀的中国AI推向全世界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
250亿!赖清德窜访代价来了,斯威士兰开始要债 卢秀燕却声援绿营

250亿!赖清德窜访代价来了,斯威士兰开始要债 卢秀燕却声援绿营

闻识
2026-05-10 18:17:01
停火第一天,乌克兰就遭到攻击;俄计划发动大规模海上进攻

停火第一天,乌克兰就遭到攻击;俄计划发动大规模海上进攻

近距离
2026-05-10 07:10:25
孩子是一面镜子,照出我们不敢看的样子

孩子是一面镜子,照出我们不敢看的样子

时光慢邮啊
2026-05-09 17:35:36
丹泽尔·华盛顿22年前动作片翻拍版登顶Netflix,观看时长超6000万小时

丹泽尔·华盛顿22年前动作片翻拍版登顶Netflix,观看时长超6000万小时

娱圈观察员
2026-05-10 00:15:29
船上病毒爆发,她老公死了。船长说是自然死亡,大家去拥抱安慰她,然后她也死了...

船上病毒爆发,她老公死了。船长说是自然死亡,大家去拥抱安慰她,然后她也死了...

英国那些事儿
2026-05-09 23:12:15
笑死!比亚迪 “青蛙车”全网爆火,网友调侃:喇叭必须是 “呱呱呱”

笑死!比亚迪 “青蛙车”全网爆火,网友调侃:喇叭必须是 “呱呱呱”

品牌新
2026-05-09 16:55:51
段永平又加仓茅台了

段永平又加仓茅台了

21世纪经济报道
2026-05-10 13:20:59
闹大了!女孩首次登门男方家,被安排与男友同床,顾虑声誉要分房

闹大了!女孩首次登门男方家,被安排与男友同床,顾虑声誉要分房

火山詩话
2026-05-09 08:11:39
晚唐的实际掌权人-晚唐十大节度使

晚唐的实际掌权人-晚唐十大节度使

舆图司马
2026-05-09 21:00:03
佩古拉6-0横扫晋级WTA1000罗马站,女单16强仅剩3席

佩古拉6-0横扫晋级WTA1000罗马站,女单16强仅剩3席

工从昊懂球阿靖
2026-05-10 22:34:35
每体:巴萨队史对皇马分差纪录为19分,本赛季有望打破纪录

每体:巴萨队史对皇马分差纪录为19分,本赛季有望打破纪录

懂球帝
2026-05-10 16:25:20
男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

汉史趣闻
2026-05-10 16:38:24
段永平点评OPPO母亲节活动文案:确实不合适,相信他们会反省的

段永平点评OPPO母亲节活动文案:确实不合适,相信他们会反省的

鞭牛士
2026-05-10 09:45:04
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
这部奥斯卡最佳影片8年后杀回Netflix前五

这部奥斯卡最佳影片8年后杀回Netflix前五

热搜摘要官
2026-05-09 22:09:52
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

次元君情感
2026-05-10 21:14:41
五万多人被套路!女子租共享充电宝被扣149元,涉事企业被撕底裤

五万多人被套路!女子租共享充电宝被扣149元,涉事企业被撕底裤

火山詩话
2026-05-10 14:42:17
禁欲真的好吗?研究表明:禁欲时间越长,排出的精子活动率越低!

禁欲真的好吗?研究表明:禁欲时间越长,排出的精子活动率越低!

黯泉
2026-05-04 14:05:52
毛主席原定1950年举行开国大典,斯大林得知后当场变脸警告刘少奇:必须立刻改期!

毛主席原定1950年举行开国大典,斯大林得知后当场变脸警告刘少奇:必须立刻改期!

寄史言志
2026-05-09 19:13:45
他给自己造了个诺贝尔奖,所有人都信了!真诺贝尔得主也给他站台,10年才露馅...

他给自己造了个诺贝尔奖,所有人都信了!真诺贝尔得主也给他站台,10年才露馅...

英国那些事儿
2026-05-08 23:22:39
2026-05-11 00:00:49
连线Insight incentive-icons
连线Insight
产业升级创新者的聚集地。
1729文章数 1502关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

数码
手机
亲子
旅游
公开课

数码要闻

古尔曼:苹果macOS 27将进一步完善液态玻璃设计

手机要闻

联想拯救者手机Y70新一代现身Geekbench

亲子要闻

“顺”还是“剖”?从成为母亲的选择说起

旅游要闻

重庆新增一夜景打卡点!磁器口步行街看大学生“脑洞”建筑

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版