网易首页 > 网易号 > 正文 申请入驻

Kimi K2.5发布即登顶 成本压至Claude 1/5

0
分享至

在这场没有硝烟的战争中,Kimi暂时赢得了一个身位,但通往AGI的道路上,还要保持更强大的耐力和更坚韧的态度。



仅仅发布不到24小时,来自月之暗面的Kimi K2.5,已经登顶全球多个大模型榜单。

在权威榜单LMarena的最新排名中,Kimi K2.5在代码、文本等榜单中仅次于Claude 4.5与Gemini 3 Pro等顶级闭源模型,在全球开源模型中位居首位。



同样地,在著名独立评测机构Artificial Analysis的榜单中,Kimi K2.5也在所有开源模型中排名第一。



换言之,排在他前面的几乎都是算力资源约等于无限的闭源模型,而Kimi K2.5背后的算力资源,仅为美国竞争对手的1% 。

这也从某个侧面解释了,一个月前,Kimi获得的C轮融资大幅超募的“盛况”,且目前Kimi的B/C轮融资金额,已超过绝大部分IPO募资及上市公司定向增发规模,新的一轮据说还在进行中。

在中美芯片禁令的铁幕之下,H100和B200,已经成为受到严格管控的战略物资。中美之间的AI竞争,已经实质上变成了不对等的竞争,这甚至在更早之前就已经开始。

这样的条件下,新发布的Kimi K2.5模型,将视觉理解与推理、编程、Agent等能力全部集成到一个模型当中。正如创始人、CEO杨植麟所说,“我们重构了强化学习的基建,并专门优化了训练算法,以确保它能达到极致的效率和性能。”

在长文本和多模态的范式创新几近“卷无可卷”的当下,Kimi K2.5用全新的Agent Swarm架构,试图开拓一种全新的范式。而这种范式,极有可能在如今的中美AI竞争中,成为一种全新的变量。

01 从“单兵作战”到智能体“集团军”

在过去两年的大模型叙事中,行业陷入了一种对“超级单体”的迷信。无论是 GPT-4 还是早期的Kimi,都在试图训练一个全知全能的“大脑”,通过不断增加上下文窗口来容纳更多的信息。

Kimi曾依靠长文本建立了早期的市场心智,在K2时代通过强化思维链提升了逻辑推理的深度。然而,单体智能的 Scaling Law正在撞上一堵“看不见的墙”——无论单个爱因斯坦多么聪明,他都无法在几分钟内同时完成一百家公司的财务审计。

Kimi K2.5的核心突破,在于它果断放弃了对单体模型性能的过度追求,转而拥抱了“群体”的力量。这就是Agent Swarm(智能体蜂群)架构,计算范式由此发生根本性转移。

Swarm基于并行强化学习(PARL),能够将一个宏观的复杂任务瞬间拆解,并生成多达 100 个子智能体并行工作。这种架构上的变迁,好比从单核 CPU 的串行计算时代,跨越到了 GPU 的并行计算时代。

在Swarm的架构下,模型不再是一个孤独的思考者,而是一个拥有最高指挥权的“项目经理”。当用户抛出一个复杂需求时,K2.5 会即时评估任务的拓扑结构,现场决定招募多少个 Agent,并赋予它们不同的角色与权限 。



这些子智能体本质上是K 2.5的分身,但它们可以在同一时刻分别扮演代码审计员、法律顾问、数据分析师甚至视觉设计师。它们之间不再是线性的接力传递,而是网状的并行协作。这种“去中心化”的执行逻辑,直接打破了传统大模型在处理超长复杂任务时容易出现的注意力漂移和逻辑崩塌问题。

Kimi K2.5并没有像许多竞争对手那样,采用“拼接式”的方案——即用一个模型看图,另一个模型写代码,再用第三个模型做推理。它是一个原生多模态混合专家模型,拥有1万亿的总参数,但在单次推理中仅激活320亿参数。

在这个架构中,视觉、文本、视频甚至思考被压缩进了同一个神经网络中。

这就意味着,当Swarm中的一个视觉 Agent 看到网页截图时,它不需要经过中间的转译损耗,就能直接由负责代码的神经元生成生产级的HTML/CSS代码。这种“所见即所得”的端到端能力,是Swarm能够高效运转的生理基础。

02 “无限扩容”的数字劳动力

Swarm架构的实用性,在于它如何重新定义“工作流”的时间成本。尤其对于一些企业用户而言,购买AI服务的实质是购买降本增效和落地的“确定性”。

Kimi K2.5目前所展现的能力表,在某种程度上,已经可以被视为,充当了一种无限扩容的数字劳动力,而另一个无法绕过去的核心优势则是,其的确更具成本优势。

我们对比全球范围内认可度最高的编程与Agent模型的Claude来看,其开发方Anthropic主动对中国市场实施技术断供,这使得,国内字节跳动Trea、腾讯CodeBuddy等主流编程工具已下架该模型。

当然,即便没有上述这一层诱因,就长远周期来看,Claude高昂的API使用成本偏高,也会间接推动中国企业全面寻找其替代方案。

只不过,此前国产顶尖编程与Agent模型大多都是纯文本架构,缺乏视觉理解能力,实际应用中因无法解析图像,适用场景也相对受限,因此难以从绝对意义上替代Claude。

而这也是Kimi K2.5真正称得上“突破”的关键。Kimi K2.5不仅在编程能力上可与Claude抗衡,使用成本仅为其五分之一,视觉理解能力更实现对Claude的超越,成为兼具技术实力与成本优势的优质替代选择。

先进性与商业化等方面的多重优势,很快便得到了市场端给出的积极反馈:

海外知名编程工具Kilo Code作为Cursor的直接竞品,宣布将Kimi K2.5定为默认模型,并自掏腰包推出首周免费使用活动;国内腾讯旗下编程工具CodeBuddy等也已第一时间上架Kimi K2.5,并将其设为默认模型。

03 算力赤字下的突围

技术细节之外,如果将目光延展至当下中美AI竞争的格局,Kimi K2.5的发布便多了一层悲壮的色彩。

2026年的全球AI格局已呈现出泾渭分明的“双极”状态。大洋彼岸的OpenAI和Google DeepMind正在数万张H100/B200构成的算力海洋中,通过简单粗暴的Scaling Laws向AGI发起冲锋。这是一种大力出奇迹之美。

而处于芯片禁令铁幕之下的中国AI公司,则被迫进入了一场残酷的“非对称战争”,杨植麟在达沃斯提出的“1%资源论”,并不是一句玩笑。

在硬件获取受阻、存量芯片性能落后的客观现实下,Kimi无法像对手那样肆无忌惮地挥霍算力。K2.5的成功并非易事,即便用“被逼出来的”来形容亦不过分,它迫使团队必须在算法层面进行深度的压榨与重构。

除了显性的Swarm架构,Kimi也是全球首个在大型语言模型训练中跑通Muon优化器的公司,自研的线性注意力机制(Kimi Linear)在处理速度上已显著超越传统的全注意力系统,实现效率的跨越式提升。

基于此,K2.5 背后真正的独到之处,将模型训练效率提升了2倍,同时将内存占用减半。也就是说,在同样的硬件预算下,Kimi可以跑两倍的实验,或者在同样的显存限制下训练更大的模型。

Kimi正在验证一条区别于硅谷的“逆Scaling Law”道路:以算法效率换取算力宽度,以智能体协作换取单体参数。

如果这条路能跑通,中国AI产业不必被动等待国产芯片完全追平英伟达的单卡性能,而是通过高效的分布式Swarm架构,就可以在受限的硬件资源上,组合出超越单体巨人的智能涌现。

Kimi K2.5无疑是中国AI版图中最具“硅谷气质”的技术极客之一,颇具“孤勇者”气质。它向行业证明了,智能的进化不仅仅取决于你拥有多少张显卡,更取决于你如何组织和压榨现有的每一分算力。

在这场没有硝烟的战争中,Kimi暂时赢得了一个身位,但通往AGI的道路上,还要保持更强大的耐力和更坚韧的态度。新的征程,又一个新的开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
90%的广东人都不知道这样随礼是犯了大忌

90%的广东人都不知道这样随礼是犯了大忌

户外阿崭
2026-01-30 19:30:50
南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

白云故事
2025-03-14 19:05:07
印尼再获两艘6600吨超级护卫舰,垂发数量为054B两倍

印尼再获两艘6600吨超级护卫舰,垂发数量为054B两倍

众生的世界观
2026-01-29 17:16:58
民生人寿6.45亿踩雷始末:宝利德暴雷背后,一场豪门骗局与资本救赎的落空

民生人寿6.45亿踩雷始末:宝利德暴雷背后,一场豪门骗局与资本救赎的落空

经理人杂志
2026-01-30 16:55:52
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

一方聊市
2026-01-19 13:13:48
新帅已定!皇马彻底放弃阿韦洛亚,英超第三教头前来,夏窗大变动

新帅已定!皇马彻底放弃阿韦洛亚,英超第三教头前来,夏窗大变动

祥谈体育
2026-01-30 11:15:32
后续!博主曝光重庆饭店阴阳菜单:连本地人都坑,店长说漏秘密

后续!博主曝光重庆饭店阴阳菜单:连本地人都坑,店长说漏秘密

白浅娱乐聊
2026-01-30 17:01:04
3任国足主帅都不敢用,却被邵佳一成功激活,顶替王钰栋接班武磊

3任国足主帅都不敢用,却被邵佳一成功激活,顶替王钰栋接班武磊

老头的传奇色彩
2026-01-30 17:26:53
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

体坛大事记
2026-01-30 11:01:10
CBA再出超级后卫!轰43分,比外援还牛 球迷:郭士强看到了吧

CBA再出超级后卫!轰43分,比外援还牛 球迷:郭士强看到了吧

体育哲人
2026-01-30 21:53:37
林彪为何多次探望远离政治的贺子珍?孔东梅:恐怕只有一个原因

林彪为何多次探望远离政治的贺子珍?孔东梅:恐怕只有一个原因

小豫讲故事
2026-01-30 06:00:06
德国急了!千吨黄金要不回,欧洲集体抛美债,金融霸权或将崩塌?

德国急了!千吨黄金要不回,欧洲集体抛美债,金融霸权或将崩塌?

长星寄明月
2026-01-29 23:06:42
一个人情商能低到什么程度?网友:我故意找茬都说不出这话

一个人情商能低到什么程度?网友:我故意找茬都说不出这话

夜深爱杂谈
2026-01-28 18:14:00
贵州省委常委、贵阳市委书记胡忠雄,补选为贵州省政协副主席

贵州省委常委、贵阳市委书记胡忠雄,补选为贵州省政协副主席

新京报
2026-01-30 13:06:07
鹿哈将“成为”闫学晶?称连30万都拿不出来,忘记初心易翻车

鹿哈将“成为”闫学晶?称连30万都拿不出来,忘记初心易翻车

然哥闲聊
2026-01-30 21:00:03
“正常爹看女儿,就不可能是这种眼神”,女儿被爸爸压腿视频火了

“正常爹看女儿,就不可能是这种眼神”,女儿被爸爸压腿视频火了

妍妍教育日记
2026-01-30 21:56:10
大S雕像揭幕官宣!出席名单曝光,汪小菲带娃登金宝山成最大看点

大S雕像揭幕官宣!出席名单曝光,汪小菲带娃登金宝山成最大看点

八卦王者
2026-01-30 11:12:18
重庆市启动独生子女父母奖励:发放标准、申领流程、所需材料?

重庆市启动独生子女父母奖励:发放标准、申领流程、所需材料?

云鹏叙事
2026-01-30 09:13:26
2026-01-30 23:16:49
竞合人工智能 incentive-icons
竞合人工智能
专注于探讨人工智能领域最新动态、技术突破和行业应用。
110文章数 21关注度
往期回顾 全部

数码要闻

库克称AirPods Pro 3太火了,苹果始料未及

头条要闻

博士生在意失联 姐姐:父母搬砖供他 眼看要熬出头了

头条要闻

博士生在意失联 姐姐:父母搬砖供他 眼看要熬出头了

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

科技要闻

意念控制机器人不是科幻 1-2年就落地

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

教育
艺术
游戏
时尚
军事航空

教育要闻

数学提分的关键,从来不是多做题

艺术要闻

风景画选刊 | 中国油画学会三十年艺术展

《马拉松》限定手柄发布!色调大胆视觉张力拉满!

今日热点:《闪灵》今日上映;保险公司确认金晨方曾放弃索赔……

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版