(文/陈济深 编辑/张广凯)
1月27日,中国AI届上演了一场史无前例的“饱和式轰炸”:DeepSeek、通义千问、月之暗面——代表中国开源最强战力的“三杰”,不约而同地在同一天发布重磅更新。
![]()
不过当天霸占热搜C位、让海外科技圈刷屏的,却是Kimi K2.5。截止到今天上午,外网相关发布量超过1.7万,热度超过了OpenAI发布的科研写作神器Prism。
![]()
为什么是Kimi?答案藏在杨植麟那段略显朋克的演示视频里。
杨植麟以一贯的极客风格,在一间略显朋克的会议室里,用一段全程中文的视频演示了新模型的各种全新能力。
![]()
这一幕,很容易让人联想到一年前的Manus演示——那个发誓要“终结人类繁琐工作”的通用Agent。
但不同的是,K2.5加入了原生多模态,让模型理解屏幕上的一切;推出了智能体集群,让AI像包工头一样瞬间调度上百个分身并行协作。
更重要的是,这不再是一个画饼的Demo,而是一次面向中文互联网世界的生产力实装。
从这个视角出发,杨植麟过去两年的技术路线图就变得异常清晰且连贯:从K1时代用超长上下文打穿“记忆”,构建数字员工的大脑;到K2时代通过智能体解决“行动”,构建手脚;再到如今K2.5时代用多模态和集群解决“感知与组织”,彻底补齐了五官与协作能力。
一个能看、能想、能干、能协作的“超级个体”终于成型。
开局一张图,内容全靠AI编
在SWE-Bench Verified(编程)和HLE(人类最后考试)等硬核基准测试中,Kimi不仅超越了DeepSeek V3位列开源第一,甚至在多项指标上击败了闭源的GPT 5.2和Gemini 3 Pro实现了全球第一。
![]()
但比起跑分真正让从业者背脊发凉的,而Kimi是视觉能力的落地。
如果说去年7月发布的K2让Kimi有了智能体和编程能力,此次K2.5的核心升级之一是原生多模态(Native Multimodal)。
所谓“原生”,意味着视觉理解能力并非外挂模块,而是从架构层面就与语言、代码能力血肉相连。
在实际测试中,这种能力完全颠覆了传统的产品开发流程:用户只需在白板上画一个潦草的网页草图,甚至拍下纸巾上的涂鸦,扔给Kimi并描述“帮我实现它”。几秒钟后,K2.5不仅“看懂”了布局,更自动补全设计细节,生成包含完整HTML、CSS和JS的可运行代码。
![]()
更令人惊叹的是它的“动态理解”能力。当录屏一个竞品网站的交互效果并要求“复刻但换肤”时,K2.5能精准解析出按钮悬停特效、卡片翻转动画等动态逻辑。这不再是简单的“识图”,而是对“交互逻辑”的深度复刻。
这意味着“交互成本”的骤降乃至归零。
过去,一个创意从脑海到上线,需要经历“产品经理PRD>UI设计>交互标注>前端开发>QA测试”的漫长链条,整体流程时长需要用周乃至月作为单位。
而K2.5让这个链条瞬间坍缩为一个节点:“决策者直连Kimi”。
更关键的是“审美溢价”。K2.5生成的代码不再是“能跑”的半成品,而是具备合理留白、协调配色和现代审美的“可交付品”。
当“所见即所得”进化为“所见即生成”,Kimi正在成为“初级前端工程师+UI设计师”的功能集合体。
从清华学霸到“一人成军”的包工头
如果说视觉能力解决的是“单点生产力”,那么K2.5祭出的另一张王牌——智能体集群(Agent Swarm)则试图重构企业的组织形式。
以往,Kimi的标签是“读书好的高材生”。但K2.5的发布,让其人设一夜之间转向了又聪明又能够统筹全局的“包工头”。
传统AI无论多强,面对用户时依然是“单体实习生”。即便是试图多开AI界面,不仅操作繁琐,一旦任务复杂或者文本较长,经常也会出现这边忘记了那边说过啥的顾此失彼。
K2.5引入的Agent Swarm架构,让主模型具备了“摇人”的能力——面对复杂任务,Kimi会自动扮演“总指挥”,瞬间创建并调度数十个AI分身。
![]()
想象这样一个场景:你需要汇报“100家竞品的定价策略分析”。
在过去,这意味着调动一个3人小组耗时一周。而在K2.5的逻辑里,Kimi会自动召唤一支“AI特遣队”:有的负责搜索采集,有的负责数据清洗,有的负责挑刺审核,有的负责报告撰写。这些Agent并行作业、互相校验,最终将成果汇总交付。
除了性能的提升,Kimi在效率上也有较大突破。
在大规模搜索(wide search)场景下,与单 Agent 执行相比,Agent 集群将达成目标性能所需的最少关键步骤减少了3到4.5倍,且随着目标要求的提升,节省幅度进一步扩大;通过并行化,实际运行时间(wall clock)最高可缩短4.5倍。
这也意味着该技术在Office场景中的落地,展现出极强的商业穿透力。
K2.5可以深度潜伏进Excel、Word等现有工作流。当用户处理万行数据表时,Kimi在后台调度的“隐形军队”能将原本需要数天的工作量压缩至几分钟。
这便是资本最看重的“人效杠杆”。
Agent Swarm指向了一种全新的可能:一个人加上足够的Agent算力,可以拥有一个团队甚至一家微型咨询公司的产出能力。
SaaS已死,Service永生
在K2.5发布后回头看,就能理解一级市场对Kimi追捧的核心逻辑。
月之暗面在12月31日官宣完成5亿美元融资(估值43亿美元)后不到一个月,新一轮资方就将月之暗面的估值推向48亿美元,其逻辑非常赤裸:这家公司瞄准的从来不是“卖铲子”,而是“直接帮你挖井”的生意。
表面上看,这是一次产品能力的升级。但深入商业底层,会发现一个更根本的范式转移:从软件(Software)到服务(Service)。
在SaaS时代,软件巨头卖的是“工具”,企业买来后还得雇人操作。K2.5所指向的Agent时代,颠覆了这一契约。月之暗面的逻辑发生了质变——“我不卖铲子,我直接帮你挖井。”
这里有一个关键的商业疑问:K2.5是开源的,企业难道不能自己部署吗?月之暗面怎么赚钱?
答案在于“算力门槛”与“生态锁定”。养一支百人规模的AI Agent军团,其背后的推理成本(显卡、运维、电力)是惊人的。
对于绝大多数企业,自己部署“数字员工”的成本远高于直接购买月之暗面的云端服务。月之暗面通过开源确立了标准,再通过极致优化的API服务去实现利润。
对于企业主而言,这种价值主张极具吸引力。假设一位初级工程师年薪20万,而Kimi订阅费加API成本不足2万,且能完成其80%的工作——那么预算的转移将是不可逆的。
杨植麟在内部信中也印证了这个趋势,在K2.5上线前的2025年下半年,公司全球付费用户数月增速达170%,11月以来海外大模型API收入增长4倍,这不仅证明了开源模型可以实现商业闭环,更证明了市场愿意为“结果”付费。
更重要的是,月之暗面切入的不仅仅是软件市场,更是规模超3000亿美元的业务流程外包(BPO)市场。客服、数据录入、财务处理等工作,正是Agent最容易攻陷的腹地。当AI开始以“服务交付”的形式计费,它就不再是软件市场的参与者,而是直接进入了劳动力市场。
AI+软件(SaaS)的天花板只是企业的IT预算,而AI+劳动力(Service)的天花板是整个GDP。
当人们还在惊讶于硅谷的 Cowork 概念或 Clawdbot 的自动化演示时,Kimi已经把这些能力封装成了一个人人可用的“K2.5”,并用全中文的生产力环境实现了落地。
这些近期爆火的Agent工具证明了一件事:AI正在从“Copilot”(副驾驶)全面进化为“Coworker”(同事)。 这是一个不可逆的时代洪流。
在发布视频中,杨植麟提到Kimi的目标是"Scale the variety of agents"(扩展智能体的多样性)。但深度体验K2.5后,你会发现真正被Scale(扩展)的,不仅仅是Agent的数量,而是每一个使用者的野心边界。
从今天起,一个创业者不再需要一支庞大的团队,只需要足够的算力配额;一家公司的核心资产不再只是“人头数”,而是“Agent调度能力”。
这条边界最终会被推到哪里?
这个问题的答案,不在杨植麟的技术路线图里,而在每一个开始学会像CEO一样指挥Kimi的人手中。
当AI从"工具"进化为"同事",真正被重新定价的,不是技术,而是人的想象力边界。
Kimi走过的每一步,都在告诉市场一个朴素的真理:技术的终极价值,不在于它有多聪明,而在于它让多少人变得更强大。
2026,AI不再是风口,而是风本身。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.