网易首页 > 网易号 > 正文 申请入驻

实测Kimi K2.5:召唤 100 个 AI 同时干活,这就是 Agent的「蜂群时刻」

0
分享至

  Kimi K2.5 带来了一个「蜂群时刻」。

  这两天 K2.5 的更新在海内外都赚足了讨论,一个原生多模态模型,提供了最先进的编码和视觉功能,以及自主智能体集群范式——召唤一群 agent 过来完成任务,听上去也太酷了。

  如果你还没体验过,快来参与本期的福利放送:Kimi 和 APPSO 给大家准备了一批 Kimi Agent 日卡福利,包括24 小时会员+ 3 次集群功能使用,专属链接稍后会掉落在留言区,先到先得,期待大家体验后回来与我们分享使用感受。

  

  技能多 Agent,好酷炫好好玩

  K2.5 目前已经全量推出,客户端即可使用。K2.5 Agent 有免费体验次数,而 K2.5 集群则是付费功能,目前只对 Allegretto 计划。订阅了也有点数限额:每个月起步 47 点,每次任务消耗 3 点。

  总体上是够用的,作为 Kimi 老用户,当然是买,买它。正好手边有一堆文件需要合并,懒得手动复制粘贴了,就发给 Kimi 打开集群模式让它统一处理。

  

  集群模型下,Kimi 还给这个地方加了个设计:会有一个工牌掉落下来,你可以看到是哪位「负责人」在执行任务。

  

  合并文档最终的效果不错,而且我还进一步提出让它整理和调整各个层级的小标题,它可以实现先分析、提方案、再执行的链路。不过最好是下载到本地检查格式,Kimi 自带的预览功能,有时候不能准确反映当轮次的修改效果。

  为了进一步看它的多并发操作,我参考官方 demo,测试了一个任务:检索近三个月内所有关于集群式 agent 的文献,然后整理到一个 excel 表格里,提炼核心发现和研究创新点。

  

  这次安排的「人员」就比较多了,各个 agent 纷纷赶来支援,每个人都有自己分配到的任务。

  

  这个的耗时明显比之前要长了很多,但没关系,可以先挂机让它自己跑。同时,我又安排了一个考察多模态能力的任务。

  

  这是上传给 Kimi 的原始素材图,视频版中有更多动效。Kimi 要做的是把这个设计,转换为网页,而且保留所有的设计元素、风格。

  

  Prompt 写得简单,但实际工作是复杂的:既要识别、理解,又要生图,还要写前端。

  这个任务也花了比较长的时间,但最终效果很好。有一些小细节上的问题,比如图片排版、悬停和跳转等 bug。不过核心的设计元素都保留了,并且网页功能也完备。

  

  再回头来看,文献检索的任务也好了,整整齐齐列了一个 excel 出来:

  

  最后一个测试任务是:上小红书找达人,要求是数码博主,粉丝量大于 5000,累计笔记多于 100 条。这两个条件其实很宽松,真的找起来范围很大。

  

  Kimi 碰到的第一个问题是:进不去小红书。其实这里可以主动询问用户,类似 GPT agent 会用的办法。

  但并没有,Kimi 转而去了新榜抓数据,这样既绕开了网页权限,又能直接读取数字。这不算是个很好的策略,最后只能抓出来数量很少的博主,显然小红书上不可能只有这些。另外,被挡在平台外,也无法体现 Kimi 的视觉能力,毕竟抓取的都是现成的数字。

  

  不过总体上,Swarm Agent 给人一种踏实感。这些工作单体 agent 能不能做?自然是可以,只是要花时间、错漏多。而一群人来做,更加的令人安心。

  创「新」在哪里?

  说到这里,你可能会问:这不就是 Multi-Agent(多智能体)吗?很多公司都在做啊。

  关键区别在于「谁来当老板」。

  在传统的 Multi-Agent 系统中,人类需要预先设计好整个工作流程:谁负责什么、谁先谁后、结果怎么汇总。就像搭积木一样,你得先把图纸画好。而 Agent Swarm 的核心创新在于——AI 自己就是设计师。

  Kimi 团队用了一种叫 PARL(Parallel-Agent Reinforcement Learning,并行代理强化学习)的训练方法,让模型学会了「分解任务」和「调度资源」的能力。你不需要告诉它「先派 3 个人去搜资料、再派 2 个人去写总结」,它自己就能判断:这个任务适合拆成几份?每份派谁去做?什么时候该并行、什么时候该串行?

  换句话说,Multi-Agent 是「人类编排的交响乐团」,Agent Swarm 是 AI 自己组队的爵士乐。

  

  还有一个容易混淆的概念是 MoE:Mixture of Experts,混合专家模型。主流大模型内部都用了 MoE 架构,但它们和 Agent Swarm 完全是两回事。

  MoE 发生在模型内部。你可以把它理解为:模型里住着一群「专家」,每次处理任务时,模型会动态决定激活哪几个专家来参与。但这些专家没有独立的身份,也不会互相协作,它们只是模型内部的不同计算路径。

  Agent Swarm 发生在模型外部。每个子 Agent 都是一个相对独立的执行单元,有自己的任务目标,可以并行运行,甚至可以调用工具(比如搜索网页、写代码)。它们之间是真正的「协作关系」,而不是简单的「激活关系」。

  用个不太严谨的比喻:MoE 像是一个人的大脑里分区工作,Agent Swarm 像是一个公司里的团队协作

  从实测和官方演示来看,Agent Swarm 至少在以下几类任务上表现出色:

  第一类是大规模信息收集。 比如官方案例中 100 个领域创作者调研,以及我们这次实测的小红书博主检索。处理这类任务的共同特点是「可并行」——每个子任务相对独立,不需要太多中间协调。

  

  第二类是视觉+代码的复杂任务。 Kimi K2.5 强调自己是「原生多模态」模型,能看懂图片和视频。结合 Agent Swarm 后,它可以一边分析 UI 截图,一边派不同 Agent 分别处理布局、样式、交互逻辑,最后生成完整的前端代码。

  

  第三类是长文档处理。 官方提到,Kimi Agent 可以处理「1 万字的论文或 100 页的文档」,支持 Word 批注、Excel 透视表、LaTeX 公式等高级功能。Agent Swarm 可以把长文档拆成多个章节,让不同 Agent 并行处理,再汇总成统一格式——正如最开始的实测案例一样。

  不过,别急着兴奋,Agent Swarm 并非「开了挂」。在实际使用中,你会发现几个明显的边界:

  第一,任务本身得「可拆」。 如果任务步骤之间有强依赖关系——比如「先想清楚论点,再去找证据,最后才能写结论」——强行并行反而会帮倒忙。

  第二,成本会显著上升。 100 个 Agent 同时工作,意味着 100 倍的 API 调用。虽然总时间缩短了,但 Token 消耗是实打实的。

  第三,质量不一定比单 Agent 好。 在某些需要深度推理的任务上,比如数学证明、复杂编程题,单 Agent 的「深度思考模式」反而更可靠。Agent Swarm 的优势在于「广度」和「速度」,而不是「深度」。实测下来,部分任务 Kimi 会自动调剂成单 Agent 模型,这点 Kimi 团队成员也在 reddit 的线上问答里得到了证实。

  

  Kimi 团队眼中的未来

  从目前的使用体验来看,集群还可以继续提升,包括但不限于:

  更智能的调度:目前的 Agent Swarm 已经能自动分解任务和创建 Agent,但调度策略还比较「粗粒度」。未来有希望能建立更精细的资源分配——比如根据任务的紧急程度、复杂度、依赖关系,动态决定「派多少人、干多久」。

  更深度的协作:现在的子Agent之间交流有限,主要是「各自干完活,把结果交给老大汇总」。未来可能会支持子Agent之间的直接协作,比如「AAgent发现一个问题,可以主动呼叫 BAgent来帮忙」。

  更广泛的工具集成:扩展 Agent 可以调用的工具库,包括但不限于更多的办公软件、开发环境、数据分析工具。目标是让 Agent Swarm 能真正「端到端」地完成复杂工作流。

  在 Reddit 的 AMA(Ask Me Anything)活动中,Kimi 团队也回答了大量关于技术、产品和愿景的问题。透过这些回答,我们可以拼凑出他们对 Agent Swarm 乃至整个 AI 未来的思考。

  AMA 中还有一个问题很有意思:许多说法称,scaling law 已经碰到了上限,团队如何看待这个问题呢?

  杨植麟的回答是:Agent 集群就是他们走出的尝试。展望未来,或许会出现一种几乎不、甚至完全不需要人类先验信息的模型。

  

  这个愿景听起来有些理想化,但细想之下颇有深意。过去两年,AI 领域一直在「卷参数」——模型越来越大、算力越来越贵。而 Agent Swarm 代表了一种不同的思路:与其让一个超级大脑做所有事,不如让一群大脑分工协作。

  这可能才是通向 AGI 的更务实路径:单独一只蜜蜂并不起眼,但当成千上万只蜜蜂协同工作时,它们能建造出精妙的蜂巢。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
区区副厅级干部回国,17人到机场迎接,河南省委书记带头减排场

区区副厅级干部回国,17人到机场迎接,河南省委书记带头减排场

阿离家居
2026-06-01 14:29:14
原价26.7万的增程式电车,二手暴打1.8折,保值率惨不忍睹

原价26.7万的增程式电车,二手暴打1.8折,保值率惨不忍睹

闲搞机
2026-05-30 11:05:41
U19国足劲敌!越南U19阵容:拥有日本主帅,西乙中场和归化名将

U19国足劲敌!越南U19阵容:拥有日本主帅,西乙中场和归化名将

湖北的老球迷
2026-06-01 18:54:57
科技股调整,原因找到了

科技股调整,原因找到了

新浪财经
2026-06-01 12:56:08
肖纯锦临刑在即,其妻哭求陈毅,一通电话救下昔日恩人

肖纯锦临刑在即,其妻哭求陈毅,一通电话救下昔日恩人

唠叨说历史
2026-03-28 15:04:59
苹果官方重新上架二手 iPhone 16 ,售价惊人!

苹果官方重新上架二手 iPhone 16 ,售价惊人!

XCiOS俱乐部
2026-06-01 12:35:26
唐嫣素颜进幼儿园!6岁女儿戴皇冠萌翻全场,罗晋全程冷脸零互动

唐嫣素颜进幼儿园!6岁女儿戴皇冠萌翻全场,罗晋全程冷脸零互动

优墨出品
2026-05-30 08:57:35
亚历山大和主帅公然批评!拿着顶薪打得不如蓝领,球队还当非卖品

亚历山大和主帅公然批评!拿着顶薪打得不如蓝领,球队还当非卖品

你的篮球频道
2026-06-01 08:01:27
国乒2026教练名单敲定!消失9年的乒乓王子,终究没能重返国家队

国乒2026教练名单敲定!消失9年的乒乓王子,终究没能重返国家队

妙娱连珠
2026-06-01 15:44:09
沈阳12小时出现576次闪电!怎么形成的?

沈阳12小时出现576次闪电!怎么形成的?

极目新闻
2026-06-01 20:32:06
DeepSeek预测:未来三年,普通家庭升值最快的3项资产,越早布局越好

DeepSeek预测:未来三年,普通家庭升值最快的3项资产,越早布局越好

十点读书
2026-06-01 19:23:36
鸟巢演唱会后地铁“免检票”,时隔两天收到催缴短信?官方回应

鸟巢演唱会后地铁“免检票”,时隔两天收到催缴短信?官方回应

新京报
2026-06-01 17:59:41
特朗普不愿看到的事发生,卡尼向中方献计,废除美国一项地位?

特朗普不愿看到的事发生,卡尼向中方献计,废除美国一项地位?

湘评中外
2026-06-01 20:07:11
印度已经绝望,四重危机正在斩断国运,再过25年,他们可能亡国

印度已经绝望,四重危机正在斩断国运,再过25年,他们可能亡国

贱议你读史
2026-06-01 00:40:03
刘少奇之子刘源身陷困境求助宋庆龄,九字回复令他动容

刘少奇之子刘源身陷困境求助宋庆龄,九字回复令他动容

唠叨说历史
2026-05-29 14:16:53
2026法网第10日:四强争夺战开启,丰塞卡夜场大战门希克

2026法网第10日:四强争夺战开启,丰塞卡夜场大战门希克

全网球APP
2026-06-01 21:23:32
A股:收盘后,两个重要信息落地,明天,周二或要这样走!

A股:收盘后,两个重要信息落地,明天,周二或要这样走!

明心
2026-06-01 16:38:52
从过气名帅到巴黎封神,恩里克手握三座欧冠,凭什么比肩瓜帅齐祖

从过气名帅到巴黎封神,恩里克手握三座欧冠,凭什么比肩瓜帅齐祖

刘哥谈体育
2026-06-01 13:35:36
歼-35总师“道破天机”:中国的两款六代机,可能再一次出人意料

歼-35总师“道破天机”:中国的两款六代机,可能再一次出人意料

小莜读史
2026-05-30 21:37:09
教育部明确:高考命题突出反套路导向 莫信AI或“专家”押题

教育部明确:高考命题突出反套路导向 莫信AI或“专家”押题

闪电新闻
2026-06-01 12:01:20
2026-06-01 22:44:51
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6439文章数 26846关注度
往期回顾 全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计!

头条要闻

女孩14年后打开亡兄的QQ 相册里藏着"最最最爱的妹妹"

头条要闻

女孩14年后打开亡兄的QQ 相册里藏着"最最最爱的妹妹"

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树过会,杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

时尚
家居
艺术
本地
公开课

夏天裤子不用多买,阔腿裤一整个夏天都能穿,日常出行好打理

家居要闻

自信舒展 高背座椅

艺术要闻

吴镇写竹,清清爽爽

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版