网易首页 > 网易号 > 正文 申请入驻

超越单体智能|多智能体系统的协作、归因与自我演化综述

0
分享至



本文由西安交通大学 MOE KLINNS Lab 联合华中师范大学、联想人工智能技术中心、悉尼大学等机构的研究者共同完成。共同第一作者为齐世豪、马杰、邢瑞、郭威、黄潇,通讯作者为来自西安交通大学网络空间安全学院的马杰特聘研究员(副教授)。

过去两年,AI 智能体正在从「会对话的模型」变成能够理解任务、拆解步骤、调用工具、维护记忆并根据反馈调整行为的系统。当任务复杂到单个智能体难以完成时,研究者开始把多个智能体组织起来,让它们分工协作。 但系统规模扩大后,问题也随之复杂。

任务失败时,错误可能来自智能体能力、角色分配、通信过程、工具调用,也可能在多轮交互中被逐步放大。更进一步,系统能否根据失败经验调整角色、通信结构或协作流程,仍是当前研究面临的重要问题。

围绕这些问题,研究团队撰写了一篇系统综述,面向 LLM 多智能体系统提供了一个完整的观察框架:从单个智能体的能力基础,到多智能体协作,再到系统失败后的归因,以及基于失败经验的自我演化。



  • 论文标题:Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems
  • 论文链接: https://arxiv.org/abs/2605.14892
  • 项目仓库: https://github.com/mira-ai-lab/awesome-mas-life



图 1:LIFE 框架总览图


一、多智能体系统,不只是「多几个 Agent」

今天的 LLM 智能体,已经不再是简单的输入输出模块。围绕大语言模型,研究者加入了推理、记忆、规划、工具使用等机制,使其能够理解任务、制定计划、调用外部工具,并根据执行结果调整后续动作。这些能力构成了多智能体系统的基础。推理能力决定智能体能否处理复杂指令,记忆能力决定它能否利用历史信息,规划能力决定它能否拆解长程任务,工具使用能力则决定它能否突破模型自身的知识和执行边界。

如果缺少稳定的单体能力,多智能体协作很容易变成多个不稳定模块的叠加。协作并不会自动带来更强的智能,反而可能放大错误、增加沟通成本,并让系统表现更难预测。



图 2:LLM-based Agent 的能力模块示意图

二、协作:让智能体从个体走向组织

多智能体系统的核心首先是协作。

在现有研究中,协作机制通常围绕角色、通信、调度和交互模式展开。角色决定不同智能体的职责,通信决定信息如何在智能体之间流动,调度决定任务如何推进,交互模式则与具体任务密切相关。代码生成、科学发现、网页操作、复杂问答、游戏环境,对协作方式的要求并不相同,很难依靠一种固定流程覆盖所有场景。

这些设计让智能体从「单点能力」进入「组织能力」。它们不再只是各自输出答案,而是通过分工、沟通和调度共同完成更复杂的目标。与此同时,协作也会放大系统的不确定性。一个早期判断可能影响后续分工,一次不完整的信息传递可能改变整个任务路径,一个工具调用错误也可能被后续智能体继续引用。多智能体系统越像一个组织,就越需要理解组织内部的问题从何而来。



图 3:多智能体协作中的角色、通信与调度结构

三、归因:理解失败,而不只是记录失败

在单智能体系统中,失败往往可以回到一个相对清晰的输入输出过程里分析。但在多智能体系统中,失败很少只来自一个孤立步骤。一个早期错误判断可能影响后续任务分解,一次不准确的工具调用也可能被后续智能体当成可靠证据继续使用。

因此,多智能体系统需要的不只是最终评测分数,还需要对失败过程的分析。故障归因要追问的是:失败发生在哪个阶段?涉及哪些智能体?错误来自能力不足、角色设计、通信机制、调度策略,还是环境交互?错误又是如何在系统内部传播的?

现有很多研究更关注如何构造协作流程、如何提高最终性能,却较少讨论系统失败之后如何诊断。但如果没有归因,多智能体系统的改进就很容易变成盲目试错。系统表现不好,并不直接说明应该改模型、改提示词、改角色分工、改通信协议,还是改整个组织结构。在这篇综述中,归因被放在协作与演化之间,作用是把系统失败转化为可诊断、可修复的问题。



图 4:多智能体系统中的错误传播与故障归因示意图

四、自我演化:从修正输出,到改进系统

如果归因关注「哪里出了问题」,自我演化关注的则是「系统如何因此变得更好」。很多智能体系统已经引入了反思机制:模型总结失败原因,修改下一轮回答,或者调整提示词。这类方法有价值,但对于多智能体系统来说还不够。

因为多智能体系统的改进对象不只是某个智能体的输出,也可能是整个系统结构。

  • Agentic Self-Evolution:面向单个智能体自身的演化,主要更新提示词、记忆或参数等内部组件,让智能体在后续任务中表现得更稳定。
  • Systemic Self-Evolution:面向多智能体系统内部结构的演化,关注通信拓扑、智能体组合、共享记忆等系统级组件,让多个智能体之间的协作方式能够随任务和反馈调整。
  • Meta Self-Evolution:面向系统设计空间的演化,通过积累历史设计经验或训练生成器,自动产生更适合不同任务的多智能体架构。

这意味着,多智能体系统的自我演化并不只是「让模型反思」一下。它更接近一种系统级调整:根据任务表现和失败反馈,持续修改自身的行为、结构和协作方式。



图 5:从失败归因到系统自我演化的闭环

五、LIFE 框架:理解多智能体系统的完整生命周期

这篇综述提出的 LIFE progression,可以理解为对 LLM 多智能体系统运行过程的一种梳理。它包含四个连续阶段:

  • Individual Intelligence:个体智能,关注单个智能体的推理、记忆、规划和工具使用能力;
  • Multi-Agent Collaboration:多智能体协作,关注角色、通信、调度和交互机制;
  • Failure Attribution:故障归因,关注系统失败后的定位、解释和诊断;
  • Self-Evolution:自我演化,关注系统如何根据反馈持续调整自身。

以往综述往往分别讨论个体能力、多智能体协作或自我改进。LIFE 框架则把这些方向放到同一个生命周期中观察:个体能力提供协作基础,协作机制带来系统级复杂性,故障归因让失败过程变得可分析,自我演化则把诊断结果转化为后续改进。

因此,LIFE 关注的不只是「有哪些方法」,而是一个多智能体系统如何运行、如何失败,以及如何在失败之后调整。

六、未来展望

LLM 多智能体系统已经展示出处理复杂任务的潜力,但要走向长期可靠的应用,仍需要在几个关键方向上继续推进。

  • 更全面的评测体系:现有评测仍然偏重任务成功率,而多智能体系统还需要考察通信效率、角色贡献、错误传播、环境适应性和长期稳定性。
  • 更灵活的协作结构:当前很多系统仍依赖人工设定角色、流程和通信方式。未来的系统需要根据任务需求动态调整组织方式,包括角色分配、通信路径、调度策略和协作结构。
  • 更有效的归因与修复闭环:多智能体系统的失败往往跨越多个角色和多轮交互。归因的价值不应停留在解释错误,而应进一步指导系统修复,例如调整提示词、重新分配角色、修改工具调用方式或优化整体流程。
  • 更可控的自我演化机制:当系统开始调整自身结构时,效率、安全和对齐问题会变得更加重要。未来的自我演化不能只是搜索更高性能的结构,还需要在成本、稳定性和可控性之间取得平衡。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
丰田回应中止下一代纯电轿车开发

丰田回应中止下一代纯电轿车开发

财联社
2026-05-30 21:56:05
听同学建议:拒绝了月薪25000的大厂工作,去了月薪5000的体制内。结果发现这个同学自己选择了大厂,这算什么事

听同学建议:拒绝了月薪25000的大厂工作,去了月薪5000的体制内。结果发现这个同学自己选择了大厂,这算什么事

励职派
2026-05-31 12:45:45
你闻过最臭的是什么?网友:邻居以为我们在煮屎

你闻过最臭的是什么?网友:邻居以为我们在煮屎

夜深爱杂谈
2026-05-31 08:26:28
又是杜锋的错?22岁小将合同到期,拒绝续约广东队,徐昕开了好头

又是杜锋的错?22岁小将合同到期,拒绝续约广东队,徐昕开了好头

体坛大事记
2026-05-31 12:45:20
演员于笑白血病康复,在医院向医生女友求婚成功

演员于笑白血病康复,在医院向医生女友求婚成功

大象新闻
2026-05-31 17:16:59
山东网友打算买龟,多个商家直言“山东不卖”,评论区全是电商泪

山东网友打算买龟,多个商家直言“山东不卖”,评论区全是电商泪

谭谈社会
2026-05-30 15:06:18
上海基本盘太稳了!古德温兜底,2锋线强输出,还能逼出最强弗格

上海基本盘太稳了!古德温兜底,2锋线强输出,还能逼出最强弗格

篮球资讯达人
2026-05-31 21:43:46
释永信在监狱能申请吃素不能

释永信在监狱能申请吃素不能

熊太行
2026-05-30 14:45:23
徐帆回应离婚才9个月,68岁冯小刚和养女贴脸拍照亲密 ,关系很好

徐帆回应离婚才9个月,68岁冯小刚和养女贴脸拍照亲密 ,关系很好

沧海一书客
2026-05-31 18:08:08
最新!总台人事变动

最新!总台人事变动

广电头条
2026-05-31 20:13:34
结婚3年,吴千语首晒上海婚房,全程自己设计,老公负责拎包入住

结婚3年,吴千语首晒上海婚房,全程自己设计,老公负责拎包入住

椰黄娱乐
2026-05-30 11:07:49
古代犯人发配需要衙役押送,往返几千里路,衙役是不是也很遭罪?

古代犯人发配需要衙役押送,往返几千里路,衙役是不是也很遭罪?

小豫讲故事
2026-05-29 06:00:15
中国没给面子,普京回国后沉默一周认清现实,终究找上哈萨克斯坦

中国没给面子,普京回国后沉默一周认清现实,终究找上哈萨克斯坦

聚焦真实瞬间
2026-05-31 02:19:21
国家正式正式批复!全国唯一,深圳又一国家级中心来了

国家正式正式批复!全国唯一,深圳又一国家级中心来了

深圳梦
2026-05-31 21:09:35
全网直播德甲决赛!樊振东为何还用Z03套胶?周子豪道出真相!

全网直播德甲决赛!樊振东为何还用Z03套胶?周子豪道出真相!

好乒乓
2026-05-31 11:21:17
周末炸雷!17家公司集中爆利空,3家立案10家退市

周末炸雷!17家公司集中爆利空,3家立案10家退市

慧眼看世界哈哈
2026-05-31 12:57:11
王凤英:在长城年薪500万没股份,到小鹏仅2个月,手握股权近亿元

王凤英:在长城年薪500万没股份,到小鹏仅2个月,手握股权近亿元

大鱼简科
2026-05-31 10:02:57
是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

阿龙聊军事
2026-05-30 07:47:52
1935年,如果将泸定桥炸毁,红军可能全军覆没,刘文辉为何没炸?

1935年,如果将泸定桥炸毁,红军可能全军覆没,刘文辉为何没炸?

健康快乐丁
2025-03-29 20:30:04
15万!蔚来"神车"官宣:5月29日 ,正式发布亮相

15万!蔚来"神车"官宣:5月29日 ,正式发布亮相

科技堡垒
2026-05-29 11:14:19
2026-05-31 22:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13126文章数 142656关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

女子在家洗澡浑身赤裸 一醉汉闯入拖她进房间欲"猥亵"

头条要闻

女子在家洗澡浑身赤裸 一醉汉闯入拖她进房间欲"猥亵"

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

旅游
房产
本地
游戏
公开课

旅游要闻

“六一”儿童节,一起漫步上博东馆(文末探索宫活动互动有奖)

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

本地新闻

用剪纸的方式,打开江苏扬州

LCK第二赛段:大龙毁一生!DK零封NS,结束常规赛

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版