网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Multi-Agent系统为何常“翻车”？伯克利指出其具有人类合作所有坏毛病！

2025-04-12 18:11:15　来源: 人工智能学家

北京举报

0

分享至

来源：深度学习自然语言处理

论文：Why Do Multi-Agent LLM Systems Fail? 链接：https://arxiv.org/pdf/2503.13657

多智能体系统为何“翻车”？

14种失败模式与3大致命陷阱

研究者分析了150多个任务对话记录（总文本量超15万行），发现失败根源可归结为三大类：

① 规则崩坏（Specification Failures）

AI员工擅自篡改需求（如把象棋输入从“Kc8”改成坐标）

② 团队内耗（Inter-Agent Misalignment）

程序员和架构师“鸡同鸭讲”7轮对话毫无进展
明知API文档有误却隐瞒不报

③ 验收摆烂（Verification Failures）

真实案例：象棋游戏为何变成坐标输入器？

论文披露了一个经典翻车现场：用户要求开发支持国际象棋标准记谱法（如Qd4）的游戏，结果Agent团队交付的版本只能用(x1,y1)坐标输入。

更离谱的是，测试环节只检查代码能否编译，完全忽略规则验证。这就好比验收新房时，监理只数门窗数量，却不管厕所有没有下水道。

数据显示，47%的失败可追溯至验证环节。但论文强调：“不能全怪质检员”。就像建筑坍塌不能只怪验收，钢筋偷工减料、图纸错误等前期问题才是根源。

研究者发现，即便给验证AI开外挂（用GPT-4o审核），仍有23%的失败无法避免。这说明多智能体系统的崩溃，往往是系统性设计缺陷的集中爆发。

人类组织学的启示

令人震惊的是，这些Agent团队的失败模式，竟与人类组织的经典崩溃案例高度吻合：

越级指挥（CTO抢CEO的决策权）
专家沉默（明知流程错误却不敢质疑）

论文提出可借鉴核电站、航空管制等高可靠性组织（HRO）的经验，比如：

严格分级授权（禁止AI角色越权）
构建心理安全感（鼓励AI质疑上级决策）

咋办？

当前主流解决方案就像“打补丁”：

战术级修复：把提示词写得更详细（+14%成功率）
换座位实验：调整AI对话流程（效果忽高忽低）

但根本性解决方案需要重构系统DNA：

给AI安装“风险雷达”（量化决策置信度）
开发组织记忆库（避免重复踩坑）
建立标准化通信协议（消灭“方言式对话”）

Agent团队协作的终极形态是什么？

研究者预言，未来的多智能体系统将更像特种部队：

突击手（快速响应）
侦察兵（实时验证）
指挥官（动态协调）
通过强化学习训练团队默契，最终实现“1+1>10”的智能涌现。

阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到3月31日 ”未来知识库”精选的百部前沿科技趋势报告

（加入未来知识库，全部资料免费阅读和下载）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Agent运行提速10倍！斯坦福教授押注异构推理，破解AI推理瓶颈

DeepTech深科技 2026-03-25 19:52:15
0 跟贴 0
华为、商汤等873家机构遭AI顶会“封杀”，中国学界怒了

智东西 2026-03-26 20:49:23
152 跟贴 152

DeepSeek急招Agent方向！一口气放17个岗位，重度Vibe Coding优先

量子位 2026-03-25 14:39:45
5 跟贴 5

AI Agent狂潮中的金融新范式：AI涨乐养了一只“金融小龙虾”，正破解投资最难一公里

钛媒体APP 2026-03-25 17:03:07
3 跟贴 3
趣丸科技Tunee上线MV Agent，支持接入OpenClaw｜独家

钛媒体APP 2026-03-27 10:35:28
0 跟贴 0

美国养老护工荒的AI处方：三个AI Agent与一场养老效率革命

钛媒体APP 2026-03-25 09:50:14
0 跟贴 0

两个LLM互相对线，推理起飞：康奈尔团队发布大模型版类GAN训练法

机器之心Pro 2025-12-08 16:16:12
0 跟贴 0
卡帕西都整破防了：AI Coding没门槛，可部署环节真嗯啊的难

量子位 2026-03-27 12:12:46
0 跟贴 0

博士生如何用龙虾做知识管理？欢迎围观！

量子位 2026-03-26 23:23:30
0 跟贴 0
陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
MIT研究生用NotebookLM两天学完一学期课程

量子位 2026-03-22 10:50:49
0 跟贴 0
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
人活着的唯一理由是善良

叶檀财经 2026-02-01 17:07:04
0 跟贴 0
大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0
如何点亮小龙虾的牛马技能包?

量子位 2026-03-18 12:51:26
0 跟贴 0
英伟达23人梦之队，让AI用7天干翻了自己的GPU专家

钛媒体APP 2026-03-26 17:44:44
2 跟贴 2
行业最大规模具身数据集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟贴 0
高通万卫星谈终端大模型优势：个性化与数据推理

量子位 2025-12-11 03:38:41
0 跟贴 0
陶哲轩：AI看似在推理，其实是在背答案

量子位 2026-01-05 09:20:21
0 跟贴 0
机器人管家Figure 03来了，承包一切家务！

量子位 2025-10-11 10:13:00
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
行业最大规模具身数据集！出自简智机器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟贴 0
52天75次发布，A司这场“产品大爆炸”太猛烈了

钛媒体APP 2026-03-26 19:50:22
0 跟贴 0
正在卸货，下一秒上演死神来了，车上女子眼睁睁看着翻车！

大眼猫侃世界 2026-03-25 14:50:23
0 跟贴 0
司机车子马路上侧翻，村民齐力飞翻过来，结果受了二次伤害！

搞笑的人儿 2026-03-26 14:32:20
1 跟贴 1
逛超市想要耍帅结果翻车，看完不笑算我输，网友大型翻车现场！

爆笑论 2026-03-26 15:20:06
3 跟贴 3
看了这么多给孩子喂药的视频这是头一个翻车的

蓬勃资讯 2026-03-25 12:09:15
1 跟贴 1
大哥喝酒炫技，还没开始就翻车，短短3秒看清世态炎凉！

笑到流泪的囧事馆 2026-03-25 16:50:20
1 跟贴 1
腾讯元器如何让教育智能体在微信生态零代码落地

芥末堆看教育 2025-12-27 18:22:21
0 跟贴 0
盘点全网美女失误翻车爆笑瞬间，我一般不笑，除非忍不住

嘟嘟漫馆 2026-03-24 12:04:47
0 跟贴 0
这位大姐真讲究，为不让婚车走回头路，最终三轮侧翻还微笑挥手！

逗趣笑哈哈乐园 2026-03-25 09:37:01
3 跟贴 3
狂砸20亿美元却翻车的球场

果果哥哥 2026-03-25 18:10:43
1 跟贴 1
生死皆是命数！网友：注定你要活，就会用各种方式把你拉离危险

夜深爱杂谈 2026-03-26 20:25:44
1 跟贴 1
万能修也不是什么都能修，这次翻车了

美少女同学吖 2026-03-25 20:06:25
0 跟贴 0
为什么我们必须等到下班，才能开始“真正的工作”？

澎湃新闻 2026-03-27 12:00:31
0 跟贴 0
钻这种空子一不小就会翻车

若尘剪辑 2026-03-25 09:01:53
1 跟贴 1
网友春日在大理拍摄视频，不料成了翻车现场，网友：这个人连吸管都打不过

重庆科教融媒体 2026-03-24 19:51:09
0 跟贴 0
隔壁老王离奇翻车，这一摔姿势太搞笑，基本凉凉没跑了

搞笑风火轮 2026-03-27 00:00:00
0 跟贴 0
花近4000元买4瓶，部分胶囊发黑，吃了全身发痒……网红品牌被曝“翻车”

19楼 2026-03-27 08:17:33
1 跟贴 1
大型翻车瞬间大盘点！意外反转，结局惊人

一抹红尘n 2026-03-26 11:11:55
0 跟贴 0

WOC太能射了！NBA史上最年轻的250！

WOC太能射了！NBA史上最年轻的250！

左右为篮

2026-03-27 12:34:44

杜月笙在河边钓鱼，遇到地痞要保护费，杜月笙：找你们老板过来

杜月笙在河边钓鱼，遇到地痞要保护费，杜月笙：找你们老板过来

千秋文化

2026-03-25 21:29:50

南京女教师停职风波反转！大批家长发声力挺，恳请恢复岗位与声誉

南京女教师停职风波反转！大批家长发声力挺，恳请恢复岗位与声誉

火山詩话

2026-03-26 06:37:23

1982年戴安娜艰难生下威廉，女王先看耳朵，一句评论让查尔斯心塞

1982年戴安娜艰难生下威廉，女王先看耳朵，一句评论让查尔斯心塞

鹤羽说个事

2026-03-26 22:32:10

美媒：若中国不偿还百年前的债务，美国也将不承认欠华8600亿美元

美媒：若中国不偿还百年前的债务，美国也将不承认欠华8600亿美元

文史达观

2025-03-18 12:54:58

坦格西里遇袭身亡

新浪财经

2026-03-26 23:01:14

香港马拉松，阿Sa脸馒化成蔡明，黄晓明白又嫩，林志玲被嘲太做作

香港马拉松，阿Sa脸馒化成蔡明，黄晓明白又嫩，林志玲被嘲太做作

观察鉴娱

2026-03-27 09:13:28

赖清德梦碎了，国台办连说两个“决不允许”，为侵略翻案想都别想

赖清德梦碎了，国台办连说两个“决不允许”，为侵略翻案想都别想

说历史的老牢

2026-03-26 10:51:28

十人法国热身赛2-1巴西！姆巴佩单刀破僵利物浦9000万神锋建功

十人法国热身赛2-1巴西！姆巴佩单刀破僵利物浦9000万神锋建功

我爱英超

2026-03-27 06:17:44

郑丽文来京时间确定，马英九拒绝通话，大陆发出统一后安排

郑丽文来京时间确定，马英九拒绝通话，大陆发出统一后安排

基斯默默

2026-03-27 08:41:34

戏外一样猛！《侠探杰克》男主当街KO邻居，警方认定：正当防卫

戏外一样猛！《侠探杰克》男主当街KO邻居，警方认定：正当防卫

仰卧撑FTUer

2026-03-26 22:37:11

张雪峰经典语录：句句都是人间清醒

张雪峰经典语录：句句都是人间清醒

山东教育

2026-03-26 08:07:56

据张雪峰公司一位员工透露，镜头前的张雪峰和私下里的他判若两人

据张雪峰公司一位员工透露，镜头前的张雪峰和私下里的他判若两人

砚底沉香

2026-03-27 07:43:52

女同主播出轨大哥被"正宫"直播对质！真实长相曝光

女同主播出轨大哥被"正宫"直播对质！真实长相曝光

游民星空

2026-03-25 20:08:13

官宣！中国最大省再设立新县，什么信号？

官宣！中国最大省再设立新县，什么信号？

西部城市

2026-03-26 21:08:33

清纯得不像动作片女一号！

贵圈真乱

2026-03-26 11:33:33

再战热火！骑士3人继续缺席，但阿伦将复出，哈登迎期待的结局

再战热火！骑士3人继续缺席，但阿伦将复出，哈登迎期待的结局

巴叔GO聊体育

2026-03-27 11:20:37

为何美国敢打伊朗，却不敢打朝鲜？因为朝鲜成功学到了中国精髓

为何美国敢打伊朗，却不敢打朝鲜？因为朝鲜成功学到了中国精髓

鉴史录

2026-03-25 18:19:06

六年不上班却照领工资，他只能举报自己：比吃空饷更可怕的，是监管集体失声

六年不上班却照领工资，他只能举报自己：比吃空饷更可怕的，是监管集体失声

二宝妈妈谈教育

2026-03-27 10:49:09

以色列一市长在节目直播中崩溃哭泣，痛斥内塔尼亚胡：没有国家支持我们，你毁了一切！

以色列一市长在节目直播中崩溃哭泣，痛斥内塔尼亚胡：没有国家支持我们，你毁了一切！

大象新闻

2026-03-27 10:49:04

人工智能学家

人工智能领域权威媒体

4609文章数 37439关注度

往期回顾全部

科技要闻

OpenAI果断砍掉"成人模式"，死磕生产力

头条要闻

牛弹琴：一直赢的特朗普心里更慌了又给自己续了10天

头条要闻

牛弹琴：一直赢的特朗普心里更慌了又给自己续了10天

体育要闻

近29战23胜！这支黄蜂有多强？

娱乐要闻

张雪峰灵堂内景曝光，四周摆满了鲜花

财经要闻

很反常！油价向上，黄金向下

汽车要闻

与众08，金标大众不能输的一战

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

房产

数码

艺术

公开课

本地新闻

救命，这只酱板鸭已经在我手机复仇了一万遍

房产要闻

刚刚，海南楼市，官方数据发布！

数码要闻

达音科“卯”头戴式耳机发售=，2680元

艺术要闻

2025“殊相”——中国油画学会创作研修作品展 | 作品选刊（一）

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版