网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

多智能体神话破灭：伯克利研究揭示14种结构性失败

2026-05-08 00:01:31　来源: 碳基打工人

北京举报

0

分享至

每个智能体框架的路演PPT里都有同一页。专业智能体协作：一个负责规划，一个负责编码，一个负责审查。网状结构涌现智能。交付更快，思考更深，扩展更广。

研究数据给出了相反的结论。

加州大学伯克利分校的研究人员分析了7个主流多智能体框架，覆盖200多项任务。6名专业人工标注员参与评估，每项任务产生超过1.5万行对话记录。结果显示：ChatDev——最先进的多智能体编程框架之一——正确率低至25%。

他们识别出14种不同的失败模式。不是边缘案例，而是随着智能体数量增加而恶化的结构性问题。

谷歌研究与麻省理工媒体实验室的另一项研究在PlanCraft任务上测试了180种智能体配置。所有多智能体变体相比单智能体均出现性能下降：集中式架构下降50.4%，去中心化架构下降41.4%，混合架构下降39.0%，独立架构下降70.0%。

斯坦福大学的第三项研究表明，当思考token预算相等时，单智能体在多跳推理任务上达到或超过多智能体系统。多智能体系统在基准测试中的"优势"来自消耗更多token，而非更聪明的协调机制。

伯克利团队建立的MAST分类法将失败归纳为三类：

第一类是规范与系统设计失败。智能体不遵守任务规范，不遵守角色规范，重复执行步骤，丢失对话历史，不知道何时终止。

第二类是智能体间错位。对话意外重置，智能体未能请求澄清，任务偏离轨道，智能体相互隐瞒信息，忽视其他智能体的输入，推理与行动不匹配。

第三类是任务验证与终止。智能体过早终止，验证不完整或错误。

三类失败的分布大致均衡，没有单一类型占主导。这意味着无法通过解决某个单一问题来修复智能体网络——失败面本身就是架构问题。

每次智能体交接都是一次有损转换。智能体A的输出成为智能体B的提示词，上下文在每一跳衰减。4个智能体组成的链条中，序列化损失的信息已超过专业化带来的收益。

伯克利论文引用组织理论解释这一现象。他们参考了Roberts与Rousseau 1989年关于高可靠性组织的研究：即使由复杂个体组成的组织，若组织结构存在缺陷，也会发生灾难性失败。

智能体网络中的失败模式直接违反了高可靠性组织的定义特征。智能体越权（违反层级分化），未能寻求澄清（违反专业尊重）。这些是协调失败，而非大语言模型的能力局限。

研究人员尝试通过优化提示词和重新设计智能体拓扑来解决这些问题。结果：14%的改善。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

让大模型学会「心灵感应」：基于思维沟通的多智能体合作范式来了

机器之心Pro 2025-11-18 10:12:54
0 跟贴 0
19岁，常青藤辍学，这群中国年轻人重构了AI记忆

量子位 2026-04-04 16:21:02
0 跟贴 0

嘘，Claude正在「做梦」！睡一觉疯狂进化，一夜暴涨6倍战力

新智元 2026-05-07 12:07:18
12 跟贴 12

不用等官方了！第三方「国产Codex」爆火，一天收割8K个Star

雷科技 2026-05-07 20:49:14
12 跟贴 12
马斯克诉OpenAI庭审手记：庭审第一周的现场、证词和幕后

DeepTech深科技 2026-05-06 14:11:54
0 跟贴 0

对标OpenClaw？Meta被曝将推消费级AI智能体

智东西 2026-05-07 19:11:07
0 跟贴 0

别急着做新工具的“小白鼠”：AI时代的慢沉淀与大迭代

秦朔朋友圈 2026-05-08 00:04:02
0 跟贴 0
IGN、伯克利联合报告：逾六成硬核玩家不再全价购买游戏新作

IT之家 2026-05-06 22:28:07
1 跟贴 1

南洋EMBA（中文）美国学段｜首期班“硅谷创新行”精彩回顾

新浪财经 2026-05-05 19:11:54
0 跟贴 0
网传王源入选‘伯克利100位杰出校友’，经查为第三方机构大数据排名

星视频 2026-05-05 14:03:47
0 跟贴 0
斯坦福HAI大重组！李飞飞升任校长顾问

新智元 2026-05-05 10:11:35
43 跟贴 43
特朗普政府再出手！加州大学医学院违法考虑种族，不整改就断资金

写下一文一墨 2026-05-07 16:05:54
0 跟贴 0
继续看小丽搭建她的小棚子，框架搭起来了

婉儿视频 2026-05-05 04:05:05
26 跟贴 26
世乒赛迪亚兹被判罚，她的教练父亲气冲冲找裁判理论

曹操篮球解说 2026-05-06 15:25:30
10 跟贴 10
俄外交部呼吁各国及时从基辅撤离人员

环球网资讯 2026-05-07 08:47:57
36904 跟贴 36904
这绝对是最逆天的匹配机制了

谷谷追剧人 2026-05-05 11:17:24
1 跟贴 1
宇宙大爆炸理论是假的？科学家发现146亿岁恒星，比宇宙还古老

世界地理小知识 2026-05-03 22:49:38
4 跟贴 4
这匹配机制真是逆天，当小偷偷到海豹突击队家里

痞子说动物 2026-05-06 15:57:12
2 跟贴 2
三角洲部队内部组织架构！

浩然简史 2026-05-04 19:53:21
0 跟贴 0
小S身为富婆，不给女儿一分零花钱，姨妈大S看不下去理论

雨轩电影 2026-05-06 09:30:25
1 跟贴 1
关于中东地区架构与权力的转变，赖岳谦与三妹的观察点，值得参考

伢伢gagako 2026-05-08 00:39:06
0 跟贴 0
重庆洪崖洞景区奶芙店私自增加所售奶芙制品重量，官方通报

界面新闻 2026-05-07 15:36:33
112 跟贴 112
武汉多人买格力空调还没安装门店关闭，格力让消费者以优惠价格再买一次？多方回应

潇湘晨报 2026-05-07 15:53:43
1411 跟贴 1411
TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

机器之心Pro 2026-05-07 12:59:10
0 跟贴 0
第三轮第六批中央生态环境保护督察全面启动

生态环境部 2026-05-07 10:04:40
49 跟贴 49
宜昌公布四起典型案例

赤脚论坛 2026-05-07 21:42:59
0 跟贴 0
浑身都是雷达，100式坦克首次公开，混动和智能颠覆西方认知

猫meme团子 2026-05-08 03:55:46
0 跟贴 0
世纪AI诉讼持续爆猛料，OpenAI正在被高管掏空？

虎嗅APP 2026-05-08 01:06:59
0 跟贴 0
女司机把车停别人店门口，女老板抱孩子与其理论，遭其殴打

带你看看 2026-05-07 14:20:36
5 跟贴 5
正手框架的前臂动作，迎着球向前、动作小加速制动

孤酒老巷QA 2026-05-06 09:52:58
1 跟贴 1
这就是上海男篮的底气！

新民晚报 2026-05-07 09:32:29
150 跟贴 150
新手宝爸练习抱宝宝等真正抱起时浑身僵硬网友：理论满分实操为零

重庆城市TV 2026-05-05 13:37:51
2 跟贴 2
“很久没有这种兴奋感了”！段永平出手！清仓中国神华买入泡泡玛特称泡泡玛特的商业壁垒远比想象中强大是王宁的粉丝

每日经济新闻 2026-05-07 17:25:55
73 跟贴 73
王毅会见美国国会参议员代表团

央视新闻客户端 2026-05-07 17:24:29
48 跟贴 48
北大数学天才柳智宇，放弃麻省全额奖学金出家，还俗后过得如何？

菁妈育儿 2026-05-06 17:28:02
0 跟贴 0
多所高校研究：学校禁止手机后未能提升学业成绩

CNMO科技 2026-05-07 12:46:14
2 跟贴 2
在秘鲁的偏远荒漠中,研究人员近期在低空飞

趣知小故事 2026-05-07 11:11:25
1 跟贴 1
欧盟中国商会警告：淘汰中国设备要付出4000亿美元代价

参考消息 2026-05-07 17:47:03
1271 跟贴 1271
以色列小姐在咖啡馆偶遇纽约市长夫人，对方得知她国籍后敷衍离开

阿淫记录生活日常 2026-05-06 11:19:39
14 跟贴 14
女子机场租用充电宝1小时扣费149元，退费需回现场自证，网上显示小电科技被投诉量超5万件

极目新闻 2026-05-07 13:36:00
604 跟贴 604

沈眉庄为什么拍完《甄嬛传》后，仍是18线演员，郑晓龙评：自己作

沈眉庄为什么拍完《甄嬛传》后，仍是18线演员，郑晓龙评：自己作

美芽

2026-05-07 12:12:22

"太窒息了"! 数学系华人小哥崩溃:不想和中国留学生交朋友,尽管我自己也是!

"太窒息了"! 数学系华人小哥崩溃:不想和中国留学生交朋友,尽管我自己也是!

澳洲红领巾

2026-05-07 15:15:55

近期综艺排个名：《乘风2026》第3、《五哈6》第2、第一神级回归

近期综艺排个名：《乘风2026》第3、《五哈6》第2、第一神级回归

阿废冷眼观察所

2026-05-07 20:48:42

16岁游客玩瀑布秋千坠亡后续：家属已和解，知情人曝景区赔偿金额

16岁游客玩瀑布秋千坠亡后续：家属已和解，知情人曝景区赔偿金额

娱乐圈圈圆

2026-05-06 17:33:41

伊朗霍尔木兹甘省米纳卜市传出爆炸声

伊朗霍尔木兹甘省米纳卜市传出爆炸声

新华社

2026-05-08 05:10:04

吹风机是大补，医生提醒：一个吹风机等于半个老中医！不要嫌弃

吹风机是大补，医生提醒：一个吹风机等于半个老中医！不要嫌弃

健康之光

2026-05-06 16:55:06

韩鹏胆子真大！中超已踢完十轮联赛，却仍没让这五位王牌出场亮相

韩鹏胆子真大！中超已踢完十轮联赛，却仍没让这五位王牌出场亮相

振刚说足球

2026-05-07 10:07:35

赖清德回台不到24小时，卢秀燕付出代价，鲁比奥：送台当局一句话

赖清德回台不到24小时，卢秀燕付出代价，鲁比奥：送台当局一句话

潋滟晴方DAY

2026-05-06 20:30:13

疯了！乌杰里上任就出王炸！3笔交易赌未来，弗拉格有望复刻传奇

疯了！乌杰里上任就出王炸！3笔交易赌未来，弗拉格有望复刻传奇

梦忆之浅

2026-05-07 16:12:33

iPhone 18 Pro三大设计变动曝光

iPhone 18 Pro三大设计变动曝光

像素与芯片

2026-05-07 04:43:41

白人女性与黑人女性的体味差异，网友真实分享引发热议

白人女性与黑人女性的体味差异，网友真实分享引发热议

特约前排观众

2025-12-22 00:20:06

7日凌晨世乒赛：女团4强赛对阵出炉，神秘之师惨败，国乒遭遇劲敌

7日凌晨世乒赛：女团4强赛对阵出炉，神秘之师惨败，国乒遭遇劲敌

林子说事

2026-05-07 07:33:31

曾志伟大寿上，儿媳那一句反问，把全香港的体面都撕碎了

曾志伟大寿上，儿媳那一句反问，把全香港的体面都撕碎了

小猫娱乐叭叭

2026-05-06 20:31:50

“运城女教师失踪案”22年后再审：遇害女教师丈夫“故意杀人罪成立”，一审被判无期

“运城女教师失踪案”22年后再审：遇害女教师丈夫“故意杀人罪成立”，一审被判无期

红星新闻

2026-05-07 21:54:21

哈维尔·巴登不敢相信佩内洛普·克鲁兹真是他老婆

哈维尔·巴登不敢相信佩内洛普·克鲁兹真是他老婆

影视情报室

2026-05-08 02:33:51

4-0 3-1!欧战疯狂一夜!维拉弗赖堡逆转水晶宫晋级将战巴列卡诺

4-0 3-1!欧战疯狂一夜!维拉弗赖堡逆转水晶宫晋级将战巴列卡诺

小徐讲八卦

2026-05-08 05:44:41

美伊局势，最新动向

第一财经资讯

2026-05-07 18:02:55

与柯文哲黄国昌有不正当男女关系？台湾民众党美女候选人发文回击

与柯文哲黄国昌有不正当男女关系？台湾民众党美女候选人发文回击

海峡导报社

2026-05-07 12:12:04

台风“黑格比”生成，广州迎大雨、暴雨+8级大风！未来几天番禺天气......

台风“黑格比”生成，广州迎大雨、暴雨+8级大风！未来几天番禺天气......

番禺台

2026-05-08 00:08:10

五一票房腰斩，陈思诚：1500万是存亡线，电影院连房租都赚不回！

五一票房腰斩，陈思诚：1500万是存亡线，电影院连房租都赚不回！

喜欢历史的阿繁

2026-05-07 01:45:47

碳基打工人

坐标北京，靠咖啡续命，靠小红书下饭的普通人类。

2309文章数 32关注度

往期回顾全部

科技要闻

月之暗面完成20亿美元融资，估值突破200亿

头条要闻

伊朗武装部队：美军违反停火协议空袭伊朗已反击

头条要闻

伊朗武装部队：美军违反停火协议空袭伊朗已反击

体育要闻

巴黎再进欧冠决赛，最尴尬的情况还是发生了

娱乐要闻

Lisa主持！宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万，这家ST公司惊呆市场！

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戏

时尚

公开课

军事航空

本地新闻

用青花瓷的方式，打开西溪湿地

《远星物语》团队新作《皓白初晓》登Steam EA

今年最火的4双平底鞋，配小黑裙好看又气质！

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

特朗普：美伊"很可能"达成协议

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版