网易首页 > 网易号 > 正文 申请入驻

打造卓越Agent团队:如何解决复杂任务带来的AI协作的副作用?

0
分享至


01 AI 也需要“分工”吗?

答案是:需要,而且比人类更需要。

人类有工作可以积累长期复杂的记忆,很强的上下文感知能力,有主动性,会主动发现问题。

AI 不一样。给它一个复杂的任务,如果只有一个 AI 模型从头做到尾,它会面临几个很难解决的问题:


第一个:角色坍塌与注意力稀释。大语言模型都有上下文窗口Context Window,如果上下文饱和了,就很容易出问题。同一个Agent,在一个长程的对话里面,既要做数据分析,又要做逻辑推理,又要写报告——模型往往会在指令冲突中采取“中庸妥协”,又因为上下文过长导致注意力漂移,最终导致能力坍塌,产出的内容很大概率就是一本正经的胡说八道。因此,我会在和AI聊天过长的时候新开对话窗口。

第二个:不知道自己错在哪里。人很难自己否定自己,AI也是一样。单个 AI 在输出最终结论之前,不会主动质疑自己的中间步骤。它不会停下来想:“我刚才那个假设对不对?”它只会继续往下推演,最终引发灾难性的错误级联(Error Cascading)。

第三个:没有“第二意见。人类做重要决策,会找同事讨论、找领导审批。单个 AI 没有这个机制,它不会问自己:"有没有其他可能性?"

所以,Multi-Agent 的本质不是“多个 AI”,而是“不同的角色负责不同的事,然后相互校验

02 三个臭皮匠,胜过一个诸葛亮

例如,在自定义的Multi-Agent 里的投研系统,设置了三个核心角色:



角色一:Modeler(建模师)—— 构建判断框架

你可以把建模师理解成公司的战略规划部

他们的工作不是告诉你"明天买还是卖",而是先把事情搞清楚:

  • 这个公司值多少钱?

  • 它的增长逻辑是什么?

  • 核心假设是什么?

他们会构建一套完整的分析框架,包括乐观预测、基准预测、悲观预测——这三种场景。

但他们有一个明确的边界:只负责建模,不负责质疑

这是关键。战略规划部的工作是做好方案,不是和领导辩论方案的对错。

角色二:Challenger(挑战者)—— 主动找漏洞

你可以把挑战者理解成公司的内部审计部

他们不负责构建任何东西,他们的工作是专门"挑毛病":

  • 这个预测的假设依据是什么?

  • 有没有遗漏的风险?

  • 这个结论是不是太乐观了?

他们会对建模师的每一个关键判断发起攻击,然后建模师必须逐一回应:要么提供证据,要么修改结论,要么承认这个点确实有问题

重要的是:挑战者不看建模师的工作过程,只看最终结论和依据。

这像极了审计部的工作方式——他们不参与业务决策,但有权质疑任何业务判断。

角色三:Synthesizer(综合师)—— 做最终决策

你可以把综合师理解成公司的CEO

他们不写报告,不做预测,不做审计。但他们有一项核心能力:综合多方意见,形成最终判断

当建模师给出了三套预测,挑战者提出了若干质疑和回应,综合师要做的事情是:

  • 哪些质疑有道理,应该接受?

  • 哪些质疑不合理,可以驳回但必须说明理由?

  • 最终的评级和目标价应该是什么?

CEO 不需要每件事都自己干,但他需要做出最终决策,并为此负责。

03 三个角色的对话规则


光有分工不够,三个角色之间必须有一套清晰的对话规则。

如果没有规则,会发生什么呢?

场景一:角色越位

挑战者开始替建模师做分析,综合师开始替挑战者写报告。每个人都在做本不该自己做的事,最后整个流程乱成一锅粥。

场景二:信息泄露

建模师在做判断的时候,已经提前知道了挑战者要攻击什么内容,于是提前"堵住了漏洞"。这就像领导在开民主生活会之前,就已经知道员工要提什么意见,于是提前准备了标准答案。

场景三:无限循环

挑战者提出质疑,建模师回应,挑战者再质疑,建模师再回应……没有终止条件,流程永远跑不完。

正确的Harness 做法是用“不变量”(Invariant)来约束对话边界,这就好像每个人都有一个checklist:

对话规则

约束内容

信息隔离

挑战者只能看到建模师的最终结论,看不到中间推导过程

强制回应

挑战者的每一次质疑,建模师都必须明确回应,不能忽略

终止条件

质疑被标记为解决或根据证据驳回,流程才能继续

单向流动

信息只从建模师→挑战者→综合师,不允许反向泄露

04 一个真实的协作场景

说理论太抽象,来走一遍真实的流程。


场景:分析特斯拉(TSLA)

第一步:建模师输出基础分析

建模师完成了对 TSLA 的分析,输出三套预测:

  • 乐观情景:$320(基于 FY2027 年利润预测)

  • 基准情景:$245

  • 悲观情景:$158

同时输出关键假设:年度利润增长率 25%,PE 倍数 42x。

建模师把这些结论写进 JSON 文件,建模阶段结束

第二步:触发挑战者审查

系统自动调用挑战者角色。挑战者读取建模师的 JSON 文件,但不读取任何中间推导过程。

挑战者发现了一个问题:

"建模师使用了 FY2027 年利润作为锚点基准,但 FY2026 年利润预测已经比 FY2027 低了 15%——这是什么逻辑?"

挑战者发起攻击,状态标记为 CRITICAL。

第三步:建模师回应

建模师收到挑战者的质疑,必须回应。

可能的回应方式:

  • 接受并修正

    :重新校准锚点,改用基准情景的 FY2026 预测作为锚点

  • 驳回并提供证据

    :说明 FY2027 锚点的合理性,提供行业对标数据

  • 承认边界

    :说明这是一个结构性不确定性(bidirectionality_blocked),无法用常规方法处理

第四步:综合师做出最终判断

所有 CRITICAL 攻击被处理完毕,综合师综合全部分析,输出最终报告。

最终报告3000万字,包含:

  • 评级(BUY/HOLD/SELL)

  • 目标价

  • 信心指数(model_validity_score)

  • 关键风险列表

05 为什么要设计“挑战者”这个角色?

很多人会有一个疑问:

为什么要单独设一个"挑战者"?让建模师自己检查自己的结论不行吗?

答案:不行。而且越是自己查自己,越危险。

心理学上有一个概念叫"确认偏误"——人类会倾向于寻找支持自己已有判断的证据,而忽略反驳的证据。

AI 系统里也存在同样的问题:建模师在构建了一套分析框架之后,对自己的框架会产生"所有权感",潜意识里不愿意承认框架有问题。

挑战者的存在,就是为了打破这种确认偏误

更准确地说,挑战者有一个很重要的功能:把质疑和建构分开

建模师的任务是"构建一个好的分析",挑战者的任务是"证明这个分析哪里不好"——这是两种完全不同的思维方式,让同一个人同时做这两件事,本质上是在要求他"左手打右手"。

06 信息隔离:最难但最重要的设计

三个角色里,信息隔离是设计难度最高、但价值最大的部分。

为什么难?

因为信息隔离不是"不告诉你"这么简单。当建模师输出一个结论的时候,挑战者需要足够的上下文才能提出有意义的质疑——但这些上下文,又可能包含建模师的推导过程,从而造成信息泄露。

解决方案是"摘要机制":

建模师完成分析后,不是直接交给挑战者,而是先经过一个"摘要生成器"。

这个摘要生成器会:

  • 提取建模师的最终结论(保留)

  • 剥离推导过程(删除)

  • 生成一份"挑战者视角"的攻击预判(新增)

这样一来,挑战者拿到的是一份"干净"的输入:只有结论和证据,没有中间推理。

同时,摘要生成器会明确告诉挑战者:"以下是你需要重点攻击的方向",相当于给挑战者提供了一份"攻击地图",而不是让他自己去找漏洞。

07 失败案例:如果不这么设计会怎样?

案例:CRM 案例

在建模师和挑战者在同一个工作循环内共享了“参考资料”字段。

建模师在做最终判断之前,已经提前看到了挑战者准备攻击他的内容。

结果:建模师提前修改了措辞,把最脆弱的假设包装得更稳妥。挑战者最后发现所有"漏洞"都被堵住了,最终攻击全部无效。

这个 AI 系统犯的错误,和很多公司开"走过场"的民主生活会一模一样。

修复方案:引入信息隔离机制,挑战者只能读取摘要,看不到建模师的原始推导过程。

08 给管理者的启发

Multi-Agent 协作的设计,对管理者也有几点很直接的启发:

第一,质疑和建构需要分开。

让同一个人既负责方案设计、又负责方案审核,是管理上最常见的错误之一。好的决策机制,一定是有人提方案、有人挑毛病、有人做决定,三种角色分开。

第二,信息隔离有时候比信息透明更重要。

不是所有信息都应该让所有人看到。挑战者需要足够的上下文来提问题,但不需要看到建模师的推导过程。管理者需要知道决策结论,但不需要知道每个环节的具体推理——知道太多,反而会干扰判断。

第三,设置明确的终止条件。

没有终止条件的讨论会变成无限循环,永远不会有结论。Multi-Agent 系统里,每一条质疑都必须有明确的处理状态,系统才会继续往下走。

现实中也是如此:会议要有结论,评审要有结论,决策要有结论。

09 总结

好的协作,不是分工就完事了,而是对齐目标的情况下,让每个成员在自己岗位上面发挥最大能力,让组织达到一种最佳效率平衡。

Multi-Agent 的设计,本质上是在用工程化的方式,实现人类组织里早就存在的分工与制衡逻辑。

如果你在带团队,这套设计值得参考:

  • 有人负责建构(建模师)

  • 有人负责质疑(挑战者)

  • 有人负责决策(综合师)

  • 三个角色之间有清晰的信息边界

  • 每个环节有明确的终止条件

做到了这几点,不管是 AI 系统还是人类团队,协作质量都会上一个台阶。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
联合国变天?秘书长候选人出现,巴西力挺,中方:不准有官僚主义

联合国变天?秘书长候选人出现,巴西力挺,中方:不准有官僚主义

闻识
2026-05-30 00:43:28
徐正源还是贵!70万美金签约辽宁:实际上还有附加条款 超成都时期

徐正源还是贵!70万美金签约辽宁:实际上还有附加条款 超成都时期

夕落秋山
2026-05-30 15:08:48
西安多所学校通知:下周一放假!

西安多所学校通知:下周一放假!

91.6陕西交通广播
2026-05-30 12:22:42
4-2横扫张本智和!19岁国乒天才连斩5大世界名将,一战封神

4-2横扫张本智和!19岁国乒天才连斩5大世界名将,一战封神

阿讯说天下
2026-05-30 14:20:24
别再骂潘朝伟了!U17亚洲杯丢冠最真真相曝光:福岛敏的面子,葬送了国少的冠军

别再骂潘朝伟了!U17亚洲杯丢冠最真真相曝光:福岛敏的面子,葬送了国少的冠军

林子说事
2026-05-30 15:14:52
特斯拉摄像头新专利:竟给镜头装上“迷你雨刮器”

特斯拉摄像头新专利:竟给镜头装上“迷你雨刮器”

慢享生活集
2026-05-29 00:54:56
中国金花历史第5人!王曦雨排名超越袁悦郑钦文,王欣瑜双线出局

中国金花历史第5人!王曦雨排名超越袁悦郑钦文,王欣瑜双线出局

侃球熊弟
2026-05-29 20:12:24
赵睿离开北京,是首钢本赛季最大的遗憾

赵睿离开北京,是首钢本赛季最大的遗憾

茶余饭后说体育
2026-05-30 18:34:31
央视王炸!《交锋》首播收视破2,王凯欧豪二十年暗战,真实到可怕的国安剧来了

央视王炸!《交锋》首播收视破2,王凯欧豪二十年暗战,真实到可怕的国安剧来了

小椰的奶奶
2026-05-30 18:40:18
张艺谋评价窦骁,只字未提演技,却字字珠玑!

张艺谋评价窦骁,只字未提演技,却字字珠玑!

真的八卦小学弟
2026-05-30 18:30:10
欧洲女议员:购买不等于拥有 那盗版就不是偷窃

欧洲女议员:购买不等于拥有 那盗版就不是偷窃

3DM游戏
2026-05-27 22:03:20
俄军开始从两个战场撤退,瑞典36架鹰狮助力乌克兰空军

俄军开始从两个战场撤退,瑞典36架鹰狮助力乌克兰空军

史政先锋
2026-05-29 15:58:46
中国强硬抓捕150名菲人,菲方24小时内放人

中国强硬抓捕150名菲人,菲方24小时内放人

安逸安逸
2026-05-30 10:45:04
小米生态新爆款!米家手持风扇提前售罄:169元买不到了

小米生态新爆款!米家手持风扇提前售罄:169元买不到了

快科技
2026-05-29 10:02:08
美国专家警告,中国如再盲目研发芯片,将引发经济危机!

美国专家警告,中国如再盲目研发芯片,将引发经济危机!

经点星娱
2026-05-28 17:43:42
为什么现金受贿还是会被查到?纪委的3个手段你根本想不到

为什么现金受贿还是会被查到?纪委的3个手段你根本想不到

职场资深秘书
2026-05-25 15:59:26
Slater:勇士预计会保留并使用今年的11号签

Slater:勇士预计会保留并使用今年的11号签

北青网-北京青年报
2026-05-30 16:14:05
3岁被周总理带身边十几年,李鹏澄清:我是养子,这说法并不正确

3岁被周总理带身边十几年,李鹏澄清:我是养子,这说法并不正确

人生录
2026-05-29 17:51:24
慌了!东莞知名新能源工厂突然结业!限期结清工资算不算良心企业

慌了!东莞知名新能源工厂突然结业!限期结清工资算不算良心企业

捣蛋窝
2026-05-30 16:24:57
随着中超前冠军长春亚泰2-2遭绝平,中甲最新积分榜出炉

随着中超前冠军长春亚泰2-2遭绝平,中甲最新积分榜出炉

侧身凌空斩
2026-05-30 17:01:01
2026-05-30 19:19:00
PM熊叔
PM熊叔
聊AI科技+商业,一人公司的产品经理
2文章数 0关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

伊朗浓缩铀材料将被挖出销毁 特朗普就战事最新表态

头条要闻

伊朗浓缩铀材料将被挖出销毁 特朗普就战事最新表态

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

游戏
健康
家居
教育
时尚

LCK第二赛段:稳健推进不给机会,KT直落两局横扫DNS

尝试干细胞疗法如何避免踩坑?

家居要闻

云栖 舒展如流云

教育要闻

世界杯雷达 soccer还是football,都是英国人的锅

2026夏天最新5款发型合集,每一款都超心动!

无障碍浏览 进入关怀版