网易首页 > 网易号 > 正文 申请入驻

RouteMoA:无需预推理的动态路由,实现高效多智能体混合

0
分享至

来源:市场资讯

(来源:机器之心Pro)


本篇论文已被 ACL 2026 接收,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。团队负责人为关新平教授,指导老师为陈彩莲教授和乐心怡教授,合作作者还包括南洋理工大学陶大程教授。其他作者来自腾讯、上海人工智能实验室、香港中文大学等机构。第一作者王骥泽为上海交通大学博士生,研究方向为大模型智能体。

近年来,大语言模型的发展,正在从 “单模型能力提升” 走向 “多模型协作”。这是一个很自然的方向:既然不同模型各有所长,有的擅长数学,有的擅长代码,有的更懂医学,那为什么不让它们协同起来,共同解决更复杂的问题?

Mixture-of-Agents(MoA)正是在这样的背景下提出的。它通过让多个模型并行生成、逐层交互、反复融合,往往能够得到比单一模型更强的结果。问题也很明显:性能提升的同时,成本和延迟也随之迅速上升。

在标准 MoA 中,每一轮通常都要调用多个模型,再基于它们的输出进行筛选和融合。但究竟该让哪些模型参与、哪些模型可以跳过,往往缺乏明确的选择机制。模型越多、层数越深,整体开销就越高,在大规模模型池场景下,系统效率和可扩展性都会面临很大挑战。

也正因如此,研究者开始尝试让 MoA 变稀疏。例如,一些方法如 Sparse MoA 会先让模型池中的所有模型生成回答,再通过额外的评审模型进行打分和筛选,只保留一部分模型进入后续协作。这样虽然减少了后续融合的负担,但本质上仍然绕不开一个问题:为了决定该选谁,系统还是得先让所有模型都推理一遍。

于是,这篇工作的核心问题就变得非常直接:我们真的需要先让所有模型都回答一遍,才能决定该选谁吗?


一句话总结:RouteMoA 的核心思想是,通过在推理前进行模型能力预测,避免对所有模型进行无效推理。



现有方法的问题:

效率瓶颈不在融合,而在全量推理

当前 MoA 系列方法的一个共同假设是:要判断哪个模型更好,必须先看到它的输出。因此,无论是经典 MoA,还是引入 judge 的 Sparse MoA,本质上都绕不开一个步骤:所有模型先推理 -> 再筛选 -> 再融合。

这带来两个问题:

第一,计算成本无法下降。即使最后只用少数模型,前面已经为所有模型付出了推理代价。

第二,难以扩展到大模型池。当模型数量增加时,全量推理会迅速变得不可承受,甚至超出上下文限制。

也就是说,瓶颈并不在 “如何选”,而在 “选之前已经太贵了”。

RouteMoA:

把 “选模型” 前移到推理之前


RouteMoA 的关键创新,是把模型选择从 “后验判断” 变成 “先验预测 + 轻量修正”。

整个流程可以分为三个步骤:

1. 先验筛选:不推理,也能判断谁更可能做对

RouteMoA 引入了一个轻量级 scorer,只根据用户 query,就预测每个模型的潜在表现。这个过程不需要调用大模型推理,只做一个粗粒度打分,把模型池缩小到一个潜力子集。本质上,这是在做一件过去被忽略的事情:用 query 本身的信息,提前判断模型能力匹配度。

2. 后验修正:用已有输出做低成本评审

初筛不可避免会有误差,因此 RouteMoA 引入了 mixture-of-judges:

关键在于:这些评估只基于已经生成的输出,不引入额外推理调用。也就是说,系统通过已有信息进行纠错,而不是再算一轮。

3. 综合排序:性能、成本、延迟一起优化

最终,RouteMoA 在模型选择时不仅仅考虑性能,而是同时考虑:

从而在实际系统中实现一个更接近工程最优的决策,而不是单纯追求 accuracy。

实验结果:

少花 90% 的钱,反而更强

在包含 15 个模型的大规模模型池实验中,RouteMoA 的结果非常直观:

这说明一件事:减少无效计算,不仅不会伤害性能,反而会让系统更专注于对的模型。


一个关键洞察:

多模型系统的本质是稀疏的

论文中一个非常重要的观察是:在绝大多数 query 上,真正关键的模型只占少数。只要初始阶段能把这些模型保留下来,后续协作就足以放大正确答案。实验中,scorer 在 Top-3 内命中正确模型的概率接近 98%,这意味着:系统并不需要看所有答案,只需要别漏掉对的模型。

进一步分析:

失败不在选错模型,而在融合阶段


一个很有意思的发现是,在失败案例中:

可见,多模型系统的瓶颈正在发生转移:从 “选谁来回答”,转向 “如何整合多个答案”。

总结:多模型时代,调度很重要

RouteMoA 的意义,并不只是一个更高效的 MoA 变体,而是提供了一种新的范式:

换句话说,随着多模型协作的兴起,系统层的调度与协同,正变得与模型能力同样重要。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“中年返贫三件套”,正在吞掉一代人的存款

“中年返贫三件套”,正在吞掉一代人的存款

十点读书
2026-04-18 18:36:15
央视五四晚会收官3人零差评,2人翻红,1人升咖,唯她不如不来

央视五四晚会收官3人零差评,2人翻红,1人升咖,唯她不如不来

一盅情怀
2026-05-05 15:14:30
世乒赛爆大冷!张本智和3连败 怒批赛制,国乒男团应感谢新赛制

世乒赛爆大冷!张本智和3连败 怒批赛制,国乒男团应感谢新赛制

好乒乓
2026-05-05 12:31:33
心理学揭秘:一个人对家人暴躁易怒,对外人却温和有礼,并非天性冷血,真正原因藏在这两点深层心理里

心理学揭秘:一个人对家人暴躁易怒,对外人却温和有礼,并非天性冷血,真正原因藏在这两点深层心理里

心理观察局
2026-05-02 06:59:03
尴尬了,时间过了4个月,6大造车新势力目标完成率,差的很

尴尬了,时间过了4个月,6大造车新势力目标完成率,差的很

互联网.乱侃秀
2026-05-04 12:00:17
一个奇怪现象:穷人的富养是带孩子四处旅游,增长孩子的欲望;有钱人的富养则是教孩子看清世界的真相和规则,获得真正的能力

一个奇怪现象:穷人的富养是带孩子四处旅游,增长孩子的欲望;有钱人的富养则是教孩子看清世界的真相和规则,获得真正的能力

谭老师地理大课堂
2026-05-02 00:06:29
300069,明天停牌!拟收购商业航天资产!

300069,明天停牌!拟收购商业航天资产!

证券时报e公司
2026-05-05 19:36:23
郑丽文希望访美见特朗普,两岸关系紧张

郑丽文希望访美见特朗普,两岸关系紧张

小蒨喜欢解说
2026-05-05 18:18:12
为什么威尔·史密斯吃面是AI视频的行业标准?

为什么威尔·史密斯吃面是AI视频的行业标准?

beebee
2026-04-28 11:14:40
申花球迷不满1-4负泰山,另有五大深层原因

申花球迷不满1-4负泰山,另有五大深层原因

小僫搞笑解说
2026-05-05 21:42:23
史上首次!iPhone 18 确认延期,15 年传统破了

史上首次!iPhone 18 确认延期,15 年传统破了

新浪财经
2026-05-05 07:05:20
童话式定价:迪士尼早已成为当代贫富检测器

童话式定价:迪士尼早已成为当代贫富检测器

流苏晚晴
2026-05-02 16:48:47
要去北控?赵继伟取消社媒辽篮球员认证 他要和杨鸣一同离开吗

要去北控?赵继伟取消社媒辽篮球员认证 他要和杨鸣一同离开吗

大嘴爵爷侃球
2026-05-05 19:21:59
人到中年才发现一个饭局定律:酒桌上,那个不喝酒、不说话、只埋头吃菜的人,往往是这两种

人到中年才发现一个饭局定律:酒桌上,那个不喝酒、不说话、只埋头吃菜的人,往往是这两种

心理观察局
2026-04-29 15:46:18
45年坚守,一舞破圈!“法拉利大叔”许文飙:最想告诉父亲,儿子被看见了

45年坚守,一舞破圈!“法拉利大叔”许文飙:最想告诉父亲,儿子被看见了

极目新闻
2026-05-05 18:06:15
正定夜市车辆被扔垃圾后续:夜市回应,目击者发声,是一男子带头

正定夜市车辆被扔垃圾后续:夜市回应,目击者发声,是一男子带头

阿纂看事
2026-05-05 16:09:00
打出了季后赛至今的最差之战!76人后场核心能否及时复苏呢?

打出了季后赛至今的最差之战!76人后场核心能否及时复苏呢?

稻谷与小麦
2026-05-05 22:42:11
学生时代的王楚然,纯欲天花板本人。原来校花真是从小美到大的!

学生时代的王楚然,纯欲天花板本人。原来校花真是从小美到大的!

科学发掘
2026-05-05 20:07:45
大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

娱乐圈的笔娱君
2026-05-05 12:45:29
赔光2亿后,冉莹颖独自搬家30箱未给邹市明留体面

赔光2亿后,冉莹颖独自搬家30箱未给邹市明留体面

春之韵
2026-03-18 09:32:52
2026-05-05 23:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3103440文章数 7167关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

本地
艺术
游戏
家居
时尚

本地新闻

用青花瓷的方式,打开西溪湿地

艺术要闻

有多少人知道,它曾是亚洲第一高楼?

全新类魂3A美女角色盔甲太性感!外媒锐评像劣质手游

家居要闻

灵动实用 生活艺术场

衣服不用准备太多,找到一些实用的单品才最重要,百搭又有性价比

无障碍浏览 进入关怀版