网易首页 > 网易号 > 正文 申请入驻

单个LLM已不够?华盛顿大学开源多模型协同框架MoCo

0
分享至

在训练与开发单个通用大语言模型 (LLM) 之外,越来越多的研究开始关注多模型协同 (model collaboration):由不同群体、基于不同数据、以不同目的训练的多个大语言模型,通过多样化的协同算法与系统架构,形成组合式人工智能系统。

多个模型可以通过路由算法而因材施用,通过生成文本相互沟通协作,或是在概率分布或模型参数空间做协同运算…… 各种各样的多模型协同研究共同揭示了一种 AI 新未来的可能:由去中心化训练的多样化小模型通过协同算法构建模块化、组合式的 AI 系统,使得人人都能参与共建一种不为任何人单独所有的公共人工智能系统。

为了支持多模型协同研究并加速这一未来愿景的实现,华盛顿大学 (University of Washington) 冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出 MoCo—— 一个针对多模型协同研究的 Python 框架。MoCo 支持 26 种在不同层级实现多模型交互的算法,研究者可以灵活自定义数据集、模型以及硬件配置,比较不同算法,优化自身算法,以此构建组合式人工智能系统。MoCo 为设计、评估与分享新的模型协同算法、组合式智能以及协同开发策略提供了重要基础。


  • 论文标题:MoCo: A One-Stop Shop for Model Collaboration Research

  • 论文链接:https://arxiv.org/abs/2601.21257

  • 代码链接:https://github.com/BunsenFeng/model_collaboration

多模型协同算法

多模型协同算法按模型间信息传递的层级主要分为以下四大类:

  • API 层级(API-level collaboration):多个模型如同多个备选的 API,根据不同任务与需求选择不同的模型。主要方法包括 routing、cascading、switched generation 等。

  • 文本层级(Text-level collaboration):多个模型通过生成文本的交互而协作,从而分工解决问题、优化模型输出。主要方法包括 debate、feedback、response aggregation、structured interaction 等。

  • logit 层级(Logit-level collaboration):多个模型的 next-token distribution 之间进行代数运算,再根据共同的 distribution 进行 decoding 以生成文本。主要方法包括 logit aggregation、contrast 等。

  • 权重层级(Weight-level collaboration):多个模型在权重空间进行信息传递与交互,以获得对当前任务更有效的新模型或系统。主要方法包括 model merging、parameter arithmetic 等。

MoCo 框架当前支持来自四个层级的 26 种多模型协同算法,便于研究人员在统一标准下对多模型协同算法进行评测,并为拓展新思路、设计新方法奠定坚实基础。


MoCo 框架

现有的多模型协同研究大多分散在不同的代码库中且各自使用不同的训练与推理框架,这对系统性研究与对比多模型协同算法造成了很大的阻碍。MoCo 汇集众多模型协同研究者的力量,将多样的方法统合到一个框架与 Python package 中。

使用 MoCo 非常简便:下载代码库或通过 pip install modelco 安装 Python 包,通过 config 文件设置参与协同的模型、目标数据集、硬件配置以及各类超参数,再通过一个命令就能执行从简单到复杂的各式协同算法。


MoCo 自带 25 个评估数据集,囊括问答、数学、推理、代码、安全等应用场景,而用户也可轻松引入自己的评估数据集,或者仅用 MoCo 生成回答而另做评估。

MoCo 中的绝大部分算法采用了极为灵活的实现方式,支持任何数量的任何模型通过任何数量的常见 GPU 进行执行,从而使得小模型与少资源的研究场景也被充分支持。

MoCo 支持下的新发现

基于 MoCo 提供的灵活实现,我们扩大模型协同系统的规模,以期找出其 scaling laws。将模型的数量从 2 个一路扩充至 16 个,我们发现普遍的向上趋势:这揭示了一种新的 AI system 的可能性,即很多小模块自底向上组成大系统。

除了扩大规模之外,我们也探讨在同等规模的情况下,模型多样性的作用。我们发现在模型数量均为 8 的情况下,8 个多样的 LLM 协作显著优于 8 个同质的 LLM 协作,揭示了多个模型之间取长补短、互相成就的重要性。


我们还发现多模型协作系统能够解决此前单一模型所不能解决的问题。实验结果表明,在所有单一模型都不能解决的问题中,其协同系统平均能够解决 18.5% 的问题。这也揭示了模型协作不仅仅是简单的能力并集,而是在交互的过程中涌现了单一模型所不具有的能力。


欢迎您的贡献

如果您在研究工作中探索或提出过多个大语言模型协同的算法,欢迎联系作者团队将您的算法加入 MoCo。我们衷心希望通过更多研究人员的参与和贡献,将模型协同打造成一种独特的方法论,为模块化、组合式、去中心化以及共同开发的未来 AI 系统添砖加瓦。

作者介绍:冯尚彬是美国华盛顿大学 (University of Washington) 计算机系博士生,导师为 Dr. Yulia Tsvetkov。他的研究曾获得 ACL 2023 最佳论文奖、ACL 2024 杰出论文奖、the IBM PhD Fellowship、the Jane Street Graduate Research Fellowship、百度奖学金、the NVIDIA Graduate Fellowship。本文的共同第一作者还包括德州农工大学的白雨洋同学以及华盛顿大学的杨梓源同学。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最强单兵!

最强单兵!

武器纵论
2026-01-08 21:46:52
确认了!是知名演员张嘉益

确认了!是知名演员张嘉益

看尽落尘花q
2026-01-04 11:55:44
铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车栽得太冤了

铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车栽得太冤了

爱吃醋的猫咪
2026-02-01 19:36:46
比谢霆锋还颠!张柏芝大儿子恋情疑曝光,46岁大妈、辣妹都不放过

比谢霆锋还颠!张柏芝大儿子恋情疑曝光,46岁大妈、辣妹都不放过

查尔菲的笔记
2026-02-09 15:02:01
2026年西数所有HDD售罄 硬盘要大涨价了

2026年西数所有HDD售罄 硬盘要大涨价了

3DM游戏
2026-02-16 20:29:07
汕头一酒店春节涨至4200元一晚?工作人员:今天最新价格为1650元,还有房

汕头一酒店春节涨至4200元一晚?工作人员:今天最新价格为1650元,还有房

极目新闻
2026-02-11 22:26:02
甘肃天水一佳人好漂亮,国色天姿,眉眼带笑 美的让人移不开眼

甘肃天水一佳人好漂亮,国色天姿,眉眼带笑 美的让人移不开眼

小椰的奶奶
2026-02-14 21:48:05
网约车市场历史性崩盘:普通人最后退路,彻底堵死

网约车市场历史性崩盘:普通人最后退路,彻底堵死

流苏晚晴
2026-02-15 18:06:52
马年春晚节目单刚刚公布!李健时隔13年回归,王菲再唱神曲,沈腾马丽不演小品了

马年春晚节目单刚刚公布!李健时隔13年回归,王菲再唱神曲,沈腾马丽不演小品了

极目新闻
2026-02-16 14:42:38
刚建国就敢盖皇宫?毛主席回京看到这一幕,拍着桌子吼了5个字,周总理都不敢劝,这究竟是谁有这么大的胆子?

刚建国就敢盖皇宫?毛主席回京看到这一幕,拍着桌子吼了5个字,周总理都不敢劝,这究竟是谁有这么大的胆子?

老杉说历史
2026-01-06 20:22:20
奥沙利文:提前离场让我和亨得利两三年没说话,但如今已重归于好

奥沙利文:提前离场让我和亨得利两三年没说话,但如今已重归于好

世界体坛观察家
2026-02-16 17:03:16
王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

南权先生
2026-02-02 15:59:44
断层第一!《飞驰人生3》太牛了,会是春节档冠军吗

断层第一!《飞驰人生3》太牛了,会是春节档冠军吗

小七追剧站
2026-02-17 00:10:45
字节跳动承诺对AI视频工具Seedance采取限制措施以避免侵权

字节跳动承诺对AI视频工具Seedance采取限制措施以避免侵权

cnBeta.COM
2026-02-16 20:02:13
为了换取美国放弃乌克兰,俄要反华?美媒:普京特使送出7份大礼

为了换取美国放弃乌克兰,俄要反华?美媒:普京特使送出7份大礼

一口娱乐
2026-02-16 22:28:15
59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

叹为观止易
2026-02-03 14:15:30
重磅!中国对英国和加拿大免签,今年2月17日正式执行!

重磅!中国对英国和加拿大免签,今年2月17日正式执行!

英国那些事儿
2026-02-16 20:15:54
马筱梅除夕晒幸福!汪小菲打高尔夫,全家吃高定菜,张兰做法费解

马筱梅除夕晒幸福!汪小菲打高尔夫,全家吃高定菜,张兰做法费解

鱼语昱雨轩
2026-02-16 19:17:28
除了孙悟空,菩提祖师还有三个得意弟子,分别是:一佛一帝一妖王

除了孙悟空,菩提祖师还有三个得意弟子,分别是:一佛一帝一妖王

金宝哥讲故事
2025-12-27 09:15:08
花了18年,他把孩子送上世界名校:1个月后,儿子去世了

花了18年,他把孩子送上世界名校:1个月后,儿子去世了

社会日日鲜
2026-02-16 09:09:56
2026-02-17 00:56:49
呼呼历史论
呼呼历史论
分享有趣的历史
384文章数 16359关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

全明星正赛美国星辰队夺冠 爱德华兹MVP

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

艺术
教育
本地
手机
公开课

艺术要闻

名家笔下话过年,别有风味!

教育要闻

2025智慧家长家教好故事分享会大年初一19:32开播!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

华为Mate 80系列首登春晚竖屏直播,独家机位捕捉舞台侧精彩互动

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版