网易首页 > 网易号 > 正文 申请入驻

单个LLM已不够?华盛顿大学开源多模型协同框架MoCo

0
分享至



在训练与开发单个通用大语言模型 (LLM) 之外,越来越多的研究开始关注多模型协同(model collaboration):由不同群体、基于不同数据、以不同目的训练的多个大语言模型,通过多样化的协同算法与系统架构,形成组合式人工智能系统。

多个模型可以通过路由算法而因材施用,通过生成文本相互沟通协作,或是在概率分布或模型参数空间做协同运算…… 各种各样的多模型协同研究共同揭示了一种 AI 新未来的可能:由去中心化训练的多样化小模型通过协同算法构建模块化、组合式的 AI 系统,使得人人都能参与共建一种不为任何人单独所有的公共人工智能系统。

为了支持多模型协同研究并加速这一未来愿景的实现,华盛顿大学 (University of Washington) 冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出MoCo—— 一个针对多模型协同研究的 Python 框架。MoCo 支持 26 种在不同层级实现多模型交互的算法,研究者可以灵活自定义数据集、模型以及硬件配置,比较不同算法,优化自身算法,以此构建组合式人工智能系统。MoCo 为设计、评估与分享新的模型协同算法、组合式智能以及协同开发策略提供了重要基础。



  • 论文标题:MoCo: A One-Stop Shop for Model Collaboration Research
  • 论文链接:https://arxiv.org/abs/2601.21257
  • 代码链接:https://github.com/BunsenFeng/model_collaboration

多模型协同算法

多模型协同算法按模型间信息传递的层级主要分为以下四大类:

  • API 层级(API-level collaboration):多个模型如同多个备选的 API,根据不同任务与需求选择不同的模型。主要方法包括 routing、cascading、switched generation 等。
  • 文本层级(Text-level collaboration):多个模型通过生成文本的交互而协作,从而分工解决问题、优化模型输出。主要方法包括 debate、feedback、response aggregation、structured interaction 等。
  • logit 层级(Logit-level collaboration):多个模型的 next-token distribution 之间进行代数运算,再根据共同的 distribution 进行 decoding 以生成文本。主要方法包括 logit aggregation、contrast 等。
  • 权重层级(Weight-level collaboration):多个模型在权重空间进行信息传递与交互,以获得对当前任务更有效的新模型或系统。主要方法包括 model merging、parameter arithemetic 等。

MoCo 框架当前支持来自四个层级的 26 种多模型协同算法,便于研究人员在统一标准下对多模型协同算法进行评测,并为拓展新思路、设计新方法奠定坚实基础。



MoCo 框架

现有的多模型协同研究大多分散在不同的代码库中且各自使用不同的训练与推理框架,这对系统性研究与对比多模型协同算法造成了很大的阻碍。MoCo 汇集众多模型协同研究者的力量,将多样的方法统合到一个框架与 Python package 中。

使用 MoCo 非常简便:下载代码库或通过 pip install modelco 安装 Python 包,通过 config 文件设置参与协同的模型、目标数据集、硬件配置以及各类超参数,再通过一个命令就能执行从简单到复杂的各式协同算法。



MoCo 自带 25 个评估数据集,囊括问答、数学、推理、代码、安全等应用场景,而用户也可轻松引入自己的评估数据集,或者仅用 MoCo 生成回答而另做评估。

MoCo 中的绝大部分算法采用了极为灵活的实现方式,支持任何数量的任何模型通过任何数量的常见 GPU 进行执行,从而使得小模型与少资源的研究场景也被充分支持。

MoCo 支持下的新发现

基于 MoCo 提供的灵活实现,我们扩大模型协同系统的规模,以期找出其 scaling laws。将模型的数量从 2 个一路扩充至 16 个,我们发现普遍的向上趋势:这揭示了一种新的 AI system 的可能性,即很多小模块自底向上组成大系统。

除了扩大规模之外,我们也探讨在同等规模的情况下,模型多样性的作用。我们发现在模型数量均为 8 的情况下,8 个多样的 LLM 协作显著优于 8 个同质的 LLM 协作,揭示了多个模型之间取长补短、互相成就的重要性。



我们还发现多模型协作系统能够解决此前单一模型所不能解决的问题。实验结果表明,在所有单一模型都不能解决的问题中,其协同系统平均能够解决 18.5% 的问题。这也揭示了模型协作不仅仅是简单的能力并集,而是在交互的过程中涌现了单一模型所不具有的能力。



欢迎您的贡献

如果您在研究工作中探索或提出过多个大语言模型协同的算法,欢迎联系作者团队将您的算法加入 MoCo。我们衷心希望通过更多研究人员的参与和贡献,将模型协同打造成一种独特的方法论,为模块化、组合式、去中心化以及共同开发的未来 AI 系统添砖加瓦。

作者介绍:冯尚彬是美国华盛顿大学 (University of Washington) 计算机系博士生,导师为 Dr. Yulia Tsvetkov。他的研究曾获得 ACL 2023 最佳论文奖、ACL 2024 杰出论文奖、the IBM PhD Fellowship、the Jane Street Graduate Research Fellowship、百度奖学金、the NVIDIA Graduate Fellowship。本文的共同第一作者还包括德州农工大学的白雨洋同学以及华盛顿大学的杨梓源同学。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
时速1000公里!我国将建首条超级高铁,马斯克:中国高铁比飞机快

时速1000公里!我国将建首条超级高铁,马斯克:中国高铁比飞机快

火星方阵
2026-06-03 10:27:21
NBA官宣总决赛裁判大名单:福斯特托尼兄弟等四大名哨领衔

NBA官宣总决赛裁判大名单:福斯特托尼兄弟等四大名哨领衔

醉卧浮生
2026-06-03 00:41:39
霍尊也没料到,自己复出后,分手五年的陈露亲手撕碎他最后的体面

霍尊也没料到,自己复出后,分手五年的陈露亲手撕碎他最后的体面

吕醿极限手工
2026-05-09 21:09:38
皇马夏窗首签!30岁国米飞翼加盟 砸2000万欧违约金 穆帅点名要他

皇马夏窗首签!30岁国米飞翼加盟 砸2000万欧违约金 穆帅点名要他

我爱英超
2026-06-03 06:49:31
哈马斯宣布:愿移交加沙所有治理权!以军遭无人机袭击,多人受伤,真主党:不接受“部分停火”!遭特朗普怒斥“疯了”,以总理强硬表态

哈马斯宣布:愿移交加沙所有治理权!以军遭无人机袭击,多人受伤,真主党:不接受“部分停火”!遭特朗普怒斥“疯了”,以总理强硬表态

每日经济新闻
2026-06-03 12:38:20
23小时锁单破万,星耀7靠什么颠覆中级车市场?

23小时锁单破万,星耀7靠什么颠覆中级车市场?

《新车新技术》
2026-05-31 20:39:11
百姓躺平摆烂,食税群体怎么办?

百姓躺平摆烂,食税群体怎么办?

律法刑道
2026-06-03 09:30:48
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

就一点
2026-06-02 15:45:51
奚梦瑶大婚晚宴现场曝光,穿89年生日古董礼服,何猷君增高鞋出圈

奚梦瑶大婚晚宴现场曝光,穿89年生日古董礼服,何猷君增高鞋出圈

烟浔渺渺
2026-06-03 01:26:14
6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

小彬说事
2026-06-03 11:34:06
女子称凌晨入睡后银行卡多次被转账损失约42万,自己未做任何操作 银行:其手机被操控,需等警方调查

女子称凌晨入睡后银行卡多次被转账损失约42万,自己未做任何操作 银行:其手机被操控,需等警方调查

红星新闻
2026-06-03 13:18:18
苏州大学薛艳华去世,年仅37岁,毕业于西南政法大学,履历很优秀

苏州大学薛艳华去世,年仅37岁,毕业于西南政法大学,履历很优秀

180视角
2026-06-03 08:57:37
太讽刺了!女方提出28.8万元彩礼要求,男子送来一瓣蒜和百元现金

太讽刺了!女方提出28.8万元彩礼要求,男子送来一瓣蒜和百元现金

火山詩话
2026-06-02 07:25:54
“机密”文件竟在微信群中传播!查明:档案局服务人员发现涉密文件与儿子工作有关,遂拍照发家庭群,已被辞退;相关负责人被党内严重警告

“机密”文件竟在微信群中传播!查明:档案局服务人员发现涉密文件与儿子工作有关,遂拍照发家庭群,已被辞退;相关负责人被党内严重警告

扬子晚报
2026-06-03 07:37:03
688808!A股“股王”,股价突破2000元!

688808!A股“股王”,股价突破2000元!

证券时报e公司
2026-06-03 10:18:53
山西沁源县委书记赵永进被查,此前当地煤矿爆炸致82人死亡

山西沁源县委书记赵永进被查,此前当地煤矿爆炸致82人死亡

知知贵阳
2026-06-02 22:06:03
我手术需30万父母不理,公婆卖房救我,病好爸妈让我给弟拿200万

我手术需30万父母不理,公婆卖房救我,病好爸妈让我给弟拿200万

千秋历史
2026-05-28 19:46:33
1949年,兰州战役结束,八千将士牺牲,数万俘虏里找不到敌军军官

1949年,兰州战役结束,八千将士牺牲,数万俘虏里找不到敌军军官

唠叨说历史
2026-06-02 17:16:56
妻子裸死前夫床上,现任丈夫拒办后事,丈母娘将现任女婿告上法庭

妻子裸死前夫床上,现任丈夫拒办后事,丈母娘将现任女婿告上法庭

易玄
2026-06-03 09:23:21
学历大放水!清华一年毕业3000多博士,比哈佛耶鲁等五所世界名校加起来多出30%

学历大放水!清华一年毕业3000多博士,比哈佛耶鲁等五所世界名校加起来多出30%

爆角追踪
2026-06-02 22:12:58
2026-06-03 15:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13156文章数 142660关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

教育
房产
家居
健康
公开课

教育要闻

教育部:“阳光志愿”信息服务系统将优化升级

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

家居要闻

江畔轻奢 观云大宅

违规干细胞应用,暗藏致命隐患!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版