网易首页 > 网易号 > 正文 申请入驻

3B模型新SOTA!开源AI让日常调用不同大模型更简单

0
分享至

NEXA AI 投稿
量子位 | 公众号 QbitAI

大模型,大,能力强,好用!

但单一大模型在算力、数据和能耗方面面临巨大的限制,且消耗大量资源。

而且目前最强大的模型大多为闭源,对AI开发的速度、安全性和公平性有所限制。

AI大模型的未来发展趋势,需要怎么在单一大模型和多个专门化小模型之间做平衡和选择?

针对如此现状,两位斯坦福校友创办的NEXA AI,提出了一种新的方法:

采用functional token整合了多个开源模型,每个模型都针对特定任务进行了优化。

他们开发了一个名叫Octopus v4的模型,利用functional token智能地将用户查询引导至最合适的垂直模型,并重新格式化查询以实现最佳性能。

介绍一下,Octopus v4是前代系列模型的演化,擅长选择和参数理解与重组。

此外,团队还探索了使用图作为一种多功能数据结构,有效地协调多个开源模型,利用Octopus模型和functional token的能力。

通过激活约100亿参数的模型,Octopus v4在同级别模型中实现了74.8的SOTA MMLU分数。

Octopus系列模型

这里要重点介绍一下Octopus-V4-3B

它拥有30亿参数,开源,是Nexa AI设想中的语言模型图的主节点。

该模型专为MMLU基准测试话题定制,能够高效地将用户查询转换成专业模型可以有效处理的格式。

它擅长将这些查询正确引导至相应的专业模型,确保精确且有效的查询处理。

Octopus-V4-3B具备以下特点:

  • 紧凑尺寸:Octopus-V4-3B体积紧凑,使其能在智能设备上高效、迅速地运行。
  • 准确性:利用functional token设计准确地将用户查询映射到专业模型,提高了其精度。
  • 查询重格式化:帮助将自然人类语言转换为更专业的格式,改善了查询描述,从而获得更准确的响应。

Nexa AI把语言模型作为图中的节点整合,并提供了针对实际应用定制的系统架构。

此外,讨论了使用合成数据集对Octopus模型进行训练的策略,强调了这种语言模型图在生产环境中的系统设计。

从Octopus v2提取的用于分类的语言模型

研究人员在Octopus v2论文中介绍了一种名为functional token的分类方法。

Octopus v2模型有效地处理了这一任务:

图中的语言模型作为节点

考虑一个定义为:G=(N,E)。

其中N代表图中的各种节点,E代表连接这些节点的边。

节点分为两种类型:

一,主节点Nm,它们通过将查询定向到合适的工作节点Nω并传递执行任务所需的信息来协调查询。

二,工作节点,接收来自主节点的信息并执行所需的任务,使用Octopus模型来促进进一步的协调。

节点信息传输过程如下图所示。

为了处理用户查询q并生成响应y,研究人员将概率建模为:

对于只涉及一个工作节点的单步任务,该过程可以定义为:

这里,P(Nω,ph|q;Nm)使用Octopus v2模型为m选择最佳的相邻工作节点并重新格式化查询为ℎ,这是重构的查询。

概率P(y|qh;Nω)由位于工作节点的语言模型计算。

对于多步任务,通常在多代理工作流中,该过程涉及多个节点之间的几次顺序交互,如下:

使用图进行多步骤操作的任务规划

多步骤任务规划中,所有功能列在上下文中提交给语言模型,生成基于用户查询的计划。

传统方法在处理长功能描述时有局限性,尤其是参数少于10B的模型。

基于图的方法确保只考虑与特定节点相关的邻近节点,显著减少了选择的复杂性。

语言模型图的系统设计

以下详细说明了复杂图中每个节点代表一个语言模型的系统架构,利用多个Octopus模型进行协调。

在准备生产部署时,整合一个负载均衡器以有效管理系统需求至关重要。

然后,研究团队将系统划分为几个可管理的组件,强调核心方法:

首先是工作节点部署。

每个工作节点Nω对应一个单独的语言模型。

团队建议为这些节点采用无服务器架构,特别推荐使用Kubernetes进行基于内存使用和工作负载的强大自动缩放。

其次是主节点部署。

主节点应使用不超过10B参数的基础模型(实验中使用3B模型),以便在边缘设备上部署。

每个工作节点与一个Octopus模型接口,以增强协调。

如Octopus v2所示,可以集成一个紧凑的Lora模型以扩展functional token的能力。

建议使用单一基础模型并补充多个Loras,每个工作节点一个。

推荐使用开源的LoraX库来管理这种配置的推理操作。

再者是通讯。

工作节点和主节点分布在不同设备上,不限于单一设备。

因此,互联网连接对于节点之间的数据传输至关重要。

虽然主节点可能位于智能设备上,工作节点则托管在云端或其他设备上,结果返回智能设备。

为了支持数据缓存需求,包括聊天历史存储,推荐使用Redis,一个高性能的内存数据库,促进分布式缓存。

实验

研究人员详细介绍了框架进行的实验,通过多节点协作提高语言模型性能。

采用了17种不同的模型进行MMLU任务,Octopus v4模型将用户查询定向到相关的专业模型并适当重格式化。

MMLU包含57个独特的任务,分为17个整合组。

专业模型根据基准得分、人气和用户推荐从Hugging Face精选。

并非所有任务都有专门模型,例如人文学科和社会科学目前无专门模型,但Llama3模型通过系统提示调整模拟专业能力。

未来工作与讨论

当前,NEXA AI的GitHub 项目专注于开发语言模型的图形框架,目前处于起始阶段。

团队计划通过整合多种垂直特定模型并加入Octopus v4模型来增强这一框架,以多代理能力为特征。

未来版本将在此存储库中展示更强大的图形表示。

GitHub Repo将由Nexa AI维护,团队今后旨在为多种垂直领域开发紧凑、专门化的模型。

与更大模型的缩放法则、数据集相比,NEXA AI的框架无限制,并且可以创建一个大型图。

此外,团队正在开发多模态模型Octopus 3.5,能够处理视觉、音频和视频数据;完成开发后,将被纳入图形框架。

论文链接:https://arxiv.org/pdf/2404.19296
GitHub: https://github.com/NexaAI/octopus-v4
试用Octopus v4:https://huggingface.co/NexaAIDev/Octopus-v4

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
四十年前罕见老物件,见过五种以上算你厉害,全认识叫你一声爷爷

四十年前罕见老物件,见过五种以上算你厉害,全认识叫你一声爷爷

万物知识圈
2025-11-05 09:29:21
又见“家长抱着婴儿在学校门口站岗”:学校阻止了,她说她可以!

又见“家长抱着婴儿在学校门口站岗”:学校阻止了,她说她可以!

走读新生
2025-11-05 18:19:25
为何毒蛇再毒也杀不死猪?有科学依据能证明,猪是毒蛇的天敌吗?

为何毒蛇再毒也杀不死猪?有科学依据能证明,猪是毒蛇的天敌吗?

温读史
2025-11-05 19:05:37
迟迟等不到中方供货后,安世荷兰将负100%全责,商务部宣布大结局

迟迟等不到中方供货后,安世荷兰将负100%全责,商务部宣布大结局

青途历史
2025-11-06 00:57:14
3300亿巨头落幕!“南通铁军之首”被悬赏1500万,首富已无力回天

3300亿巨头落幕!“南通铁军之首”被悬赏1500万,首富已无力回天

花小猫的美食日常
2025-11-06 03:14:54
10年湖北打工妹嫁英国高管,结婚8 年持刀捅死丈夫,如今下场唏嘘

10年湖北打工妹嫁英国高管,结婚8 年持刀捅死丈夫,如今下场唏嘘

银河史记
2025-11-04 20:17:37
白宫通告全球,中美达成大交易,欧盟隔过特朗普,找中国讨要好处

白宫通告全球,中美达成大交易,欧盟隔过特朗普,找中国讨要好处

徐醇老表哥
2025-11-06 03:17:23
国台办:对于迫害大陆配偶的“台独”帮凶爪牙,我们决不轻饶

国台办:对于迫害大陆配偶的“台独”帮凶爪牙,我们决不轻饶

环球网资讯
2025-11-05 11:10:12
不敢相信!74岁刘晓庆穿牛仔如少女,真实状态让全网酸了!

不敢相信!74岁刘晓庆穿牛仔如少女,真实状态让全网酸了!

手工制作阿歼
2025-11-06 03:57:56
年薪300万,却从替补打成球队老大!被低估的超巨,你不该被抛弃

年薪300万,却从替补打成球队老大!被低估的超巨,你不该被抛弃

篮球扫地僧
2025-11-05 17:03:05
官宣!山东女排换帅,李岩龙妻子接任,曾入选陈忠和国家队

官宣!山东女排换帅,李岩龙妻子接任,曾入选陈忠和国家队

跑者排球视角
2025-11-05 22:11:30
佟丽娅晒照为董璇庆生,评论区炸了:张维伊更帅了,董璇孕肚明显

佟丽娅晒照为董璇庆生,评论区炸了:张维伊更帅了,董璇孕肚明显

老缰科普
2025-11-06 00:31:50
美荷两国同时发声,对中国独立研发的光刻机技术给予了强烈批评

美荷两国同时发声,对中国独立研发的光刻机技术给予了强烈批评

铁锤简科
2025-11-05 18:11:41
喊上门按摩,发现是女同学妈妈,结束后她问我:还要别的服务吗?

喊上门按摩,发现是女同学妈妈,结束后她问我:还要别的服务吗?

凯裕说故事
2025-09-03 16:59:48
郑丽文主持首场中评会,被多人打脸;邱毅要郑丽文道歉,匪夷所思

郑丽文主持首场中评会,被多人打脸;邱毅要郑丽文道歉,匪夷所思

林子说事
2025-11-06 01:20:31
前夫高峰都没想到,那英会因为马思纯的一封手写信,实现口碑逆转

前夫高峰都没想到,那英会因为马思纯的一封手写信,实现口碑逆转

易昂杨
2025-11-05 14:42:09
这场盛会再次释放重要信号!

这场盛会再次释放重要信号!

九万里
2025-11-05 09:55:41
蓝营大洗牌!侯友宜拒交棒,洪秀柱力挺新主!

蓝营大洗牌!侯友宜拒交棒,洪秀柱力挺新主!

放开他让wo来
2025-11-05 09:59:19
一种新型 “软啃老”正在扩散:40岁子女不伸手要钱不蹭住,却用这2种方式拖垮父母

一种新型 “软啃老”正在扩散:40岁子女不伸手要钱不蹭住,却用这2种方式拖垮父母

有故事的人
2025-11-04 06:17:05
中美一起崩溃论

中美一起崩溃论

求实处
2025-11-04 20:31:56
2025-11-06 04:35:00
量子位 incentive-icons
量子位
追踪人工智能动态
11633文章数 176326关注度
往期回顾 全部

科技要闻

大转弯!特朗普再提名马斯克盟友任NASA局长

头条要闻

俄士兵连遭乌军7架无人机袭击奇迹生还 视频披露

头条要闻

俄士兵连遭乌军7架无人机袭击奇迹生还 视频披露

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

港星林尚武突发心脏病去世

财经要闻

事关加快建设金融强国 中央金融办发声

汽车要闻

智己LS9入局"9系"混战 全尺寸SUV市场迎来新变量

态度原创

教育
旅游
房产
家居
军事航空

教育要闻

最新:2026年南京中考体育考试内容及评分标准曝光!

旅游要闻

坝河15公里游船航线开始试航

房产要闻

最新!海南楼市10月热销榜单出炉!

家居要闻

别样府院 畅享诗意生活

军事要闻

美国“福特”号航母驶往加勒比海

无障碍浏览 进入关怀版