网易首页 > 网易号 > 正文 申请入驻

3B模型新SOTA!开源AI让日常调用不同大模型更简单

0
分享至

NEXA AI 投稿
量子位 | 公众号 QbitAI

大模型,大,能力强,好用!

但单一大模型在算力、数据和能耗方面面临巨大的限制,且消耗大量资源。

而且目前最强大的模型大多为闭源,对AI开发的速度、安全性和公平性有所限制。

AI大模型的未来发展趋势,需要怎么在单一大模型和多个专门化小模型之间做平衡和选择?

针对如此现状,两位斯坦福校友创办的NEXA AI,提出了一种新的方法:

采用functional token整合了多个开源模型,每个模型都针对特定任务进行了优化。

他们开发了一个名叫Octopus v4的模型,利用functional token智能地将用户查询引导至最合适的垂直模型,并重新格式化查询以实现最佳性能。

介绍一下,Octopus v4是前代系列模型的演化,擅长选择和参数理解与重组。

此外,团队还探索了使用图作为一种多功能数据结构,有效地协调多个开源模型,利用Octopus模型和functional token的能力。

通过激活约100亿参数的模型,Octopus v4在同级别模型中实现了74.8的SOTA MMLU分数。

Octopus系列模型

这里要重点介绍一下Octopus-V4-3B

它拥有30亿参数,开源,是Nexa AI设想中的语言模型图的主节点。

该模型专为MMLU基准测试话题定制,能够高效地将用户查询转换成专业模型可以有效处理的格式。

它擅长将这些查询正确引导至相应的专业模型,确保精确且有效的查询处理。

Octopus-V4-3B具备以下特点:

  • 紧凑尺寸:Octopus-V4-3B体积紧凑,使其能在智能设备上高效、迅速地运行。
  • 准确性:利用functional token设计准确地将用户查询映射到专业模型,提高了其精度。
  • 查询重格式化:帮助将自然人类语言转换为更专业的格式,改善了查询描述,从而获得更准确的响应。

Nexa AI把语言模型作为图中的节点整合,并提供了针对实际应用定制的系统架构。

此外,讨论了使用合成数据集对Octopus模型进行训练的策略,强调了这种语言模型图在生产环境中的系统设计。

从Octopus v2提取的用于分类的语言模型

研究人员在Octopus v2论文中介绍了一种名为functional token的分类方法。

Octopus v2模型有效地处理了这一任务:

图中的语言模型作为节点

考虑一个定义为:G=(N,E)。

其中N代表图中的各种节点,E代表连接这些节点的边。

节点分为两种类型:

一,主节点Nm,它们通过将查询定向到合适的工作节点Nω并传递执行任务所需的信息来协调查询。

二,工作节点,接收来自主节点的信息并执行所需的任务,使用Octopus模型来促进进一步的协调。

节点信息传输过程如下图所示。

为了处理用户查询q并生成响应y,研究人员将概率建模为:

对于只涉及一个工作节点的单步任务,该过程可以定义为:

这里,P(Nω,ph|q;Nm)使用Octopus v2模型为m选择最佳的相邻工作节点并重新格式化查询为ℎ,这是重构的查询。

概率P(y|qh;Nω)由位于工作节点的语言模型计算。

对于多步任务,通常在多代理工作流中,该过程涉及多个节点之间的几次顺序交互,如下:

使用图进行多步骤操作的任务规划

多步骤任务规划中,所有功能列在上下文中提交给语言模型,生成基于用户查询的计划。

传统方法在处理长功能描述时有局限性,尤其是参数少于10B的模型。

基于图的方法确保只考虑与特定节点相关的邻近节点,显著减少了选择的复杂性。

语言模型图的系统设计

以下详细说明了复杂图中每个节点代表一个语言模型的系统架构,利用多个Octopus模型进行协调。

在准备生产部署时,整合一个负载均衡器以有效管理系统需求至关重要。

然后,研究团队将系统划分为几个可管理的组件,强调核心方法:

首先是工作节点部署。

每个工作节点Nω对应一个单独的语言模型。

团队建议为这些节点采用无服务器架构,特别推荐使用Kubernetes进行基于内存使用和工作负载的强大自动缩放。

其次是主节点部署。

主节点应使用不超过10B参数的基础模型(实验中使用3B模型),以便在边缘设备上部署。

每个工作节点与一个Octopus模型接口,以增强协调。

如Octopus v2所示,可以集成一个紧凑的Lora模型以扩展functional token的能力。

建议使用单一基础模型并补充多个Loras,每个工作节点一个。

推荐使用开源的LoraX库来管理这种配置的推理操作。

再者是通讯。

工作节点和主节点分布在不同设备上,不限于单一设备。

因此,互联网连接对于节点之间的数据传输至关重要。

虽然主节点可能位于智能设备上,工作节点则托管在云端或其他设备上,结果返回智能设备。

为了支持数据缓存需求,包括聊天历史存储,推荐使用Redis,一个高性能的内存数据库,促进分布式缓存。

实验

研究人员详细介绍了框架进行的实验,通过多节点协作提高语言模型性能。

采用了17种不同的模型进行MMLU任务,Octopus v4模型将用户查询定向到相关的专业模型并适当重格式化。

MMLU包含57个独特的任务,分为17个整合组。

专业模型根据基准得分、人气和用户推荐从Hugging Face精选。

并非所有任务都有专门模型,例如人文学科和社会科学目前无专门模型,但Llama3模型通过系统提示调整模拟专业能力。

未来工作与讨论

当前,NEXA AI的GitHub 项目专注于开发语言模型的图形框架,目前处于起始阶段。

团队计划通过整合多种垂直特定模型并加入Octopus v4模型来增强这一框架,以多代理能力为特征。

未来版本将在此存储库中展示更强大的图形表示。

GitHub Repo将由Nexa AI维护,团队今后旨在为多种垂直领域开发紧凑、专门化的模型。

与更大模型的缩放法则、数据集相比,NEXA AI的框架无限制,并且可以创建一个大型图。

此外,团队正在开发多模态模型Octopus 3.5,能够处理视觉、音频和视频数据;完成开发后,将被纳入图形框架。

论文链接:https://arxiv.org/pdf/2404.19296
GitHub: https://github.com/NexaAI/octopus-v4
试用Octopus v4:https://huggingface.co/NexaAIDev/Octopus-v4

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳西乡,房价从2015年21800涨到93800,当前价格回到真实价位

深圳西乡,房价从2015年21800涨到93800,当前价格回到真实价位

爱看剧的阿峰
2026-02-22 13:36:55
一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

阅毒君
2026-01-05 07:05:06
云南抚仙湖百名游客沉船无人生还,探险者潜入水底发现千年尸陀林

云南抚仙湖百名游客沉船无人生还,探险者潜入水底发现千年尸陀林

真实故事汇
2024-07-02 12:47:27
黄蜂场面占优,为什么会输给骑士?因为“就差了个哈登!”

黄蜂场面占优,为什么会输给骑士?因为“就差了个哈登!”

2023面包
2026-02-21 20:19:32
竞争激烈!26赛季中超外援身价排名:浙江跻身前3,海牛倒一

竞争激烈!26赛季中超外援身价排名:浙江跻身前3,海牛倒一

邱泽云
2026-02-22 15:33:44
调整!中央5台今晚直播WTT大满贯有变 CCTV5不播王楚钦冲男单32强

调整!中央5台今晚直播WTT大满贯有变 CCTV5不播王楚钦冲男单32强

皮皮观天下
2026-02-22 16:54:14
1952年,88岁齐白石将25岁新凤霞拉进屋:柜子里都是钱,你随便拿

1952年,88岁齐白石将25岁新凤霞拉进屋:柜子里都是钱,你随便拿

兴趣知识
2025-12-31 18:24:12
国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

霹雳炮
2026-01-19 22:24:13
再次刷新火箭复用纪录:SpaceX猎鹰9号完成第33次飞行及回收

再次刷新火箭复用纪录:SpaceX猎鹰9号完成第33次飞行及回收

IT之家
2026-02-22 17:24:35
歼10C获天价订单,印媒罕见表态:优于西方战机

歼10C获天价订单,印媒罕见表态:优于西方战机

观察者小海风
2026-02-22 06:34:03
一场追思会,戳穿翁帆沉默两个月真相,原来杨振宁生前真的没说错

一场追思会,戳穿翁帆沉默两个月真相,原来杨振宁生前真的没说错

来科点谱
2025-12-15 09:06:33
续航 + 230km / 隔音大升级!Model Y 悄悄上新,专治家庭出行痛点

续航 + 230km / 隔音大升级!Model Y 悄悄上新,专治家庭出行痛点

阿芒娱乐说
2026-02-20 02:28:46
马筱梅即将临盆,张兰带汪小菲爸爸到台北照顾大S的两娃,晒新照

马筱梅即将临盆,张兰带汪小菲爸爸到台北照顾大S的两娃,晒新照

安宁007
2026-02-22 15:51:27
盐城“415大案”主犯,到底有多残忍?审判后旁听群众:应判凌迟

盐城“415大案”主犯,到底有多残忍?审判后旁听群众:应判凌迟

谈史论天地
2026-02-03 06:05:28
瓜迪奥拉:我不知道阿森纳会怎样,但我觉得我们之后无法全胜

瓜迪奥拉:我不知道阿森纳会怎样,但我觉得我们之后无法全胜

懂球帝
2026-02-22 07:45:09
女大学生去山区支教真的安全吗?网友:师姐变成墓碑永远留在那了

女大学生去山区支教真的安全吗?网友:师姐变成墓碑永远留在那了

另子维爱读史
2026-01-22 18:33:13
翻脸!日本公开反驳美国:特朗普的做法“毫无道理可言”!

翻脸!日本公开反驳美国:特朗普的做法“毫无道理可言”!

小陆搞笑日常
2026-02-22 17:01:25
顾顺章叛变,导致千名同志被害,为何到死也没提“一号机密”?

顾顺章叛变,导致千名同志被害,为何到死也没提“一号机密”?

雍亲王府
2026-02-21 10:45:05
10岁男孩从北帝山景区悬崖栈道坠下,官方通报

10岁男孩从北帝山景区悬崖栈道坠下,官方通报

现代快报
2026-02-22 10:36:09
木耳不要直接用水泡,相当于吃虫卵,大厨教你正确做法,太实用了

木耳不要直接用水泡,相当于吃虫卵,大厨教你正确做法,太实用了

妙招酷
2026-02-19 23:55:20
2026-02-22 18:39:00
量子位 incentive-icons
量子位
追踪人工智能动态
12189文章数 176389关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

体育要闻

75673人见证!迈阿密0-3:梅西孙兴慜过招

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

时尚
游戏
亲子
本地
家居

50岁女性过冬穿搭:有大衣和羽绒服就够了,简约从容才是优雅

PS6最新最全爆料汇总!这次还包含游戏

亲子要闻

萌娃看见妈妈的大肚子竟崩溃大哭,太可爱了

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

本真栖居 爱暖伴流年

无障碍浏览 进入关怀版