网易首页 > 网易号 > 正文 申请入驻

Hermes新功能上线!比Opus 4.8和GPT-5.5还猛

0
分享至


AI应用风向标(公众号:ZhidxcomAI)
作者|毕伟豪
编辑|漠影

智东西6月30日报道,现在,Fable 5和Mythos 5等顶尖闭源模型没法使用,就算能用,单一模型也总有搞不定的问题,那么,想要高质量输出结果的用户该怎么办呢

近日,Hermes Agent上线了MoA(Mixture of Agents)功能,支持用户自由组合多种模型作为虚拟模型使用,在Nous Research即将发布的基准测试中,这个混合模型的评分超过了Opus 4.8 和GPT-5.5


一、Fable 5、Mythos 5被禁,多模型组合成为潮流

Nous Research在官推上说了这样一句话:“最强大的模型是受限的,只有少数人才能获得访问权限。”这句话明晃晃地指向了Fable 5等模型被封禁的事件。


在这种背景下,不难看出,MoA这个混合模型模式的终极目的,是用开源模型的组合达到顶尖闭源模型的水准,就像Hermes Agent联合创始人Teknium说的,他们正在测试各种开源模型组合,看看是否能用更便宜的模型达到Opus的水平。

这种多模型组合比肩顶尖模型的思路,最近其实有不少实践的例子,比如前段时间日本AI独角兽Sakana AI发布的Sakana Fugu系列编排器模型,会根据任务选择最佳的模型来处理,和MoA的思路非常相似。


而MoA的技术也在很久之前就已存在了,2024年6月Together AI曾发表过一篇论文《Mixture-of-Agents Enhances Large Language Model Capabilities》,核心是多LLM组合,每一层模型都会参考上一层模型的输出,再继续生成自己的回答。同时,论文也将模型分成了两类,也就是现在Hermes所用的参考模型和聚合模型。


当用户提出问题时,参考模型会先对问题进行分析判断,然后给出参考意见,随后由聚合模型来综合判断,并调用工具执行具体任务。

参考模型只生成意见、不会使用任何工具,也不能执行任何命令。这种模式可以发挥不同模型的独特优势,集各家之所长,让擅长规划的模型来提意见,让长于实践的模型来完成任务。

使用这个模式也很简单,以桌面版为例,只需要在设置里点开模型选项,向下翻就可以看到Mixture of Agents的选项了,直接选择你想用的模型进行组合即可,默认状态下是两个参考模型和一个聚合模型,也可以自己手动添加多个参考模型。


二、实测做游戏更丝滑,Token消耗量相差不大

海外有博主专门做了实测,用两种组合方式分别生成了游戏和交互页面,实测结果发现,使用MoA任务完成的时间并不一定会变长,会因为模型选择的不同而发生变化,同时,Token的消耗量也没有想象中恐怖

博主先是测试了一个小游戏的制作,使用Three.js开发一个原力海盗训练竞技场游戏,为了对比效果,他先使用单一模型glm-5.2来做测试,输入提示词:


Hermes花费了0.38美元,用时13分钟搞定了这个游戏,可以看到,单一glm-5.2模型生成的游戏效果整体上还不错,但是在移动速度和流畅程度上存在一些问题,比如飞船很难躲避敌人的攻击,可玩性稍弱。


随后博主启用了MoA,用kimi-k2.6和minimax-m3做参考模型,glm-5.2做聚合模型,然后新开对话,输入同样的提示词。


这一次,Hermes花费了0.47美元,用时35分钟完成任务,价格比单一模型稍高一些,时间上翻了接近三倍。虽然在时间和成本上更高,但MoA模式下的生成效果也明显更好,可以看到其移动速度、流畅程度以及关卡合理性都比单一模型的输出结果好很多。


随后,博主又使用顶尖闭源模型GPT-5.5进行了测试,这一次是让Hermes生成一个可交互的动漫多元宇宙仪表盘,包括火影忍者、海贼王、龙珠等IP。对照组依旧是单一模型,使用GPT-5.5执行任务,由于是订阅制,因此博主直言没办法核算成本。


Hermes用了接近7分钟完成任务,设计的仪表盘中间的光球周围的光圈有一些简单,缺少质感,但交互上非常流畅。


随后博主用了三个grok模型做参考模型,GPT-5.5为聚合模型进行同样的测试,令他意想不到的是,MoA模式下的Hermes生成速度竟然更快,博主推测可能是由于使用了grok快速模型的原因。


能看到这次的生成结果明显更有质感,尤其是中间的光球设计感很强,整体交互也非常丝滑,而且点击不同的星球还有远近景的切换。


结语:未来比拼的,不只是模型

过去,大模型竞争几乎都是围绕着“谁家的模型更强”展开的,用户需要不断切换不同模型,在编程、写作、推理之间寻找最适合的那个。

但MoA、Sakana Fugu等已然在另一个思路上前进:与其等待一个“万能模型”,不如让多个擅长不同能力的模型共同完成一项任务

这种走向“编排”的趋势,其实刚好符合Agent的要求,模型是底层能力,Agent负责组织不同模型协作,让规划能力强的模型负责思考,让执行能力强的模型负责落地

当然,目前MoA需要承担更高的推理成本,在部分任务上耗时也会明显增加,并不是所有场景都值得开启。但随着推理成本持续下降、开源模型能力不断提升,多模型协作很可能会成为Agent未来的默认工作方式


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
梅西和C罗的广告多到分不清“金主”是谁了

梅西和C罗的广告多到分不清“金主”是谁了

界面新闻
2026-06-30 08:01:05
7月1日正式落地!人社56号令全面革新,工资、养老待遇迎来大调整

7月1日正式落地!人社56号令全面革新,工资、养老待遇迎来大调整

老特有话说
2026-06-30 16:04:40
18.88万起!比亚迪发布新车:6月29日,正式上市

18.88万起!比亚迪发布新车:6月29日,正式上市

科技阿维
2026-06-30 17:46:18
官方:巴黎前锋贡萨洛-拉莫斯加盟米兰;据悉转会费超7400万欧

官方:巴黎前锋贡萨洛-拉莫斯加盟米兰;据悉转会费超7400万欧

懂球帝
2026-06-30 22:55:02
俄罗斯预警的事果然发生了,美国以切断天然气供应为由,威胁欧盟

俄罗斯预警的事果然发生了,美国以切断天然气供应为由,威胁欧盟

起喜电影
2026-06-30 01:40:33
1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

睡前讲故事
2026-06-18 19:33:01
3363万元!华润新能源网上弃购金额创年内新高

3363万元!华润新能源网上弃购金额创年内新高

每日经济新闻
2026-06-30 23:24:03
随着巴西2-1逆转日本 产生3个不可思议和2个不争事实 亚洲队克星

随着巴西2-1逆转日本 产生3个不可思议和2个不争事实 亚洲队克星

侃球熊弟
2026-06-30 03:31:58
世界杯盘口走势大幅反转,挪威纸面优势难掩数据隐患

世界杯盘口走势大幅反转,挪威纸面优势难掩数据隐患

罗纳尔说个球
2026-06-30 19:20:36
九亿姐保住了老钢炮们!做头发女星被吓到了!

九亿姐保住了老钢炮们!做头发女星被吓到了!

八卦疯叔
2026-06-30 11:15:58
官宣!番禺沙溪全面清租,限商户7月10日前搬走!

官宣!番禺沙溪全面清租,限商户7月10日前搬走!

广州楼市发布
2026-06-30 21:58:55
特斯拉宣布 7 月份降价优惠,热门产品被取消!

特斯拉宣布 7 月份降价优惠,热门产品被取消!

XCiOS俱乐部
2026-06-30 19:37:58
世界杯淘汰赛预测:法国3-1瑞典,挪威2-1科特迪瓦,墨西哥1-1

世界杯淘汰赛预测:法国3-1瑞典,挪威2-1科特迪瓦,墨西哥1-1

慢歌轻步谣
2026-06-30 12:45:55
悲催!世界杯救国神话破灭,经济强国用3次冠军,换来崩盘的境地

悲催!世界杯救国神话破灭,经济强国用3次冠军,换来崩盘的境地

火山詩话
2026-06-30 06:28:15
Shams:詹姆斯加盟勇士只有一个条件,就是勇士交易引进浓眉

Shams:詹姆斯加盟勇士只有一个条件,就是勇士交易引进浓眉

懂球帝
2026-06-30 09:24:29
过期一天就绝对不能碰的10种危险食物,第一名多数人舍不得扔

过期一天就绝对不能碰的10种危险食物,第一名多数人舍不得扔

坠入二次元的海洋
2026-07-01 00:20:36
暖心一幕,加布里埃尔赛后安慰昔日阿森纳队友富安健洋

暖心一幕,加布里埃尔赛后安慰昔日阿森纳队友富安健洋

懂球帝
2026-06-30 13:08:10
苹果全球涨价:预付款消费者被要求“补差价”

苹果全球涨价:预付款消费者被要求“补差价”

红星资本局
2026-06-30 17:30:11
苹果干成年度爆款?山姆、盒马、线下商超全线断货,“国民平价水果”闷声发大财

苹果干成年度爆款?山姆、盒马、线下商超全线断货,“国民平价水果”闷声发大财

消费者报道
2026-06-29 22:59:56
卡西:既然引入了补水时间,足球不如改革成4节制,每节25分钟

卡西:既然引入了补水时间,足球不如改革成4节制,每节25分钟

懂球帝
2026-06-30 10:38:43
2026-07-01 01:36:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12156文章数 117113关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

德国足球,脸都不要了

娱乐要闻

黄晓明沦陷!羡慕周杰伦能降住昆凌

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

健康
时尚
旅游
游戏
数码

狂吃“糯叽叽”小心肠梗阻!

Meiinpsn的穿衣风格,清新又叛逆

旅游要闻

张园东区首开区亮相 详细版攻略来啦!

《龙信2》DLC公布新图!金发银貂美女等三大角色

数码要闻

REDMI K90至尊版发布:2999元起 风冷散热+骁龙8至尊版芯片

无障碍浏览 进入关怀版