网易首页 > 网易号 > 正文 申请入驻

B站爆了!Hermes首度直播回应「抄袭」,MiniMax提前杀入Harness赛点

0
分享至


新智元报道

编辑:好困 犀牛

【新智元导读】跑分最高未必能赢,但最懂Harness的可以。如今,被Hermes、OpenClaw等全球爆火开源Agent项目「钦定」为默认的MiniMax,在OpenRouter上的日均Token消耗已飙到3000亿。

昨晚B站,一个老外用四个字炸了弹幕区。

不熟,勿Cue。


说这话的人是Tommy Eastman,全球最火开源Agent项目Hermes Agent的业务负责人。

首次来中国就被弹幕逼问「你们是不是抄了EvoMap」。

他的回应原话是这样的:

Hermes Agent的代码仓库已经存在一年多了。直到那些推文出现,我才听说Evo Map。

Nous Research有长期产出前沿研究的记录,我们是理念驱动的团队,除了推动开源AI,不会做任何其他事情。

当然,也不会去抄别人的仓库然后据为己有。


和Tommy同框的,是MiniMax Agent首席架构师阿岛和研发工程师择因。

争议三分钟就翻篇了,但接下来两个多小时的技术对谈,触及了一个被忽视已久的问题。

当模型能力趋于收敛,AI的下一个竞争维度在哪里?

人类成了瓶颈

现在,阿岛的工作方式已经变了。

去年九十月份,他已经不怎么打开IDE了。日常工作状态是同时并发五六个本地Agent,云端可能还有十个在沙箱里跑。

然后我发现,人类成了瓶颈。

过去几年,AI行业习惯了谁的模型参数更多、跑分更高的叙事。

但2026年初,OpenClaw一夜爆火,连老黄都在摩根士丹利的论坛上感叹这可能是有史以来最重要的软件。

所有人突然意识到,模型再强,不会用工具、不能真正干活,就只是一个聊天机器人。


一夜之间,行业焦点转向了Harness。

Harness是Agent的运行框架,包括工具调用编排、记忆管理、Skills系统、沙箱环境等等。

在那篇全网疯转的博客「Harness Engineering」中,OpenAI给出了一个清晰的定义—人类掌舵,智能体执行。



对此,阿岛用高达做了个比喻。

模型是引擎,Harness就是那副机甲。但光有引擎造不出高达,还得有完整的外骨骼才能让引擎能力最大化。

Claude Code过去两个月的更新都在龙虾化。cron定时、连接IM、远程控制、memory文件夹……我1月初注意到OpenClaw时惊为天人,当时团队还不认同。后来证明方向是对的。

行业在收敛到同一个方向上。

而阿岛自己的感受比这更深一层。

我觉得我就是在被AI蒸馏。工程师构建Harness的过程,就是把自己的工作方式蒸馏成Skill和代码。

随后他补充道,「当然,这一切的目的是让人类去做真正热爱的事情。就像过去发明蒸汽机、发明电力一样。」

MiniMax在这波浪潮中动作密集。短短几周做了三件事,发布业界首个参与自我迭代的模型M2.7,推出全球首个云端沙箱MaxHermes,上线基于OpenClaw架构的云端AI助手MaxClaw。

三者构成了一个闭环。

M2.7从模型层为Harness持续优化底层能力,MaxHermes和MaxClaw从产品层验证真实场景需求,再反馈回模型训练。

MiniMax管这叫「Model + Harness」双向飞轮。

Model × Harness

不卷跑分,卷Token

竞争的维度正在发生根本性转变。过去比的是模型有多聪明,现在比的是同等Token能产出多少价值。

MiniMax的解法,是让模型专门为Harness而生。

M2.7是3月18日发布的最新编程模型,也是第一个在训练过程中深度参与迭代自己的商用大模型。

MiniMax构建了一套内部Agent Harness,让M2.7作为Agent在其中运行,包含短时记忆、自反馈、自优化三个核心模块。

这套自我进化体现在三个层次。

1. 模型能基于Harness完成任务,在MiniMax的强化学习团队已承担30%-50%的日常工作流。

2. 模型能主动迭代Harness本身,自主运行优化循环超过100轮,评测效果提升30%。

3. 模型还有能力迭代机器学习模型本身的效果,在MLE Lite的22道高难度竞赛中取得9金5银1铜,得牌率66.6%,仅次于Opus-4.6和GPT-5.4。

M2.7的核心优化方向始终瞄准Agent场景,工具调用准确度、复杂Skills遵循、Agent Harness适配。

在40个复杂Skills(每个超过2000 Token)的测试中,M2.7仍能保持97%的Skills遵循率。


而最先认可这套能力的,是海外开源圈。

从M2.1开始,Hermes的联合创始人Teknium就在X上多次公开肯定MiniMax模型在工具调用、响应速度与性价比上的表现。

M2.5、M2.7每次发布,Hermes Agent都第一时间接入。而且合作还在层层深入。

如今,MiniMax模型已经是Hermes Agent中使用量最高的模型之一。

Hermes Agent整体日均Token消耗已从20亿飙升至近3000亿,M2.7在Open Router上日均消耗超过250亿Token,占据显著份额。


无独有偶,OpenClaw创始人Peter,也曾连发五条推文公开称赞MiniMax是最好的开源模型。

他表示,M2.1能以其他模型5%的成本运行OpenClaw,效果完全不输顶尖闭源模型。


Notion联合创始人Akshay Kothari则亲自宣布,MiniMax M2.5成为Notion Custom Agents中第一个开源权重模型。


被称为「Cursor最强对手」的AI编程工具Kilo Code,也高调宣布MiniMax是默认首选模型。


Tommy在直播中给了一个判断,「中国在开源模型方面已经领先了。开源和闭源之间从未有过如此接近的差距。」

在这背后,是一套相互反哺的协作模式。

Hermes社区贡献了自进化Agent的架构设计和产品理念,MiniMax贡献了让这套架构真正运转的模型能力和工程基础设施。

Hermes的架构创新为MiniMax的模型优化指明方向,优先级给了工具调用、Skills执行、长上下文一致性这些Agent核心痛点。MiniMax的模型能力提升又拓宽了Hermes架构所能达到的效果边界。

海外头部开源项目选MiniMax做默认模型,说明一件事。

模型跑分最高未必能赢,模型最懂Harness才能赢。

养虾养马,越养越聪明

模型和Harness的闭环要真正转起来,还需要产品层的验证和反馈。

为此,MiniMax同时推了MaxHermes和MaxClaw两条线,分别对应两种Agent进化路径。

MaxHermes基于开源智能体Hermes Agent构建,核心特性是「学习闭环」


每完成一项复杂任务,Agent自动从中提炼出可复用的Skills,保存为独立文档,下次按需加载并根据反馈持续改进。

加上持久化的跨会话记忆、自然语言定义的定时任务、多个子代理并行运行机制,它是一个能长期运行、持续进化的AI智能体。

在Skills层面,OpenClaw的依赖人工预设与引导,能力在部署那一刻就已固定。

相比之下,MaxHermes的Skills由Agent自主生成、自主迭代,像一个会举一反三的员工。


MaxClaw则是基于OpenClaw架构的云端AI助手,解决的痛点更具体,本地部署门槛高、稳定性不够。上线120小时紧急完成四次扩容,修复了飞书消息无响应等IM问题和进程退出后无法自动恢复等稳定性问题。

功能方面,MaxClaw预置精选专家级Skill,用户获得50G云存储空间。

对原有的图片理解、视频理解、网页提取等Skill做了系统性升级,新增图片生成、视频生成等内置工具,全部不产生额外API费用。

安全方面预置「安全诊断Skill」,能自主诊断修复报错。支持同时部署多个龙虾,移动端(iOS和安卓)已全球上线。

为了方便大家获取和使用,MiniMax还上线了Skillhub,精选上百种Skills供探索安装。最近一次更新他们直接把语音模型和音乐模型也接入了OpenClaw生态,小龙虾能说话、能唱歌。


在平台层面,MiniMax Agent则推出了Expert 2.0。用户用自然语言描述任务目标,Agent自动完成SOP梳理和能力配置,不需要懂Skill、SubAgent、MCP这些概念。上线以来已有1.6万+专家Agent被创建和使用。

值得一提的是,MiniMax自己也在吃自己的狗粮。

据阿岛透露,公司内部有一个数字员工,拥有独立的GitHub账号,每天自动扫描开源项目,发现能用到MiniMax模型的就自己去提PR。

用Agent来推广Agent背后的模型,而海外开源社区的反馈证明,这招确实管用。

这些产品每天产生的真实场景需求,又反过来驱动M2.7在工具调用、Skills遵循等维度上的持续优化。飞轮就是这么转起来的。

但光有模型和产品的互补还不够。要让这套闭环在云端大规模跑起来,还卡在一个更底层的环节。

最容易卡住的就是沙箱

Agent在云端大规模运行,模型推理只是第一步。更难的是给每个Agent一个安全、隔离、可弹性伸缩的执行环境。

在阿岛看来,「最有可能卡住的就是沙箱环节。如果迭代速度慢了,竞争力就会受到影响。」

其中底层Infra(身份认证、支付、沙箱等)创业公司很难做,需要和大厂深度合作。就像移动互联网时代,支付基础设施最终由微信和支付宝解决。

MiniMax的做法,是训练侧和部署侧分别找了两家头部云厂商。

训练侧,MiniMax与腾讯云深度合作,基于腾讯云Agent Runtime沙箱搭建Forge强化学习框架的基础设施。

Forge进行大规模强化学习训练时,需要模拟海量并发交互环境,让Agent在真实、可交互的执行环境中探索和试错。腾讯云提供80ms极速启动、每分钟60万沙箱实例、成功率99.99%的并发能力,支撑M2.7的自主进化训练。

部署侧,MaxClaw和MaxHermes的云端架构基于阿里云ACK/ACS构建。

MiniMax采用控制平面与执行平面分离的模式,阿里云ACK承载统一控制面,ACS Agent Sandbox提供20-40ms极速实例供给,支持每分钟15000个沙箱的弹性扩缩,任务按需创建、结束自动释放。

腾讯云负责训练,阿里云负责部署。

两大云厂商同时首选MiniMax作为核心合作伙伴,本身就是对其技术实力和Agent产品规模的双重背书。

Token的含金量变了

过去几年大家在比参数、比上下文、比跑分。现在比的是另一件事,同等Token能产出多少价值。

MiniMax CEO闫俊杰在3月的业绩电话会上提了一个公式——

AI平台价值 = 智能密度 × Token吞吐量。

MiniMax的解未必是唯一答案,但它踩中了一个正在被验证的逻辑,模型为Harness而生,Harness反哺模型进化。

当两家头部云厂商同时为它修路、四个海外头部开源项目同时选它做默认模型的时候,这个逻辑至少在当下是跑通了的。

接下来的问题只剩一个,M3什么时候来。

对此,MiniMax已经透露了几个关键方向:

  • 更大更智能,尤其在coding和通用办公场景;

  • 原生多模态,支持视频和图像输入;

  • 价格亲民,目标让每个人都负担得起7×24小时的Agent。

总之,时间不会太远了。

参考资料:

https://www.bilibili.com/video/BV155djB5ETY

https://www.minimaxi.com/news/minimax-m27-zh

https://agent.minimax.io/max-claw

https://agent.minimax.io/

https://github.com/nousresearch/hermes-agent

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国70岁男子将特斯拉开进湖中被逮捕,称为了测试“涉水模式”,该车售价8万美元以上;特斯拉:车辆因进水造成的任何损坏,不保修

美国70岁男子将特斯拉开进湖中被逮捕,称为了测试“涉水模式”,该车售价8万美元以上;特斯拉:车辆因进水造成的任何损坏,不保修

大风新闻
2026-05-20 19:13:23
本轮过程已有121个国家站破月降水量极值,专家分析极端降水成因

本轮过程已有121个国家站破月降水量极值,专家分析极端降水成因

澎湃新闻
2026-05-21 21:40:30
ARM涨幅扩大至10.15%

ARM涨幅扩大至10.15%

每日经济新闻
2026-05-21 22:02:05
体育总局出手!3大措施严打体坛乱象,这下樊振东不用再担心了

体育总局出手!3大措施严打体坛乱象,这下樊振东不用再担心了

画夕
2026-05-22 03:14:24
英超还差一步获欧冠6席,维拉必须送瓜帅胜利告别

英超还差一步获欧冠6席,维拉必须送瓜帅胜利告别

体坛周报
2026-05-21 09:01:53
掀桌狂怼马英九!郑丽文向国民党大佬宣战:败光家底别添乱

掀桌狂怼马英九!郑丽文向国民党大佬宣战:败光家底别添乱

阿离家居
2026-05-21 12:45:43
你敢卖,我敢接!火箭有意总冠军控卫?34岁场均24+4,胜过范乔丹

你敢卖,我敢接!火箭有意总冠军控卫?34岁场均24+4,胜过范乔丹

熊哥爱篮球
2026-05-21 20:48:57
杜海涛发视频为沈梦辰庆生看到视频让人笑趴了 沈梦辰却笑不出来

杜海涛发视频为沈梦辰庆生看到视频让人笑趴了 沈梦辰却笑不出来

胖松松与瘦二毛
2026-05-21 15:45:09
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
贵州贵定突发洪水,90后非遗传承人店铺受损严重,面对镜头哽咽:三年心血一晚上没了

贵州贵定突发洪水,90后非遗传承人店铺受损严重,面对镜头哽咽:三年心血一晚上没了

潇湘晨报
2026-05-21 09:42:30
如何看待2025年上海新出生人口仅有10.7万,评论区吵翻天…

如何看待2025年上海新出生人口仅有10.7万,评论区吵翻天…

慧翔百科
2026-05-21 08:29:04
镁是保护心脏、防痴呆的必需元素!提醒:常吃4类食物就能补!

镁是保护心脏、防痴呆的必需元素!提醒:常吃4类食物就能补!

39健康网
2026-05-20 09:30:56
不是王浩然贺希宁!深圳赢球真因找到!赛后评分:4人满分1人战神

不是王浩然贺希宁!深圳赢球真因找到!赛后评分:4人满分1人战神

老吴说体育
2026-05-22 00:12:39
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
全世界会发现,伊朗战争打完后,世界只剩下一个超级大国了

全世界会发现,伊朗战争打完后,世界只剩下一个超级大国了

流年顛簸
2026-05-21 21:06:31
已成功瘦了 32 斤,我发现减肥最抗饿的三餐搭配是:高蛋白低脂

已成功瘦了 32 斤,我发现减肥最抗饿的三餐搭配是:高蛋白低脂

健身狂人
2026-05-15 09:41:25
伊朗最高领袖下令:接近武器级的铀必须留在国内

伊朗最高领袖下令:接近武器级的铀必须留在国内

每日经济新闻
2026-05-21 22:27:08
深夜,国际油价大跳水!霍尔木兹传来大消息:26艘船已通过!特朗普:在伊朗问题上,内塔尼亚胡“听我的”

深夜,国际油价大跳水!霍尔木兹传来大消息:26艘船已通过!特朗普:在伊朗问题上,内塔尼亚胡“听我的”

每日经济新闻
2026-05-21 01:12:04
俄乌转折:乌军进攻次数首次超过俄军!摧毁车臣特种部队基地

俄乌转折:乌军进攻次数首次超过俄军!摧毁车臣特种部队基地

项鹏飞
2026-05-21 20:03:57
泰国取消60天免签,最倒霉的是印度人

泰国取消60天免签,最倒霉的是印度人

观察者网
2026-05-21 14:21:06
2026-05-22 04:56:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15270文章数 66878关注度
往期回顾 全部

科技要闻

小米YU7 GT正式发布:售价38.99万元

头条要闻

女子高空跳伞遇难 原计划今年订婚

头条要闻

女子高空跳伞遇难 原计划今年订婚

体育要闻

常住人口7000的小镇,拥有了一支德甲球队

娱乐要闻

反转!金秀贤与金赛纶未成年时交往不实

财经要闻

潮水退去,裸泳的一定不止五粮液

汽车要闻

雷军:YU7首战Model Y八败两胜 输给全球销冠不丢人

态度原创

教育
亲子
房产
公开课
军事航空

教育要闻

高考地理|气候详解

亲子要闻

婴幼儿湿巾检出“锑”,为什么说不清是否安全?

房产要闻

顺德澐璟楼王『澐冠』启幕|一场高阶共鸣的静奢美学之约

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗警告:任何新袭击将促使战场扩大到中东以外

无障碍浏览 进入关怀版