网易首页 > 网易号 > 正文 申请入驻

Python逆天改命!开源Hermes首次击败OpenAI Codex

0
分享至


新智元报道


【新智元导读】一个纯Python写的开源项目,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes直接上演工程暴力美学,解释型语言终于逆天改命。

一个纯Python写的开源项目,竟击溃了OpenAI王牌!

今天,全网都被Hermes Agent的硬核实力狠狠刷屏了:

在针对真实世界CLI任务的11项基准测试中,它以6:5的战绩,直接把Codex按在地上摩擦。


在这场备受瞩目的对决中,Hermes Agent展现出了惊人的底层优化能力。

通过一连串的硬核操作,成功把系统的启动时间,从701ms缩短至258ms。


更让人震撼的是,Hermes完全由Python编写,而Codex是用Rust写的。

这一仗,Python打赢了Rust!

这在编程界,属是「逆天改命」了。



三大狠招,砍掉63%启动时间

就在这次优化之前,Hermes还是5-6落后的那个。

这次逆转不是靠换模型、不是靠堆算力,而是靠三个纯工程优化,刀刀见血。


那么,它是具体如何做到的?

第一刀:Bitwarden磁盘缓存

原来Hermes每次启动都会调用Bitwarden Secrets Manager的API去拉取凭据,一次就是380毫秒。

问题在于,之前的缓存是「纯进程内」,连续执行两次hermes chat -q,第二次还是要重新拉。

解决方案是,加了一个L2磁盘缓存。

缓存文件权限锁死0600,存放在 /cache/bws_cache.json ,默认TTL 300秒。

另外,访问token本身绝不落盘,默认300秒TTL,过期才重新拉取。

一刀砍掉380ms。


第二刀:模型目录延迟加载

hermes_cli.models._PROVIDER_MODELS,一个包含所有AI供应商模型信息的巨型字典。

之前在模块加载时就急切导入,吃掉约55ms。

实际上只有model_flow相关的处理函数才需要它。

团队用PEP 562的模块级getattr实现了懒加载,只在真正访问模型目录时才付出这笔开销。。

这一步,又省了55毫秒。

第三刀:配置文件去重

main.py顶部原本读了两次config.yaml

一次yaml.safe_load用于密钥脱敏桥接,一次完整的load_config()(含深度合并)只为检查一个布尔值。

合并成一次原始加载,省下17ms。

这三刀加起来, 启动时间从701ms暴降至258ms,降幅63%。

不得不说,这才是真正的工程暴力美学,纯靠profiling找到瓶颈,一刀一刀切掉冗余。


战绩6:5,Hermes翻盘时刻

最终结果,是不会说谎的。

在优化前,Hermes对Codex的总战绩是5胜6负:单轮任务被Codex压制,多轮任务略有优势但不够明显。

优化后,局面彻底反转。

单轮任务(8项):Hermes的中位框架开销,降到了与Codex持平甚至略低的水平。

原本被Codex碾压的启动劣势,被完全抹平。

多轮任务(3项):Hermes在5轮对话的总开销上已经领先,优化后优势进一步拉大。


最后的总分,6:5,Hermes实现了反超。

这意味着,一个用Python写的开源项目,在框架开销——

一个最考验底层功力的维度,击败了用Rust写的、背后站着万亿市值公司的闭源产品。


Python,打赢了Rust

真正反直觉的部分在于,Python凭什么赢下Rust?

长期以来,Python在性能圈几乎是「原罪」般的存在:解释型语言、GIL锁、动态类型开销……

当OpenAI选择用Rust构建Codex CLI时,所有人都觉得理所当然——

Rust生来,就是为性能而生的。


但Hermes的这次逆袭说明了一个关键事实:

在Agent这个赛道上,框架层面的架构决策,比语言层面的原始速度更重要。

开发者netrunner的评论一针见血,「Python在多轮任务上打赢Rust,本质上是架构决策的胜利,而不是语言速度的胜利」。

「Codex可能在上下文处理上,过度工程化了」。


还有人问道,「为何不把Hermes也迁移到Rust?那不是更快」?

Hermes联创兼首席科学家Teknium直言,「那样就无法编辑代码,以及实时改进和迭代」

也就是说,Python的优势不在于快,而在于活。


对于一个需要持续进化、从每次交互中学习的Agent来说,开发者友好性和迭代速度,就是最大的性能优势。

GitHub冲爆16.7万星

硬刚万亿巨头

Hermes Agent的爆发速度,本身就是一组让人瞠目的数据。

从2026年2月25日上线至今,仅仅三个月,GitHub星标已经突破16万。

日活Token消耗量达到353B,是同类项目OpenClaw的近两倍。

可以说,它是2026年增长最快的开源Agent框架,没有之一。


GitHub地址:https://github.com/nousresearch/hermes-agent

Hermes的核心杀手锏,是一套闭环学习架构:

每次完成复杂任务后,Agent会自动将解决方案提炼为可复用的Skill(技能)。

下次遇到类似任务,直接调用已有技能,跳过从头推理。

NousResearch内部基准测试显示,积累20个以上自创技能的Hermes实例,完成同类任务的速度比全新实例快40%。


更狠的是,v0.12版本引入的自治Curator——

一个后台自动运行的Agent,会定期评分、修剪、合并你的技能库。

换句话说,Hermes不仅能学,还能自己整理学到的东西。

语言不是天花板,架构才是

Python打赢Rust这件事,看起来是一个编程语言之间的「逆袭爽剧」。

但它真正揭示的东西,要深刻得多。

在AI Agent的世界里,底层语言的性能差异正在变得越来越不重要。

Hermes这次优化砍掉的443毫秒,已经是框架层能挤出的极限了。而一次LLM调用的延迟,动辄几百毫秒甚至数秒。

这意味着,在通往ASI的路上,真正的竞争从来不是「用什么语言写」,而是「怎么让Agent越用越聪明」。

而Hermes这次用Python干翻Rust,恰恰证明了——

在Agent进化的赛道上,开放、可编辑、可迭代的架构,比「跑得快」更接近ASI的本质。

Rust是一把好刀,但ASI需要的不是一把更快的刀。

参考资料:

https://x.com/Teknium/status/2058885472513065471?s=20

https://github.com/NousResearch/hermes-agent/pull/31968

编辑:桃子 David

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友将问界新车路测画面发给国家反诈中心,被认定为AI生成

网友将问界新车路测画面发给国家反诈中心,被认定为AI生成

西虹市闲话
2026-05-26 16:43:17
“B类留神峪”矿工们的逃生与等待

“B类留神峪”矿工们的逃生与等待

澎湃新闻
2026-05-26 19:48:27
连丢三盘出局,张之臻遭遇法网一轮游!中国选手仅3人突破首轮

连丢三盘出局,张之臻遭遇法网一轮游!中国选手仅3人突破首轮

全景体育V
2026-05-26 21:27:32
华为半导体业务部总裁何庭波:“数万人历经七年辛苦,铸成‘莫邪干将’剑”

华为半导体业务部总裁何庭波:“数万人历经七年辛苦,铸成‘莫邪干将’剑”

澎湃新闻
2026-05-26 17:34:23
洛夫顿赛后伤情动态!没穿上衣,肩膀不敢动,本人承诺为G2做准备

洛夫顿赛后伤情动态!没穿上衣,肩膀不敢动,本人承诺为G2做准备

篮球资讯达人
2026-05-27 01:15:29
见了死不救,还要倒打一耙——蓝天救援队的通报打了谁的脸?

见了死不救,还要倒打一耙——蓝天救援队的通报打了谁的脸?

土家铁拳
2026-05-26 20:48:35
这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

天马幸福的人生
2026-05-26 11:05:02
女子多次告知自己花生严重过敏 餐厅仍在菜中加入花生油 致女子出现严重过敏反应进抢救室 女子要求赔偿1000元被质疑“敲诈勒索”

女子多次告知自己花生严重过敏 餐厅仍在菜中加入花生油 致女子出现严重过敏反应进抢救室 女子要求赔偿1000元被质疑“敲诈勒索”

闪电新闻
2026-05-26 18:43:15
强制出境!美赶人“新规”,百万华人一旦回国,十年都没法再入境

强制出境!美赶人“新规”,百万华人一旦回国,十年都没法再入境

共工之锚
2026-05-26 15:05:21
“想停火?先签协议” 特朗普打起新算盘

“想停火?先签协议” 特朗普打起新算盘

上游新闻
2026-05-26 14:19:02
湖北大娘硬讹收割机后续!警方介入,当地人再曝恶行,根本不敢惹

湖北大娘硬讹收割机后续!警方介入,当地人再曝恶行,根本不敢惹

另子维爱读史
2026-05-26 19:27:40
45辆新车在境外离奇消失!45笔零首付车贷,拖垮数十名普通人

45辆新车在境外离奇消失!45笔零首付车贷,拖垮数十名普通人

方圆
2026-05-25 14:50:41
黄仁勋陪父母普通小店吃饭,曾回忆:我的英文是不懂英语的母亲用字典教的

黄仁勋陪父母普通小店吃饭,曾回忆:我的英文是不懂英语的母亲用字典教的

爆角追踪
2026-05-26 09:37:26
乌克兰每日消耗1万架无人机,俄军90%伤亡来自无人机!

乌克兰每日消耗1万架无人机,俄军90%伤亡来自无人机!

三言四拍
2026-05-26 12:40:30
市场疯传的报告,AI算力机会重大转移!

市场疯传的报告,AI算力机会重大转移!

君临财富
2026-05-26 00:28:31
武汉28岁孕妇失联后续:时隔10天,首位目击人发声,丈夫行为反常

武汉28岁孕妇失联后续:时隔10天,首位目击人发声,丈夫行为反常

李晚书
2026-05-26 12:04:16
山西沁源矿难背后:沦为空文的141项煤矿安全标准,与“通风报信”式检查

山西沁源矿难背后:沦为空文的141项煤矿安全标准,与“通风报信”式检查

大风新闻
2026-05-26 17:48:27
2026一季度财政自给率:浙江96%领跑,10多个省不足50%

2026一季度财政自给率:浙江96%领跑,10多个省不足50%

风向观察
2026-05-26 11:27:00
割四赔五上热搜,当地书记都无可奈何,只能自掏腰包进行补偿

割四赔五上热搜,当地书记都无可奈何,只能自掏腰包进行补偿

映射生活的身影
2026-05-26 15:56:12
舅舅入狱前买了1200股茅台,19年后出狱去兑现,前台瞬间懵了,只能叫来经理,经理愣住:这现在市值差不多260多万!

舅舅入狱前买了1200股茅台,19年后出狱去兑现,前台瞬间懵了,只能叫来经理,经理愣住:这现在市值差不多260多万!

大爱三湘
2026-05-26 21:34:40
2026-05-27 06:08:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15313文章数 66891关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

以色列:初步评估显示哈马斯新任军事领导人被打死

头条要闻

以色列:初步评估显示哈马斯新任军事领导人被打死

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

本地
数码
健康
艺术
公开课

本地新闻

用云锦的方式,打开江苏南京

数码要闻

CPU缺货涨价持续!国产芯片借势突破高端壁垒

外泌体抗衰,什么时候能用上?

艺术要闻

笑不活了!500 年前倭寇 “光屁股作战”!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版