一天2710亿Token,一个时代的交接。
2026年5月9日,一个来自Nous Research的开源Agent——Hermes(昵称"爱马仕"),以单日2710亿Token的调用量,首次超越OpenClaw(昵称"龙虾"),登顶OpenRouter全球应用Token消耗榜榜首。
这不是一次普通的排名更替。这是开源Agent从概念验证走向大规模落地的标志性事件,也是AI Agent赛道从"泡沫狂热"走向"真实竞争"的转折点。
围绕这场王座争夺战,我梳理了全网核心资讯,试图回答一个问题:爱马仕凭什么?龙虾输在哪?这场战争的终局又会是什么?
一、数据说话:爱马仕到底有多能打?
先看最直接的数据。
据OpenRouter 5月9日最新榜单,Hermes单日Token消耗量达到2710亿(271B),位列全球第一。第二名OpenClaw为2450亿Token,第三名Kilo Code为1490亿,第四名Claude Code为792亿。
累计数据更为惊人:Hermes自上线以来总Token消耗已超过6.37万亿,GitHub星标数14万,一个月内翻倍,Fork数21.8k。
这个数字意味着什么?
第一,有真实用户在高频调用。 Token消耗是实打实的银子堆出来的,没有真实需求支撑不了这个量级。
第二,应用正在承接复杂任务。 浅层问答消耗不了这么多Token,只有需要多轮交互、多次工具调用的复杂任务才会产生如此高的消耗。
第三,AI代码助手的边界正在被通用Agent侵蚀。 Hermes的Token消耗量已经超越了Claude Code、Kilo Code等专用编程工具,这意味着用户开始用通用Agent替代垂直工具。
而Hermes的调用模型分布也很有意思:排名前五的模型分别是小米MiMo-V2-Pro(第一)、MiniMax M2.7(第二)、英伟达Nemotron 3 Super(第三)、阶跃星辰Step 3.5 Flash(第四)、腾讯Hy3 preview(第五)。
中国模型占据四席,这可能是很多人没有想到的。
二、龙虾做错了什么?六位"养虾人"的集体控诉
Hermes登顶背后,是OpenClaw正在经历的集体退潮。
1月底,OpenClaw曾掀起全民排队安装、"养龙虾"的热潮,成为2026年第一个真正破圈的AI大事件。然而这股热潮正在迅速退去——OpenClaw的微信搜索热度已跌至高峰期的约3%,卸载潮随之而来。
36氪旗下"定焦"团队采访六位深度"养虾人",还原了龙虾从爆火到退潮的真实轨迹:
槽点一:Token消耗失控。 有用户表示,短短几天API费用就掏空了钱包,"月薪两万都扛不住Token的流水式消耗"。有用户一晚上跑了100多万Token,折合人民币约200元。
槽点二:安全漏洞。 OpenClaw被爆出零认证漏洞,大量用户实例直接暴露在公网。更严重的是,有用户让Agent整理聊天记录,结果本地核心文件被永久删除,回收站都找不到痕迹。
槽点三:记忆缺失。 每次重启、每次新对话,Agent都会"失忆"——忘记用户的工作习惯、历史任务、个人偏好。"像每天面对一个失忆的助手,完全达不到自主执行、持续优化的效果。"
槽点四:定时任务跑不通。 定时推送新闻早报、天气预报,从来没有稳定完成过一次。
槽点五:版本更新过于频繁。 有时甚至一天一版,每次更新完都要花大量时间排查和修复,稳定性很难保证。
槽点六:卸载流程极度繁琐。 不是简单拖进回收站就能完成,大量底层文件、配置残留需要手动清理,有用户专门付费299元请人卸载。
一位券商分析师总结得很到位:**"深度用不起,轻度用不上。"**
三、爱马仕做对了什么?"越用越聪明"是噱头还是实力?
与龙虾的退潮形成对比的,是Hermes的快速崛起。
与OpenClaw相比,Hermes的核心差异在于三个字:可成长性。
第一,持久记忆与精准回忆能力。 重启后能无缝衔接,记住用户的工作习惯、常用工作流、处理过的任务。这意味着它真正像一个"数字员工",而不是每次都要重新培训的临时工。
第二,自我学习机制。 每完成复杂任务后,会自动提炼方法生成Skill文件,下次同类任务直接复用路径。越用越顺手,不是噱头。
第三,开放生态。 阿里云、腾讯云、华为云均推出一键部署方案,DeepSeek、智谱GLM、Kimi等国内大模型均进入官方支持列表,飞书、钉钉、企业微信、微信均可一键对接。
用一位从龙虾迁移过来的用户的话说:Hermes会展示操作过程,告诉用户它打开了哪个网页、调了哪个工具,关键操作前还会授权请求,"感觉比较踏实";同样的任务,消耗的Token比龙虾少很多,"更经济实惠"。
四、Agent时代的基础设施挑战:为什么现有架构撑不住?
一个更值得关注的问题是:为什么无论是龙虾还是爱马仕,都还没有真正"稳"下来?
极客邦InfoQ的一篇深度文章指出,Agent应用带来了传统基础设施无法满足的三大挑战:
挑战一:高动态。 传统应用的执行逻辑是静态的,而Agent的逻辑由大模型动态生成——每次请求的处理过程可能完全不一样,事先无法预知需要多少资源。
挑战二:不安全。 Agent运行中需要执行大模型生成的代码或调用外部工具,这些都可能是安全风险,但传统容器隔离性低,存在容器逃逸风险。
挑战三:长会话。 Agent天然要求有状态,需要长时间运行。但一旦中途出现故障,由于Agent执行逻辑的非确定性,重新执行可能走入完全不同的分支,导致语义不一致的错误结果——比如帮你订了两张同一行程的机票。
OpenRouter榜单上2710亿Token的日消耗量,说明市场需求是真实的,但基础设施的成熟度,依然是制约Agent真正走向企业级大规模落地的关键瓶颈。
五、终局:王座易主,但战争才刚刚开始
Hermes登顶,不代表它已经赢了。
开源Agent要真正成为主流,还有几大关要过:稳定性、安全性、Token成本、生态协同。 2710亿Token的日消耗量说明使用量惊人,也意味着推理成本可能很高。Agent要成为基础工具,不能只会"猛烧Token",还得在任务成功率、成本、速度之间找到平衡。
而从更大的视角看,以Hermes、OpenClaw为代表的AI Agent正在重构软件行业。
过去SaaS靠流程、权限、数据和组织协作建立壁垒;未来Agent可能靠"懂你"和"会干活"建立壁垒。当工具具备了记忆、学习和主动执行的能力,软件的定义正在被改写。
Token消耗不等于产品成功,但它是一个值得关注的信号:AI Agent正在用真实用量,正面挑战AI代码助手和闭源产品。
王座易主,但战争才刚刚开始。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.