这周我发了两篇夸Hermes Agent的文章。这篇不一样。
前两篇没写错——Hermes的自我导向技能习得确实强,记忆系统的复利效应也是真的。但自改进循环在第一天就打开,太危险了。三周前我在一台新VPS上无视了自己的规矩,第14天,11个自动生成的技能已经在三个生产工作流里悄悄拖垮了输出质量。我花了一整晚回滚到干净状态,手工审计每个技能文件。那个晚上就是这篇文章存在的原因。
![]()
这是份反常识的Hermes Agent配置指南。核心观点很简单:前14天关掉auto_create和auto_refine,观察它在真实负载下的实际行为,有意手写第一代技能,搭好日后需要的回滚基础设施,然后再有意识地开启自改进。复利效应照样发生,只是复利的方向对准你的实际工作流,而不是Agent对第一周各种混乱试探的误解。
默认配置是个坑
Hermes Agent出厂默认开启自改进。这对演示环境、低风险的私人助手或概念验证是对的。但对接触客户数据、部署代码、或涉及财务后果的生产负载,这是错的。
默认配置假设Agent能快速学会"好"的标准。它确实会学到东西——但第一周它观察到的是你的上手混乱、探索性提示、那些最终会被丢弃的工作流实验。它把这一切全编码成了技能。
默认配置里没有单个开关能干净地关闭自改进,得显式设置。这是我每次新部署Hermes时的"训练轮"起点:
agent:
skills:
auto_create: false # 完全禁用自主技能创建
auto_refine: false # 禁用自主技能优化
memory_enabled: true # 记忆保持开启,要观察数据,只是不自动行动
external_dirs:
- path: "/home/hermes/skills/hand-authored"
mode: "read-only" # 手写技能,Agent可用但不可改
- path: "/home/hermes/skills/pinned"
mode: "read-only"
managed_dir: "/home/hermes/skills/managed"
managed_dir_writable: false # 自动技能目录存在,但暂不写入
记忆系统继续记录观察日志,为日后启用自改进积累数据。但Agent不能基于这些观察自动创建或修改技能——这是关键区别。
手写技能是强制性的设计练习
前14天强制手写技能很痛苦,但痛苦是有价值的。它迫使你明确回答:这个工作流的核心决策点是什么?哪些上下文必须保留?什么构成成功,什么构成失败?
我现在的习惯是:每个手写技能文件顶部写三行注释——触发条件、成功标准、已知陷阱。这14天后,当我开启auto_refine时,Agent有明确的基准来判断"改进"是否真的是改进。
没有这步,Agent会把"输出更快"当成改进,即使代价是跳过验证步骤。它会优化你无意中展示的坏模式,因为你还没想清楚好模式是什么。
回滚基础设施必须在需要前就位
我那晚的教训:等出了问题再想办法回滚,成本是指数级的。现在我的部署清单包括:
1. 技能目录版本控制:/home/hermes/skills/是Git仓库,每次Agent写入触发提交,提交信息带时间戳和触发操作
2. 观察日志的只读镜像:原始观察流写入WORM(一次写入多次读取)存储,Agent的"理解"只是可丢弃的派生视图
3. 技能影响测试套件:每个手写技能配一组输入/预期输出,Agent自动优化后必须通过这些测试才能替换原文件
这些不是"最佳实践"的废话。第14天我开启自改进时,这三样东西让我能安全地观察Agent的优化尝试,拒绝有害的,接受有益的,全程保持对生产环境的控制。
第15天开启自改进,但要有护栏
14天后,我分阶段开启:
第15-21天:只开auto_refine,限定在手写技能目录,每次优化必须人工批准
第22-30天:开启auto_create,但新技能默认进入隔离目录,观察一周再决定是否提升为生产可用
30天后:全功能自改进,但保留版本控制和影响测试作为硬性约束
这个节奏让复利效应真正发挥作用——Agent在你有明确标准、有回滚能力、有审计追踪的前提下学习。它学的是你稳定后的工作流,不是第一周的混乱。
不是反对自改进,是反对无意识的自改进
我前两篇文章夸的Hermes能力,在这14天约束后依然存在,甚至更强。因为Agent不再把时间浪费在编码我的临时探索上,它优化的是我已经验证有效的模式。
默认配置的问题是它假设所有用户都准备好了。现实是,大多数生产部署的第一周充满不确定。让Agent在这个时期无限制地学习,等于让它学习噪音。
关掉自改进14天不是保守,是务实。你仍然获得记忆系统的复利,只是复利的方向由你控制。等到第15天,你有了手写技能作为基线,有了回滚基础设施作为保险,有了对工作流的清晰理解作为标准——这时候让Agent自我优化,它优化的是对的东西。
我的那11个问题技能,现在变成了一份检查清单。每次新部署Hermes,前14天的"训练轮"配置是强制步骤。这个习惯让我省下的回滚夜晚,已经远超过当初花在手写技能上的时间。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.