网易首页 > 网易号 > 正文 申请入驻

全新Hermes Agent:智能协作与技能升级,引领目标驱动时代!

0
分享至

为什么这次更新值得认真看

过去一年,大多数 AI Agent 产品都在做同一件事:让单轮对话变得更快、更聪明。换句话说,它们本质上还是"回答问题"的工具——你问,它答,答完就结束。

但这个模式的瓶颈已经很明显了。



一个真实的办公场景是这样的:你想让 AI 帮你整理这周的产品反馈,提炼出三个核心问题,然后分别发给对应的负责人,最后跟踪每个人的处理进度。这个任务天然是多步骤、跨时间、需要上下文追踪的。用单轮 Agent 来做,要么上下文爆炸,要么中途断层,每一步都得从头解释背景。

行业里管这个叫 Agent 任务的持久化问题。谁能解决好这个,谁就能把 AI Agent 从"高级搜索"变成真正的"数字同事"。

Hermes 这次更新的核心逻辑,就是往这个方向走。

02 Goal:从"问一句答一句"到"盯准目标干活" 2.1 Goal 是什么

简单说,Goal 就是给 Agent 设定一个长期目标,然后让 Agent 自己拆解、规划、执行。

不再是:

用户:"帮我写一份市场报告" → Agent:"好的,这是报告" → 结束

而是:

用户:"这季度我们的目标是用户留存率提升 15%,帮我制定一个行动方案" → Agent 理解目标 → 拆解成多个子任务 → 持续推进 → 过程中根据反馈调整

这个区别非常关键。前者是"响应式",后者是"目标驱动式"。

2.2 为什么重要

目标驱动的价值在于上下文的一致性和任务的连贯性

当一个 Agent 知道最终目标是什么,它就能:

  • 在执行过程中自主判断哪些信息有用、哪些可以忽略
  • 当某个子任务失败时,能够回滚并尝试替代方案,而不是直接卡住
  • 在多轮对话中保持方向感,不会因为用户的临时提问就跑偏

这其实模拟的是人类"项目经理"的思维模式——不是执行单一指令,而是盯着一个目标,协调资源、调整路径、达成结果。

2.3 背后的技术逻辑

Goal 机制通常依赖子任务拆解(Task Decomposition)+ 自我反思(Self-Reflection) 两个能力。

子任务拆解:将大目标分解为可执行的小任务,比如"提升留存率"可以拆成"分析流失原因 → 设计激活策略 → 上线 A/B 测试 → 收集数据反馈"。

自我反思:每个子任务完成后,Agent 会评估结果是否符合预期,如果不符合就调整下一步计划。这个机制通常通过"检查点"(Checkpoint)来实现,即在关键节点停下来审视当前状态。

这和传统单轮问答的本质区别在于:单轮是"触发-响应",目标驱动是"触发-规划-执行-反思-调整"

03 Kanban:给 Agent 造一个持久化的工单系统

如果说 Goal 解决了"方向"的问题,Kanban 就是解决"执行力"的问题

这是我认为这次更新里最值得深入研究的功能。

3.1 传统 Agent 的"任务丢失"问题

用过 AI Agent 的人大概都遇到过这个场景:你让 Agent 做一个多步骤任务,做到第二步的时候,你想去确认第一步的结果,发现 Agent 已经丢失了第一步的上下文。你不得不重新描述背景,效率大打折扣。

这是一个非常实际的问题:Agent 没有持久化的工作记忆

每次新的对话,Agent 都从零开始。它不记得上次做了什么,不记得哪个任务卡住了,不记得已经尝试过的方案有哪些。

Kanban 要解决的就是这个。

3.2 Kanban 的设计思路

Hermes 的 Kanban 本质上是一个持久化的 Agent 工单系统。每个任务(Task)都作为一个独立的工单存在,有自己的状态、负责人、运行记录和上下文。

它的核心特性包括:

任务分配:任务可以分配给具体的 Hermes Profile 或者 Worker。这意味着你可以让"数据分析 Agent"负责数据处理任务,让"写作 Agent"负责文案任务,各司其职。

依赖关系:任务之间可以设置依赖。比如"整理数据"必须先完成,"分析数据"才能开始。这解决了多步骤任务的执行顺序问题。

运行记录和日志:每次任务执行都会留下日志,包括运行的模型、生成的输出、耗时等。你随时可以回溯"这个结论是怎么得出来的"。

上下文追踪:任务运行时保留完整的上下文,即使中断了,重新拾起时也能无缝衔接,不会丢失之前的进度。

3.3 实际场景举例

一个典型的使用场景:

你是一个产品经理,想让 AI 帮你梳理本月的用户反馈。 任务 A:收集反馈数据(分配给"数据 Worker")任务 B:情绪分析(分配给"分析 Worker",依赖任务 A 完成)任务 C:生成报告(分配给"写作 Worker",依赖任务 B 完成)

你不需要每次都从头描述背景,Kanban 会帮你追踪每一步的状态和结果。如果某一步出错了,你直接定位到那个工单,看日志,定位问题,然后重新执行或调整。

这已经非常接近一个多 Agent 协作的工作流了。

3.4 对比传统单 Agent 方案

特性

单轮 Agent

Hermes Kanban

任务持久化

❌ 每次新建对话丢失

✅ 工单化,跨会话保留

任务分配

❌ 无法分配,只能单一 Agent

✅ 可分配给不同 Worker

依赖管理

❌ 无法设置执行顺序

✅ 支持任务依赖链

运行日志

❌ 无记录

✅ 完整日志追踪

并行执行

❌ 只能串行

✅ 支持并行任务分发

04 Skills:让技能库保持健康

这个功能看起来没有前两个那么"重",但实际上对日常使用体验影响非常大。

4.1 问题是"技能膨胀"

当你的 Agent 积累了大量的 Skills(技能),时间一长就会出现一个问题:有用的技能被淹没在噪音里

你可能真正每天在用的就那么五六个,但 Skills 列表里有三四十个,找起来费劲,每次加载还吃上下文。

传统的解决方案是手动整理——归档、删除、重新分类。但这个工作枯燥且容易遗忘。

4.2 Hermes 的自动整理逻辑

Hermes 的 Skills 管理引入了一个使用频率驱动的自动整理机制

  • 高频 Skills:保持在主列表,优先展示,随时可用
  • 低频 Skills:自动被归到"归档"或"收起"区域,减少主界面的噪音
  • 新的 Skills:加入时有观察期,不会一上来就占主空间

这个逻辑很简单,就是让工具去适应人的使用习惯,而不是让人去适应工具的组织方式

4.3 对 Agent 性能的实际影响

这里有一个很多人忽略的细节:上下文长度是有限制的

如果你的 Skills 列表很长,每次启动 Agent 都要加载一遍,消耗大量的上下文空间,实际可用于处理任务的有效长度就变短了。

Skills 自动整理本质上是帮 Agent 做了一次上下文减肥,把不常用的东西移出去,保证真正重要的 Skills 和对话内容有足够的空间。

这不只是用户体验的优化,也是性能优化。

05 这三个方向意味着什么 5.1 AI Agent 的发展趋势

从 Hermes 这次更新,可以清晰地看到 2026 年 AI Agent 领域的三个主流方向:

方向一:从工具到助手
单轮回答是工具,能长期跟随目标行动才是助手。Goal 机制代表了从"你说我做"到"你定目标我做规划"的转变。

方向二:从单 Agent 到多 Agent 协作
Kanban 的任务分配和依赖管理,说明 Hermes 正在往多 Agent 协作的方向走。不同的 Agent 负责不同的专业领域,通过工单系统协调,这比一个万能 Agent 什么都会要更现实。

方向三:从手动管理到自动优化
Skills 自动整理是一个缩影。未来的 Agent 会越来越懂得"自我管理"——自动适应用户习惯,自动优化资源分配,主动减少不必要的负载。

5.2 对实际工作的影响

如果你是一个 AI Agent 的深度用户,这些更新会带来几个具体的变化:

  • 多步骤项目不再需要反复重新描述背景——Kanban 的上下文追踪让中途切换变得无缝
  • 大型任务可以被合理拆解分配——专业的事交给专业的 Agent 来做
  • 技能库会越来越"懂你"——不需要手动整理,常用的功能自然浮现
  • 目标驱动的任务执行更符合真实工作场景——你定义目标,Agent 负责规划路径
5.3 值得关注的潜在挑战

当然,每个新功能都有它的另一面:

Goal 的目标是"正确的"吗? 目标驱动的核心风险在于目标设定本身就有偏差。如果人类给的目标描述不够清晰,Agent 可能会很有"效率"地执行一个错误的方向。这个问题在短期内很难完全解决,需要更好的目标校验机制。

Kanban 的状态管理复杂度上升。当任务有依赖、有分配、有状态流转,出现死锁或循环等待的可能性就会增加。多 Agent 协作系统的调度复杂度远高于单 Agent,这是工程层面的真实挑战。

Skills 自动归档后如何召回? 归档的技能如果需要重新启用,体验是否顺畅?这个细节会影响用户对系统的信任度。

06 避坑清单

  1. Goal 设定要具体,不要模糊:比如"提升用户留存"和"分析流失原因并提出可落地的方案",后者更能让 Agent 准确理解你的意图。
  2. Kanban 任务不要拆得太细:依赖关系越多,维护成本越高。如果一个任务可以在一个工单里完成,就不要拆成五个。
  3. 定期检查归档 Skills:自动归档不等于永久删除,定期看看归档区,防止重要但低频的技能被遗忘。
  4. 多 Agent 协作时明确职责边界:如果两个 Worker 处理同一个任务,容易出现重复工作或者结果冲突。一开始就定义好职责分工。
  5. 运行日志是资产:出现问题时先查日志,不要直接重置。Hermes 的日志保留机制就是用来做这个的。
  6. 目标驱动不是自动驾驶:Agent 会自主规划,但这不意味着可以完全放手。关键节点的结果检查必不可少。
07 7 天上手路线
  • Day 1:了解 Goal 的基本用法,尝试设定一个简单的长期目标,看 Agent 如何拆解
  • Day 2:体验 Kanban,创建一个包含 2-3 个任务的工作流,测试依赖关系
  • Day 3:为不同任务分配不同的 Worker,体验任务分配和状态追踪
  • Day 4:观察 Skills 的变化,哪些被自动收起,哪些保持在主列表
  • Day 5:做一个小型的多步骤项目,比如"本周工作总结",完整走一遍 Goal → Kanban → Skills 的流程
  • Day 6:检查运行日志,理解每个任务的执行路径,评估是否有优化空间
  • Day 7:复盘整个体验,写下你的使用感受和调整策略,形成自己的最佳实践
结尾

Hermes 这次的三个更新——Goal、Kanban、Skills——看起来是三个独立的功能放在一起,但它们的底层逻辑是一致的:让 AI Agent 从"你叫我做什么我就做什么",变成"你告诉我目标,我来规划、执行、追踪结果"

这个转变不是 Hermes 一家的选择,而是整个行业在 2026 年的共同方向。目标驱动让 Agent 有方向,多 Agent 协作让它有执行力,Skills 自动整理让它保持健康。

剩下的,是持续打磨细节和真实场景验证的问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昔日钢铁洪流,今日骡马游行?拉胯的俄胜利日阅兵还能维持多久?

昔日钢铁洪流,今日骡马游行?拉胯的俄胜利日阅兵还能维持多久?

静夜史君
2026-05-03 23:59:38
耻辱!国乒再输瑞典,传来4个坏消息,两主力低迷,王励勤遭质疑

耻辱!国乒再输瑞典,传来4个坏消息,两主力低迷,王励勤遭质疑

眼底星碎
2026-05-04 00:56:44
掘金超市即将开张!戈登约翰逊等人或被交易 湖勇火船成潜在下家

掘金超市即将开张!戈登约翰逊等人或被交易 湖勇火船成潜在下家

罗说NBA
2026-05-04 05:33:46
台当局每年要撒币近15亿收买,斯威士兰这一“金元孤岛”还能撑多久

台当局每年要撒币近15亿收买,斯威士兰这一“金元孤岛”还能撑多久

海峡导报社
2026-05-04 08:09:17
台湾经济狂飙同比增长13.6%,创近39年新高

台湾经济狂飙同比增长13.6%,创近39年新高

凤眼论
2026-05-03 13:15:01
你家楼下的便利店老板们,已经笑不出来了。

你家楼下的便利店老板们,已经笑不出来了。

差评XPIN
2026-05-04 00:03:31
永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

不懂经1人独角兽
2026-05-02 23:35:50
吓人!5年2.5亿顶薪!签了立刻砸手里

吓人!5年2.5亿顶薪!签了立刻砸手里

篮球教学论坛
2026-05-04 09:11:35
广州警方:庾某已被刑拘

广州警方:庾某已被刑拘

中国基金报
2026-05-03 22:52:43
山西五台山突降风雪,狂风裹着雪粒,驴友抱团搀扶行走,不少人被困搭帐篷过夜,亲历者:差点失温;当地:已护送下山,仍有人要上山被劝返

山西五台山突降风雪,狂风裹着雪粒,驴友抱团搀扶行走,不少人被困搭帐篷过夜,亲历者:差点失温;当地:已护送下山,仍有人要上山被劝返

极目新闻
2026-05-03 22:39:24
太扎心了!“火化不要灰”成热议话题,一组逝者名单多是30岁上下

太扎心了!“火化不要灰”成热议话题,一组逝者名单多是30岁上下

火山詩话
2026-05-03 12:43:57
遍地倒闭、批量合并!央企国企扎堆成立的数科公司,为啥死了大半

遍地倒闭、批量合并!央企国企扎堆成立的数科公司,为啥死了大半

细说职场
2026-05-03 20:11:19
年轻人累死累活挣三四千,老人拿七八千退休金,该如何解决?

年轻人累死累活挣三四千,老人拿七八千退休金,该如何解决?

猫叔东山再起
2026-05-02 10:40:17
亲日辱华、知三当三?这一次,57岁的陈红被儿子丈夫“害”惨了

亲日辱华、知三当三?这一次,57岁的陈红被儿子丈夫“害”惨了

凡知
2026-04-08 14:09:55
第二阶段打出6-3!世锦赛决赛吴宜泽占得先机,领先墨菲3局球

第二阶段打出6-3!世锦赛决赛吴宜泽占得先机,领先墨菲3局球

全景体育V
2026-05-04 05:44:53
中国最孤独的大使:一个人带着一条狗坚守三年,改善生活靠挖野菜

中国最孤独的大使:一个人带着一条狗坚守三年,改善生活靠挖野菜

西楼知趣杂谈
2026-05-02 21:21:03
温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

童叔不飙车
2026-05-04 00:07:51
FCC全票封杀!中国实验室被禁,75%市场瞬间归零?反噬来得太快

FCC全票封杀!中国实验室被禁,75%市场瞬间归零?反噬来得太快

大卫聊科技
2026-05-03 12:56:27
国乒男团上上签:逃死亡半区 八强战韩国四强对法国 与日本争冠?

国乒男团上上签:逃死亡半区 八强战韩国四强对法国 与日本争冠?

念洲
2026-05-04 06:42:59
父母离世房产继承引手足矛盾,弟弟指责哥哥:他不配合执行判决

父母离世房产继承引手足矛盾,弟弟指责哥哥:他不配合执行判决

福建第一帮帮团
2026-05-03 19:00:54
2026-05-04 09:36:49
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
327文章数 6703关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

牛弹琴:特朗普大怒使出三板斧报复 德国还是怂了

头条要闻

牛弹琴:特朗普大怒使出三板斧报复 德国还是怂了

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

黄晓明五一带娃去游乐场 父子幸福同框

财经要闻

后巴菲特时代,首场股东会透露了啥

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

数码
家居
房产
手机
游戏

数码要闻

联合创新推出2410F 2026款显示器:FHD 120Hz屏仅599元

家居要闻

灵动实用 生活艺术场

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

手机要闻

iPhone二十周年纪念版用四曲面 Pro系列跟进

LPL第二赛段:鞋底不够厚,BLG三局战胜NIP

无障碍浏览 进入关怀版