网易首页 > 网易号 > 正文 申请入驻

澳洲放羊大叔引爆AI编程革命!Claude Code急推goal模式,不干完不许停

0
分享至


新智元报道

编辑:好困 KingZH

【新智元导读】澳洲牧羊大叔随手写的三行bash,11天内被OpenAI、Anthropic和Hermes集体收编了。

一觉醒来,Claude Code又更新!

为了让Claude 持续工作直到任务完成,Claude Code最近推出的新功能:/goal 。


你只要设定条件,Claude不完成任务它绝不罢休!


用过AI编程工具的人都懂,这到底多重要!

你给Agent下了一个任务,它跑了三个回合,改了两个文件,突然停下来问你「接下来需要我做什么?」

不是,bug你这还没修完呢啊!


Agent越来越聪明,写代码越来越快,但「从头到尾把一件事干完」这件事,到2026年初都没有一家能做到。

然后,一位来自澳大利亚的牧羊大叔Geoffrey Huntley,用三行bash解决了。

done

他把它命名为Ralph Loop,致敬《辛普森一家》里那个永远搞不清状况但从不放弃的小孩Ralph Wiggum。

逻辑极其粗暴,无限循环,反复把同一个prompt喂给Agent。进度写在文件系统和Git历史里,上下文满了就开新实例,读文件接着干。


原始,不优雅,但十分有效。

有效到OpenAI看见了,Nous Research看见了,Anthropic也看见了。

11天,三家顶级AI实验室,不约而同地把这三行bash写进了官方产品。

这一刻,所有人都明白了一件事——

通用人工智能的临门一脚,可能不是更聪明的模型,而是「把事做完」的模型。

换句话说,AI编程的核心战场正在从「生成代码」转向「闭环交付」。

11天,三条线,同一个终点

4月30日,OpenAI的Codex率先上线/goal

Greg Brockman在X上只丢了一句,「Codex现已内置Ralph loop++」。


一周后,Hermes Agent跟上。又过4天,Claude Code也上了。

11天。三家。同一个命令。同一个功能。

但实现路径,差了十万八千里。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。


Codex:

把目标存成一条数据库记录

OpenAI是三家里最先出手的,方案也最简洁。

在Codex里,/goal是一个持久化的工作流对象,存在本地的app-server状态层里。

关掉终端、合上笔记本、甚至重启系统,目标都不会丢。下次打开Codex,自动接上。


模型通过结构化的update_goal工具汇报进度状态,token预算耗尽时触发「软着陆」而非硬停。

有人用这个功能连续跑了14个小时,中间暂停5小时去睡觉,回来Codex从断点续跑,把一个设备驱动项目做完了。

工程化,干净,但克制。


Hermes Agent:

一个人干不完,那就上一个团队

Hermes Agent的野心最大。

在这里,/goal只是冰山一角。真正的重头戏是多智能体看板系统,Hermes把「让AI把活干完」从单Agent问题升级成了团队协作问题。


看板的底层是本地SQLite,持久化存储,跨重启不丢。

你在上面创建一个任务卡片,Hermes会直接把它拆成多个子任务,分配给不同的Agent worker。每个worker是一个独立的OS进程,有自己的身份、模型配置和工作目录。

看板和/goal是两套互补的系统。/goal管的是单个Agent的目标锁定(Ralph loop),看板管的是多个Agent之间的任务调度。一个纵向深入,一个横向铺开。

最后,是五层防烂尾机制。

第一层,心跳检测。每个worker定期向看板报到,证明自己还活着。

第二层,僵尸回收。worker超时没响应?系统自动判定死亡,回收它手上的任务重新分配。macOS上还有专门的达尔文僵尸检测逻辑。

第三层,退出拦截。worker没完成任务就退出了?系统自动把它标记为blocked,不让它再接新活,防止「摸鱼型Agent」反复领任务又不做。

第四层,幻觉拦截。这是最狠的一层。AI说「我做完了」不算数,系统会验证它实际产出的代码是否真的落盘了。Agent说自己创建了一个文件但实际上没有?抓住,回滚,重来。

第五层,重试预算。每个任务有独立的max_retries,最多重试N次,超过就上报人类。绝对不会无限循环到死机。


Claude Code:

做事的人和验收的人,不能是同一个

Anthropic是三家里最后出手的,但方案最巧妙。

本质上,Claude Code的/goal是一个session级别的Stop Hook。

你设定一个完成条件(比如「test/auth目录下所有测试通过且lint无报错」),Claude就开始干活。


关键设计在验收环节。每干完一轮,系统不让Claude自己判断「我做完了没有」。

它把对话记录和你的完成条件一起发给一个独立的小模型(默认是Haiku),让这个小模型来裁判。

小模型如果觉得没完成,就需要返回一个具体理由(比如「test_login.py还有2个failure」)。然后这个理由会被注入Claude下一轮的上下文,指导它接着干。

如果小模型认为完成了,目标就会自动清除,任务结束。

值得一提的是,这个裁判模型不调用任何工具,不读文件,不跑命令。它只看Claude在对话里产出的内容。

所以,你的完成条件必须是Claude在对话中能证明的东西。

它最长支持4000字符,因此你可以写得很细。

甚至,还可以在条件里加约束,比如「不修改其他测试文件」「20轮内完成否则停止」等等。


决赛进行时:工作流入口

把视角拉远一步。

Claude Code背后站着Anthropic,Codex背后站着OpenAI,Hermes Agent接入了两边的模型,同时也是DeepSeek V4等模型的主力分发渠道。

三条路径,恰好覆盖了ASI决赛的三个生态入口。

而他们争的,也是同一样东西——工作流。

谁的Agent先让开发者养成「设完目标就走开」的习惯,谁就锁死了工作流入口。

因为习惯一旦形成,迁移成本是指数级的。

你不会轻易离开一个已经跑通了看板调度、断点续传、checkpoint回滚的Agent基础设施。

一个看似很小的/goal命令,背后卡的是整条Agent工作流的护城河。

参考资料:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
立夏后,少吃鸡肉和牛肉,多吃这3种肉,腿脚有力,精力充沛过夏

立夏后,少吃鸡肉和牛肉,多吃这3种肉,腿脚有力,精力充沛过夏

花小厨
2026-05-12 12:27:48
特斯拉"轻松贷"上线:Model 3首付5.59万起,5年0息方案入场

特斯拉"轻松贷"上线:Model 3首付5.59万起,5年0息方案入场

赛博兰博
2026-05-13 08:53:06
20架C17抵京,特朗普搬家式外交,本想炫耀实力,结果被运20打脸

20架C17抵京,特朗普搬家式外交,本想炫耀实力,结果被运20打脸

青烟小先生
2026-05-12 09:30:12
4月汽车销量前十名仅剩一款燃油车!麦肯锡:燃油车中短期内在中国市场不会快速退出历史舞台

4月汽车销量前十名仅剩一款燃油车!麦肯锡:燃油车中短期内在中国市场不会快速退出历史舞台

每日经济新闻
2026-05-13 16:52:04
郑强翻车,翻得一点也不冤!

郑强翻车,翻得一点也不冤!

梳子姐
2026-05-13 12:19:44
乌军展开镜像反击,美将俄列为全球最腐败国家,美宣布从欧洲撤军

乌军展开镜像反击,美将俄列为全球最腐败国家,美宣布从欧洲撤军

史政先锋
2026-05-13 18:59:40
吴川多位亿万富豪聚餐!6位穿拖鞋,C位身价百亿,右二被誉现金王

吴川多位亿万富豪聚餐!6位穿拖鞋,C位身价百亿,右二被誉现金王

裕丰娱间说
2026-05-12 21:55:44
中国外交部发声:坚决反对、强烈谴责巴方有关行径!

中国外交部发声:坚决反对、强烈谴责巴方有关行径!

一个有灵魂的作者
2026-05-12 21:21:19
被两个老外拐跑的出租车司机

被两个老外拐跑的出租车司机

南风窗
2026-05-13 13:18:49
“华系内战”!选阿维塔12,还是其他?

“华系内战”!选阿维塔12,还是其他?

买车大师
2026-05-07 10:47:45
败光5千万后,超市打工、不敢见人!马蓉澳洲落魄现状,令人唏嘘

败光5千万后,超市打工、不敢见人!马蓉澳洲落魄现状,令人唏嘘

牛锅巴小钒
2026-05-12 12:54:30
特朗普访华,美国驻华大使馆的评论区亮了

特朗普访华,美国驻华大使馆的评论区亮了

历史总在押韵
2026-05-13 18:29:26
“摸奶子”再惹争议,OPPO的流量反噬开始了

“摸奶子”再惹争议,OPPO的流量反噬开始了

品牌头版
2026-05-13 10:18:15
足协主席宋凯与国际足联秘书长在京会面

足协主席宋凯与国际足联秘书长在京会面

北青网-北京青年报
2026-05-13 17:44:09
关心:黄仁勋为什么能“压哨登机”

关心:黄仁勋为什么能“压哨登机”

观察者网
2026-05-13 16:22:20
刚删完中文就慌了!国际足联,耍的那点小聪明,竟捅了天大的篓子

刚删完中文就慌了!国际足联,耍的那点小聪明,竟捅了天大的篓子

西楼知趣杂谈
2026-05-13 14:16:55
多地国央企开始发侮辱性工资了!

多地国央企开始发侮辱性工资了!

灯锦年
2026-05-13 20:15:38
黄仁勋半路登机,一场精心设计的欲擒故纵的大国博弈

黄仁勋半路登机,一场精心设计的欲擒故纵的大国博弈

光远看经济
2026-05-13 18:36:11
都没进世界杯!泰国购买世界杯转播权预算仅2.7亿 远低于央视17亿

都没进世界杯!泰国购买世界杯转播权预算仅2.7亿 远低于央视17亿

念洲
2026-05-13 19:18:09
重庆发布中小河流涨水风险提示,涉及32个区县

重庆发布中小河流涨水风险提示,涉及32个区县

上游新闻
2026-05-13 21:19:05
2026-05-13 22:00:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15202文章数 66865关注度
往期回顾 全部

科技要闻

腾讯一季度营收1964.6亿元 同比增9%

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

教育
时尚
旅游
健康
房产

教育要闻

长检匠心:融智聚力护成长 长沙未检共探协同保护新路径

快来解锁富家千金风穿搭,穿舒适又时髦,一键拿捏优雅气质

旅游要闻

中国新文创市集集结各地文创,五大演艺专区百场演出好戏不断

干细胞能让人“返老还童”吗

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

无障碍浏览 进入关怀版