网易首页 > 网易号 > 正文 申请入驻

一曲新词酒一杯,喝到Harness我就醉

0
分享至

现在Harness已是AI业界的热词。Anthropic和OpenAI在二三月间于官网技术博客上发文介绍后,如今人人都在聊。

AI明星林俊旸近日于社交媒体上转发一篇斯坦福大学研究人员的Harness新产品论文时称:“现在模型+harness的模式已经超过单纯的AI模型。Harness的设计和质量能显著影响AI智能体性能。开发Harness是正确的道路”。

当概念已经被炒热成这样,那么就需要捋清概念:何谓AI的Harness?

01

Harness起源:拿AI管AI写AI

AI现在是产学研齐头前进的行业,说概念,先从实例和溯源说起。

Anthropic的Claude Code现在是AI智能体编程的头部产品。Claude Code的爸爸、从原初雏形至今的创作者和负责人鲍里斯·切尔尼(Boris Cherny)在社交媒体和出席各种播客节目时详细描述了自己开发Claude Code的历程。

在切尔尼的描述中,工作量增加后,团队成员开始用Claude Code写Claude Code自己的代码、并用AI管理写代码的AI。

切尔尼说,自己会在工作机器上开五个以上终端标签页,每个标签页里都是一个独立运作的Claude Code副本。如果终端标签页不够使,他将编程任务“溢出”进Claude Code的Web或桌面端app,和标签页的子副本都是隔离分别运行。

每次写码从进入总管这些副本的Claude Code的计划模式(Plan Mode)开始,订好工作流程:

第一批Claude Code的子副本写代码。

第二批子副本做检查代码的评审(Reviewer),关注代码的边界条件、风格一致性和可维护性等易失误处。

第三批子副本再审核第二批代码的工作是否符合md(Markdown)文件的要求。

子副本们之前的常见错误、期望达到的代码风格、常用命令与文件目录、动作禁则,简洁概括后写入总管的Claude Code的md文件中,作为以后AI自动写码的指导。

“用AI管AI写AI代码”的模式下,切尔尼个人每天能发出10-30个合并代码的拉取请求(PR),数月内不用手动写码,效率激增。依靠这种模式,Anthropic才能达到现在几乎隔日一次重大更新的产品发布频率。



如果熟悉Anthropic的官网更新动态,就会发现《为长期应用运行开发的Harness设计》(Harness design for long-running application development)这篇3月热门文章的内容,切尔尼提前两三个月在播客上就唠过了。

3月热文中的“三智能体”Harness架构,三层的规划者(Planner)、生成器(Generator)、评估器(Evaluator),基本是切尔尼上节目时的大白话内容,不过做了概括后再包装。

02

Harness本质:高成本高效率的多智能体架构

切尔尼描述的这个过程就是Harness的本质。Harness不只是自动完成任务的子智能体、不只是总管子智能体工作的上层智能体、也不只是告诉AI工作事项的md文件,而是总括了这些的AI智能体自动运转的整体流程。

使用Harness这个字眼来描述此流程,是借用电气工程中的“线束工程”概念。电气工程的“线束”统筹的是线路与信号走向,AI智能体的Harness统筹的是子智能体与模块的动作功能,殊途同归。

当然,真要咬文嚼字起来,Harness可以翻译成中文中的“輐”与“轭”,是连接马匹与车身的传动兼指向车具。不过古天主教和尚的“若无必要,勿增实体”原则在六七百年后的AI时代更加有用,不用新造字眼给大众增加理解负担,真要中文意译,用电气工程中已通行、最简洁的“线束”最合适。

如果更仔细考证技术底蕴,能发现在2025年6月中Anthropic发布的官网文章《我司如何构建多智能体》,已经开始尝试多智能体Harness架构。以Claude Opus 4为上层智能体底座、Sonnet 4为子智能体底座的多智能体架构,在他们的内部评测中,性能比Opus 4单一模型强出90.2%。

高效率的同义词往往是高成本。2026年3月Anthropic的Harness文章中示例,用同一组提示词,让AI自行编写一个2D复古小游戏。以此对比Opus 4.5单一模型和多智能体Harness架构的性能:单一模型运行20分钟,成本9美元,成品不可用;全套harness运行6小时,成本200美元,成品可用。

该文除了展现Harness架构性能,也以此做了Opus 4.6更新的广告:“Opus 4.6计划更仔细,运行智能体任务的时长更久,能在更大的代码库中更可靠地运行,并有更好的代码审查和调试功能来自我纠正。”

用白话说,就是更强的模型才能驱动更高效的Harness,有多快马跑多快车。从2025年6月至今,多智能体架构耗费token的速度始终是普通聊天机器人的15倍以上,但将工作流拆分成子任务集合完成的效率也不减此数。顾客们要不要掏钱惠顾模型厂,须有一番思量。

03

Harness精髓:用AI体现传统软件工程要则

00后程序员赵晨阳现在由开源项目SGLang衍生的“基数方舟AI”(RadixArk AI)公司供职,按他在社交媒体上的解析,现在业界狂炒Harness,反而很不AI风,是叠床架屋地增加智识负担。

赵晨阳认为,所有Harness的关键点,都是用AI重新实现了一遍“古代”传统软件工程原则中的要点:

不在AI聊天机器人的每次对话纪录用提示词重复阐明工作准则,而将准则保存在AI智能体的md文件,这是“文档即代码”(docs-as-code)原则在AI中的体现;

不期待一个超级AI模型解决整个工作任务,将工作任务拆成分隔的专门版块,让单个子智能体只处理单一版块,这是“关注点分离”(separation of concerns)和“单一职责”(single responsibility)原则在AI中的体现;



将AI子智能体在工作流中的权责结构化,不让总管的AI上层智能体自行猜测,这是“左移约束”(shift-left constraints)原则在AI中的体现。

Anthropic的研究员尼古拉斯·卡利尼在2月底公布的实验,也体现了此原则。卡利尼使用了约2万美元的API总额度、并发约两千次Claude Code会话、并行16个Claude Opus 4.6驱动的子智能体、用时两周、生成了10万行Rust代码,最后构建出可运行C编译器。

按Anthropic官网上的卡利尼自述,他的精力不在写提示词上,提示词可以尽量简单,工作的重点是设计子智能体架构的基础环境:测试、运行、反馈等机制,如此才能让多AI智能体无人工干预自行运转。

ChatGPT奇迹的三年内,第一年大家在思考如何给AI聊天机器人写出更好的提示词、在聊天窗口调用大模型的性能。

第二年大家发现完成调用不用人类来做提示词仙人,让AI自己学会调用不同大模型和同一大模型的不同功能API,这是Manus和AI智能体火热的一年。

第三年大家发现可以让AI自己学会自动调用并读懂用户终端里的本地文件、和云端的各种AI子智能体,这是OpenClaw和Harness架构火热的一年。

时代趋势是AI的调用层级越来越高,完成的任务越来越复杂。但技术皆有脉络可循,基础原理并不是大众不能理解的黑魔法。(作者/李熙)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
创56年纪录!绿军首节狂轰53+11三分 布朗20分+豪瑟6中6轰17分

创56年纪录!绿军首节狂轰53+11三分 布朗20分+豪瑟6中6轰17分

醉卧浮生
2026-04-02 08:31:01
广东这个叫啥?一盒扭扭的条条好吃到停不下来!

广东这个叫啥?一盒扭扭的条条好吃到停不下来!

日落于西
2026-03-31 20:00:08
乌克兰无人机过境芬兰袭击俄罗斯,面对俄问责,芬兰说我们不知道

乌克兰无人机过境芬兰袭击俄罗斯,面对俄问责,芬兰说我们不知道

黑鹰观军事
2026-04-01 18:26:27
观网独家对话德比斯:“这简直太疯狂了!”

观网独家对话德比斯:“这简直太疯狂了!”

观察者网
2026-04-01 22:42:08
杭州市场监管部门对优思益推手立案调查

杭州市场监管部门对优思益推手立案调查

新京报
2026-04-02 11:08:59
7岁女孩说:我的衣服自己洗,弟弟的爸妈洗,麻木的眼神让人心惊

7岁女孩说:我的衣服自己洗,弟弟的爸妈洗,麻木的眼神让人心惊

离离言几许
2026-04-01 16:21:26
重返月球!NASA“阿尔忒弥斯二号”成功发射,举世欢呼

重返月球!NASA“阿尔忒弥斯二号”成功发射,举世欢呼

大洛杉矶LA
2026-04-02 07:11:53
炸了!19岁国乒小将3-0横扫世界名将,温瑞博赛后回应!日本3人出局!

炸了!19岁国乒小将3-0横扫世界名将,温瑞博赛后回应!日本3人出局!

最爱乒乓球
2026-04-02 00:08:45
4月执行!退休人员需缴费 每月扣费金额 免缴条件全解读

4月执行!退休人员需缴费 每月扣费金额 免缴条件全解读

混沌录
2026-04-02 16:08:04
沪指跌逾1% 创业板指跌超2.6%

沪指跌逾1% 创业板指跌超2.6%

财联社
2026-04-02 14:00:06
中国电力央企关系图、领导团队

中国电力央企关系图、领导团队

新浪财经
2026-04-01 20:54:49
美股大型科技股盘前普跌,特斯拉、英伟达跌2%

美股大型科技股盘前普跌,特斯拉、英伟达跌2%

每日经济新闻
2026-04-02 16:05:08
特朗普准备撤了?自称对伊战事取得“胜利”,转头鼓动各国去“抢石油”

特朗普准备撤了?自称对伊战事取得“胜利”,转头鼓动各国去“抢石油”

上游新闻
2026-04-02 11:45:06
杭州警方通报网传“女子被网约车司机骚扰”

杭州警方通报网传“女子被网约车司机骚扰”

界面新闻
2026-04-02 14:27:38
神剧打架,王炸归来,这个4月爽爆了

神剧打架,王炸归来,这个4月爽爆了

天天美剧吧
2026-04-02 19:45:27
广州外国语,红利期已过?

广州外国语,红利期已过?

区老师不是qu老师
2026-04-02 16:55:56
优思益暴雷后董宇辉惹上麻烦,网友晒订单要求假一赔十

优思益暴雷后董宇辉惹上麻烦,网友晒订单要求假一赔十

映射生活的身影
2026-04-01 23:26:28
一年亏损四千万,全国陷“关停潮”,曾经的金饭碗如今正惨遭抛弃

一年亏损四千万,全国陷“关停潮”,曾经的金饭碗如今正惨遭抛弃

范瞼舍长
2026-04-01 11:50:16
哈拉齐重伤,妻子遇难;特朗普话音刚落,伊朗导弹直扑以色列,美军向中东增派攻击机!原油直线拉升,黄金白银急跌

哈拉齐重伤,妻子遇难;特朗普话音刚落,伊朗导弹直扑以色列,美军向中东增派攻击机!原油直线拉升,黄金白银急跌

每日经济新闻
2026-04-02 11:18:11
谁在掏空意大利足球?8.34亿豪门三连缺席世界杯,让4星蒙尘!

谁在掏空意大利足球?8.34亿豪门三连缺席世界杯,让4星蒙尘!

落夜足球
2026-04-02 12:10:52
2026-04-02 20:11:00
字母榜 incentive-icons
字母榜
让未来不止于大。
2342文章数 8055关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

凯越机车否认"内涵"张雪机车:张雪离开前持股近36%

头条要闻

凯越机车否认"内涵"张雪机车:张雪离开前持股近36%

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

宋宁峰带女儿出轨,张婉婷找董璇哭诉

财经要闻

高油价、AI泡沫...谁将压垮美国经济

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

家居
艺术
本地
时尚
公开课

家居要闻

岁月静好 典雅新章

艺术要闻

故人西辞黄鹤楼,烟花三月下扬州

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

女人有没有品位看看穿搭就知道,这些造型值得借鉴,温柔高级

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版