网易首页 > 网易号 > 正文 申请入驻

OpenAI把Agent拆成3层,第3层藏了90%的人没看懂

0
分享至

去年有个数据:企业级AI项目失败率67%。不是模型不够聪明,是东西跑起来就崩。OpenAI的Agent团队最近把内部架构摊开了,分了三层——模型、上下文窗口、还有他们叫Agent Harness的东西。前两个天天被讨论,第三个几乎没人提。

这有点像早年PC市场:所有人都在比CPU主频,直到有人意识到没有操作系统,硅片就是块烫手的金属。

第一层:模型是CPU,但CPU不能自己开机

OpenAI把模型比作CPU,负责推理。这个类比老套但准确——就像英特尔酷睿再强,没有主板供电、总线调度、中断管理,它连"Hello World"都打印不了。

模型的问题是可预测性差。同样的输入,温度参数调0.7和0.9,输出可能从"建议购买"变成"强烈不建议"。企业场景里这种波动是灾难。某金融公司用GPT-4做风控初筛,结果发现周三下午的输出比周一上午激进23%,只因负载高了、推理被压缩了。

所以模型层需要被包裹。不是优化它,是限制它的不可控面。

第二层:上下文窗口是RAM,但RAM会"泄漏"

上下文窗口被比作RAM,临时工作记忆。128K token看起来很大,实际用起来像16GB内存跑Chrome——看着够用,开几个标签就报警。

更麻烦的是上下文污染。某客服Agent连续处理20个对话后,开始把第3个用户的问题套到第19个用户身上。这不是模型变笨,是RAM里的"垃圾"没清。OpenAI的解决方式是显式的上下文隔离:每个用户会话有独立的内存空间,对话结束强制 flush(清空)。代价是延迟增加15%,但幻觉率从12%降到3%以下。

这里有个反直觉的点:上下文窗口不是越大越好。太大的窗口会让模型"分心",就像你同时记20件事,每件事的精度都在下降。

第三层:Agent Harness是操作系统,但多数人以为它是驱动程序

Agent Harness这个词是OpenAI内部造的。功能上它做四件事:工具调用编排、状态机管理、错误恢复、安全沙箱。听起来像中间件?不对。中间件是库,Harness是运行时。

具体怎么工作:当Agent需要查数据库、调API、写文件时,Harness决定执行顺序。不是模型决定——模型只输出"意图",Harness把意图翻译成可执行计划。如果API超时,Harness重试;如果返回格式不对,Harness解析失败并回滚状态;如果检测到敏感操作,Harness拦截并转人工。

某电商公司接入后,Agent的端到端完成率从41%提到78%。不是模型换了,是Harness把"掉链子"的场景补上了。

类比的话:模型像赛车引擎,Harness是整套电控系统——牵引力控制、换挡逻辑、故障保护。没有它,引擎再猛也上不了路。

为什么这层被忽略?因为卖模型的不想让你看见

有个尴尬的事实:模型厂商的商业模式是按token计费。如果客户意识到70%的问题出在"操作系统"层,而不是"CPU"层,预算分配会变。OpenAI现在推Agent Harness,某种程度上是自断财路——但不做的话,企业客户会一直卡在POC(概念验证)阶段,永远不进生产环境。

竞争对手的动作更说明问题。Anthropic的Claude 3.5发布时重点强调"工具使用能力",但底层同样依赖类似的编排层;Google的Vertex AI直接提供了预置的Agent框架;微软的Copilot Studio本质上也是Harness的一种产品化。

行业正在从"拼模型"转向"拼系统"。这不是说模型不重要,而是模型差距在缩小,系统差距在拉大。同样的GPT-4,有Harness和没Harness,是两个产品。

对从业者的实际影响

如果你在做Agent项目,现在需要重新评估技术栈。三个检查点:

第一,你的"Harness"层是自研还是外包?自研意味着要处理状态机、并发控制、熔断机制,团队里得有做过分布式系统的人。外包意味着被厂商锁定,但上线速度快。

第二,上下文管理是显式还是隐式?隐式依赖模型的"记忆",风险高;显式需要设计内存结构,工作量大但可控。

第三,错误恢复是人工介入还是自动回滚?前者适合低频高价值场景,后者适合高频标准化场景。没有对错,但选错了会放大损失。

某SaaS公司的教训:他们用LangChain快速搭建了Demo,客户很满意。上线后第一周,Agent在调用支付API时因网络抖动重试了3次,用户被扣了3笔钱。问题不在模型,在Harness层的幂等性设计缺失。修复花了2周,客户流失了。

OpenAI的文档里有个细节:他们的Harness默认所有外部调用都是"不可靠的",所以内置了指数退避、请求去重、响应校验。这种防御性编程思维,和写模型prompt是完全不同的技能树。

Agent Harness这个概念会被更多厂商借用,也可能换个名字——执行引擎、编排层、控制平面。名字不重要,重要的是它标志着AI工程化的一个转折点:从"让模型更聪明"到"让系统更鲁棒"。

最后一个问题留给你:如果你的Agent明天要处理1000个并发会话,其中5%会触发异常流程,你的Harness层能在不人工介入的情况下自愈多少?这个数字,可能比你的模型评分更能决定项目生死。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王健林,被逼到崩溃边缘...

王健林,被逼到崩溃边缘...

鸣金网
2026-04-16 19:42:33
普京敲定访华,特朗普紧急下命令,中国通告全球,无惧美国威胁

普京敲定访华,特朗普紧急下命令,中国通告全球,无惧美国威胁

书纪文谭
2026-04-16 18:08:02
年轻人不买房不结婚了:就怪那个把房婚捆绑的人

年轻人不买房不结婚了:就怪那个把房婚捆绑的人

三言四拍
2026-04-16 16:29:36
散步半个小时错了?医生提醒:过了60岁,散步要尽量做到这6点!

散步半个小时错了?医生提醒:过了60岁,散步要尽量做到这6点!

医学科普汇
2026-04-16 21:25:05
不再是120/80,“新血压标准”已公布,别再自己吓自己!

不再是120/80,“新血压标准”已公布,别再自己吓自己!

芹姐说生活
2026-04-14 23:27:03
悲催!网传武汉某双非高校一寝室6人,仅1人找到月薪3500元工作…

悲催!网传武汉某双非高校一寝室6人,仅1人找到月薪3500元工作…

火山詩话
2026-04-16 13:58:24
鞠婧祎方回应“丝芭创始人王子杰去世”:不与争论,生命为大,愿安息;王子杰曾创立SNH48,打造鞠婧祎“四千年美女”标签,推动其成顶流

鞠婧祎方回应“丝芭创始人王子杰去世”:不与争论,生命为大,愿安息;王子杰曾创立SNH48,打造鞠婧祎“四千年美女”标签,推动其成顶流

大风新闻
2026-04-16 14:09:04
匈牙利撤军:人还没走,茶就凉了

匈牙利撤军:人还没走,茶就凉了

寰宇大观察
2026-04-16 17:20:43
港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

骄阳之夏明
2026-04-15 16:44:42
网盘禁止传播海外影视资源引热议 大量链接失效

网盘禁止传播海外影视资源引热议 大量链接失效

3DM游戏
2026-04-16 18:24:04
开拓者约谈杨瀚森,引发震动!老板勃然大怒,全员整顿!

开拓者约谈杨瀚森,引发震动!老板勃然大怒,全员整顿!

刘哥谈体育
2026-04-16 11:30:39
老照片太刺眼:王宝强当年真没察觉吗

老照片太刺眼:王宝强当年真没察觉吗

草莓解说体育
2026-04-16 20:07:54
中国出生和死亡人口差距越来越大:2025年出生人口跌破800万,净减少339万人

中国出生和死亡人口差距越来越大:2025年出生人口跌破800万,净减少339万人

互联网大观
2026-04-16 12:37:44
谁干的?20枚火箭弹精准发射后,以色列传三噩耗,内塔急下令

谁干的?20枚火箭弹精准发射后,以色列传三噩耗,内塔急下令

别让往昔的悲伤和对未来的恐惧
2026-04-16 23:52:16
“天津突发8.8级地震”?警方通报

“天津突发8.8级地震”?警方通报

大象新闻
2026-04-16 17:41:08
大料!许家印的背后金主,也栽了!

大料!许家印的背后金主,也栽了!

财经要参
2026-04-16 13:31:31
国内暴跌35%,全球大跌19.1%,为什么大家都不买小米手机了?

国内暴跌35%,全球大跌19.1%,为什么大家都不买小米手机了?

科技松鼠
2026-04-16 16:00:08
北京电影节开幕式红毯:高圆圆舒淇好美,高叶造型亮眼,尹正瘦了

北京电影节开幕式红毯:高圆圆舒淇好美,高叶造型亮眼,尹正瘦了

八卦先生
2026-04-16 23:19:54
杨某媛辞职了!而且社交媒体账号也被注销……

杨某媛辞职了!而且社交媒体账号也被注销……

麦杰逊
2026-04-16 12:04:33
最新:同济大学已成立调查组

最新:同济大学已成立调查组

南方都市报
2026-04-16 16:57:13
2026-04-17 06:31:00
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
1489文章数 16关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:美伊下次会晤可能在本周末举行

头条要闻

特朗普:美伊下次会晤可能在本周末举行

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

艺术
旅游
教育
手机
公开课

艺术要闻

这 4 个红底黑字,藏着毛主席给一位普通母亲的最高赞誉,看完泪目

旅游要闻

社评:读懂“China Travel”持续圈粉的逻辑

教育要闻

“一开始我就要考400+”|南京大学新传考研406分经验贴

手机要闻

OPPO Find X10:8000mAh超大电池+双2亿影像,中屏机皇实锤!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版