网易首页 > 网易号 > 正文 申请入驻

OpenAI祭出GPT-5.4神装!Codex同款Harness全面开放

0
分享至


新智元报道

编辑:好困

【新智元导读】GPT-5.4真正的杀招终于落地!OpenAI连夜重写基建、原生收编七大沙盒,彻底封死第三方框架的活路。旧时代的聊天玩具已被抛弃,工业级Agent全面觉醒。

OpenAI不声不响,又下了一手狠棋。

就在刚刚,Agents SDK迎来一次彻底的架构重写

原生harness、原生沙盒、Codex级的文件系统工具,外加七家头部沙盒厂商一键接入。


3月初,GPT-5.4带着原生computer use(计算机使用)高调登场时,开发者就已经吐槽过一件事。

模型能操作电脑了,可Agent跑在哪台电脑上、怎么保证跑起来不出事,还是得自己东拼西凑一套框架。

今晚这个缺口被OpenAI自己补上了。


一句话版本,OpenAI这次把Agents SDK从「聊天机器人的玩具」改造成了「生产级Agent的底座」

harness负责控制流、模型调用、工具路由、暂停恢复;沙盒负责读写文件、装依赖、跑代码,两层彻底解耦。

更狠的是,这一刀同时砍在了LangChain、CrewAI、LangGraph这些第三方Agent框架身上。

OpenAI下场把基建层做了,留给第三方的空间,肉眼可见地在收窄。

从「聊天机器人的玩具」到生产级底座

讲这次升级之前,先得搞清楚原来的Agents SDK长啥样。

2025年3月,OpenAI第一次推出Agents SDK,主打轻量、少抽象、几行Python就能跑起来的卖点。

但这一版SDK,本质上是为聊天机器人场景做的。

一年多过去,模型在能力上的提升可谓是翻天覆地——一口气能跑几个小时、几天,甚至几周。

原来那套为聊天机器人设计的SDK,自然也就跟不上时代了。


这次的重写,主要做了两件事。

第一件,给模型配一个完整的运行框架——harness。

配置化记忆、感知沙盒的编排、类似Codex的文件系统工具、通过MCP调工具、通过skills渐进式披露信息、通过AGENTS.md自定义指令、用shell工具执行代码、用apply patch工具编辑文件,全部打包进SDK原生支持。

熟悉Claude Code和Codex的开发者看到这套清单会很眼熟。

没错,OpenAI这次是把自家Codex过去一年踩过的坑、积累的最佳实践,顺手产品化塞进了SDK。


第二件,把harness和compute彻底分离。

harness跑在你的可信基建里,管模型调用、审批、追踪、运行状态。compute是一个独立的沙盒,专门负责读写文件、跑命令、装包、吐产物。

两层之间的接口标准化,API key和敏感凭证压根儿不会进入模型生成代码实际执行的那个环境。


结果就是,沙盒里既没有API密钥,也没有任何敏感凭证。沙盒本身完全隔离,甚至可以和网络断开,没有任何对外流量。

这不是安全性能的小修小补。这是整个Agent架构的范式转移。



900页保险单100%提取

一半PR出自Agent

harness/compute分离的第一个结果,是沙盒供应商的生态图一夜铺开。

这次发布,Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel七家沙盒厂商同时被写进官方支持列表。


七家能同时接入,关键在OpenAI给了一个叫Manifest的抽象层——一份描述Agent工作区的配置清单。

要挂载哪些本地文件、从哪个云存储拉数据、产物写到哪里,全写在这份Manifest里。AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2全覆盖。

最关键的是这份Manifest和具体沙盒供应商解耦。

今天用E2B写的Agent,明天想换成Modal跑,不用重写代码,改一行配置。哪家沙盒便宜、哪家离数据近,就切到哪家。

官方给了一个最小示例。让一个Agent跑进本地沙盒,挂上一个财报目录,对比FY2025和FY2024的三项财务指标,核心代码不到20行。

# pip install "openai-agents>=0.14.0"import asyncioimport tempfilefrom pathlib import Pathfrom agents import Runnerfrom agents.run import RunConfigfrom agents.sandbox import Manifest, SandboxAgent, SandboxRunConfigfrom agents.sandbox.entries import LocalDirfrom agents.sandbox.sandboxes import UnixLocalSandboxClientasync def main() -> None:    with tempfile.TemporaryDirectory() as tmp:        dataroom = Path(tmp) / "dataroom"        dataroom.mkdir()        (dataroom / "metrics.md").write_text(            """# Annual metrics| Year | Revenue | Operating income | Operating cash flow || --- | ---: | ---: | ---: || FY2025 | $124.3M | $18.6M | $24.1M || FY2024 | $98.7M | $12.4M | $17.9M |""",            encoding="utf-8",        )        agent = SandboxAgent(            name="Dataroom Analyst",            model="gpt-5.4",            instructions="Answer using only files in data/. Cite source filenames.",            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),        )        result = await Runner.run(            agent,            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",            run_config=RunConfig(                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),            ),        )        print(result.final_output)if __name__ == "__main__":    asyncio.run(main())

另外两个对长跑任务格外关键的新能力是,让沙盒容器挂了也能从检查点续命的快照和状态恢复;以及解决扩展性问题的多沙盒并行+子Agent隔离环境。

由此,Agent第一次有了「掉线续命」和「分身作战」的原生能力。

在一篇技术长文中,Modal技术团队成员Erik Dunteman顺手透露了一个细节——

Ramp已经用Modal跑了一支后台编码Agent大军,公司超过一半的PR都是这些Agent自己创建的。

不仅如此,Stripe也在今年早些时候披露,内部的AI Agent每周产出超过1000个PR。

两家公司的共同点是,在拿到成熟Agent基建之后,业务团队的生产力出现了断层式跃迁。

如今,OpenAI把这些曾经只有头部公司才能攒出来的基建,变成了SDK里开箱即用的默认配置。


https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk

对此,FurtherAI CTO Sashank Gondala披露,他们的Agent啃下了一份900多页的保险理赔记录,提取成功率100%。

900多页、100%、保险理赔记录,这三个词凑在一起的含金量老保险从业者一看就懂,业内最难啃的文档之一,以前跑到某一页崩掉是常态。


Tomoro AI研发工程师Douglas Adams给出了另一组硬数字,相同能力的Agent,这次需要的代码量比以前少了6倍。


Box开发者关系负责人Carter Rabasa,则传了一份业务数据并配上bash/python作为工具,让agent在沙盒里跑了一整套发票对账业务流程。

没想到,第一轮试水就跑通了。

沙盒对跑agent生成的代码来说非常完美。


OpenAI下场做基建

LangChain们无处躲

到这一层,这次发布对行业的冲击才真正显露。

LangChain、LangGraph、CrewAI、AutoGen这些第三方Agent框架,过去一年靠什么活着?答案是靠补齐OpenAI原生SDK不够「生产可用」的那块空白。

编排、记忆管理、护栏、追踪、多Agent协作,这些都是第三方框架的主战场。

现在,OpenAI一次性把这些主战场全接管了。

他们要做的就是Agent世界的基础设施层,第三方框架从此要么往更高层走(编排、垂直场景),要么往更低层走(专用沙盒、专用工具),夹在中间的那块地板,已经被OpenAI自己踩实了。

而且,OpenAI口中的「兼容所有沙盒服务商」,本身就是在把沙盒供应商纳入OpenAI的生态位。

今天可能还是OpenAI的合作伙伴,明天的身份很可能就只是OpenAI生态下的「组件供应商」了。

Python先行,TypeScript还在排队

虽然这一切目前还不完美。

harness和sandbox的新能力首发只上了Python,TypeScript版本排在后续更新计划里;SDK至今仍然停留在0.Y.Z版本号。

但方向已经非常清晰了。

GPT-5.4带着原生computer use登台,Agents SDK给它配齐了真正的运行环境。

下一步缺的,只是更多开发者把业务逻辑搭在这个基建之上。

从此,做Agent框架的创业公司会重新审视自己的定位。做沙盒的供应商开始算OpenAI流量能不能接得住。做业务层Agent应用的团队盘算要不要迁移。

GPT-5.4出厂那天被一些人说成是「没有惊喜的例行升级」。

40天后回头看,真正的惊喜今天才发。

参考资料:

https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/

https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk

https://openai.com/index/the-next-evolution-of-the-agents-sdk/

https://x.com/OpenAIDevs/status/2044466699785920937

https://x.com/snsf/status/2044514160034324793

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
携带约51万元电子通讯设备入境,部分设备绑在身上,9名中国公民在斯里兰卡机场被捕

携带约51万元电子通讯设备入境,部分设备绑在身上,9名中国公民在斯里兰卡机场被捕

红星新闻
2026-04-16 20:51:00
为啥你家猫吃两口饭就不吃了?不是挑食、不是吃饱了,科学家刚发现另一个离谱的原因

为啥你家猫吃两口饭就不吃了?不是挑食、不是吃饱了,科学家刚发现另一个离谱的原因

万物杂志
2026-04-16 06:07:03
中国U20女足主帅表态耐人寻味,贝尔离开帅位?

中国U20女足主帅表态耐人寻味,贝尔离开帅位?

北青网-北京青年报
2026-04-16 17:28:04
不想访华了?特朗普召回美驻华大使,贝森特放话:中国“不可靠”

不想访华了?特朗普召回美驻华大使,贝森特放话:中国“不可靠”

健身狂人
2026-04-16 05:35:38
太突然!24岁徐平安黑痣夺命,母妹双亡父失明,弃考研太意难平

太突然!24岁徐平安黑痣夺命,母妹双亡父失明,弃考研太意难平

社会日日鲜
2026-04-16 09:41:19
尼格买提刚刚晒照片:别染发!

尼格买提刚刚晒照片:别染发!

深圳晚报
2026-04-15 23:30:31
石油涨价,正把国产车送上「霸主」地位?

石油涨价,正把国产车送上「霸主」地位?

道总有理
2026-04-15 19:11:42
英军上将警告:若台海开战,英军将同时打击中俄,重点对付中!

英军上将警告:若台海开战,英军将同时打击中俄,重点对付中!

别吵吵
2026-04-15 09:49:16
“你真美,是不是嫌我老?”:手机被没收后,女子用手表录16分钟

“你真美,是不是嫌我老?”:手机被没收后,女子用手表录16分钟

江山挥笔
2026-04-14 10:48:18
美国惊闻噩耗,中国刚刚发布的20条条例,可斩断其“长臂”

美国惊闻噩耗,中国刚刚发布的20条条例,可斩断其“长臂”

花寒弦絮
2026-04-16 23:04:35
叶卫东任上海建工集团党委书记,并提名任董事长

叶卫东任上海建工集团党委书记,并提名任董事长

澎湃新闻
2026-04-16 17:20:26
88岁谢贤被疑三胎生父,因过分宠溺张柏芝

88岁谢贤被疑三胎生父,因过分宠溺张柏芝

草莓信箱
2026-04-14 12:37:04
去年全球消失12家航空公司,中国4家上榜

去年全球消失12家航空公司,中国4家上榜

新浪财经
2026-04-16 01:16:08
打了45天,伊朗终于发现最大敌人不是美国,不是以色列,而是他们

打了45天,伊朗终于发现最大敌人不是美国,不是以色列,而是他们

面包夹知识
2026-04-15 15:32:31
华为Pura 90系列/Pura X Max价格预测:4199元起!

华为Pura 90系列/Pura X Max价格预测:4199元起!

CNMO科技
2026-04-16 17:38:01
马斯克亲自托举?数据显示Cybertruck近五分之一销量来自自家企业

马斯克亲自托举?数据显示Cybertruck近五分之一销量来自自家企业

财联社
2026-04-16 21:32:05
湖人首轮对阵火箭,季后赛还没开打,詹姆斯就已经赢了

湖人首轮对阵火箭,季后赛还没开打,詹姆斯就已经赢了

铁甲西奇
2026-04-16 14:41:55
“我女儿敢这样,腿给砸断”,宝妈晒2个女儿出门,装束让人怒了

“我女儿敢这样,腿给砸断”,宝妈晒2个女儿出门,装束让人怒了

蝴蝶花雨话教育
2026-04-10 13:01:09
中年男人最大的悲哀是什么?网友:我,中年女人,也对啥都没兴趣

中年男人最大的悲哀是什么?网友:我,中年女人,也对啥都没兴趣

带你感受人间冷暖
2026-04-10 01:21:44
学历暴雷?大学生哭诉:宿舍6个人只有一个找到月薪3500的工作!

学历暴雷?大学生哭诉:宿舍6个人只有一个找到月薪3500的工作!

黯泉
2026-04-16 20:23:10
2026-04-16 23:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14986文章数 66773关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

东北男子投诉公交提前发车丢工作 单位被施压将其解雇

头条要闻

东北男子投诉公交提前发车丢工作 单位被施压将其解雇

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰生意迷雾

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

艺术
游戏
本地
公开课
军事航空

艺术要闻

张大千『 花菓荟萃册』

T1选手被送花圈、网暴、堵大楼!官方怒发声明

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

封锁霍尔木兹海峡后 美释放双重信号

无障碍浏览 进入关怀版