网易首页 > 网易科技 > 网易科技 > 正文

一次能独立编程7小时!OpenAI发布GPT-5-Codex

0
分享至
核心提示
  • 01 OpenAI正式推出新一代AI模型GPT-5-Codex。作为GPT-5的专项优化版本,该模型针对“智能体编码”场景深度定制,凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务,旨在为开发者打造“虚拟编程伙伴”。
  • 02 该模型能持续数小时独立完成编码、测试、重构等复杂任务,其核心创新“自适应思考”能力可根据任务复杂度自主调整推理时间。
  • 03 该模型已全面集成于OpenAI的付费订阅服务中,所有付费ChatGPT用户均可使用,包括Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)等套餐。

9月16日消息,周一,OpenAI正式推出新一代AI模型GPT-5-Codex,为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务。

作为GPT-5的专项优化版本,GPT-5-Codex针对“智能体编码”场景深度定制,能够持续数小时独立完成复杂的编程任务,其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”,并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。

从9月15日起,GPT-5-Codex将陆续集成至Codex的全系列产品中,开发者可通过终端、集成开发环境(IDE)、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎,同时支持通过Codex命令行接口(CLI)和IDE插件在本地运行。

OpenAI表示,未来将在其应用程序编程接口(API)中增加该模型的选项,方便开发者更便捷地集成到现有应用或开发新应用。目前,所有付费ChatGPT用户,包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者,均可使用该模型。

自OpenAI于4月份推出开源CLI、5月份发布网页版以来,Codex在功能上持续演进。两周前,OpenAI将这些功能整合为与ChatGPT账户联通的统一体验,使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出,则在这一基础上进一步强化了其工程实践能力。

专属定制的智能编程引擎

与通用型GPT-5不同,GPT-5-Codex专为“智能体编码”优化,其本质是让AI智能体担任开发者的协作伙伴,能够独立完成编码、测试和修改等任务,单次持续工作时长可超过7小时。

这听起来与科技网站VentureBeat创始人马特·马歇尔(Matt Marshall)提出的“智能体群”趋势有相似之处,但侧重不同:后者强调多个(3个或更多)具备不同角色的智能体进行协同作业,而GPT-5-Codex则专注于提升单个智能体的深度工作能力。

OpenAI表示,GPT-5-Codex基于真实的工程任务训练,覆盖调试、添加测试、项目搭建和大规模重构等场景,特别在代码审查方面表现突出。它不仅能理解代码库结构,还能推理依赖关系并通过测试验证代码的正确性。

GPT-5-Codex的核心创新在于其“自适应思考”能力,即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务,响应速度较前代提升明显;而面对复杂项目时,它则能持续运行数小时。测试中,该模型曾独立完成了持续超过7小时的重构任务,通过多次迭代最终交付了可用的方案。

OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)指出:“GPT-5-Codex可在处理任务5分钟后,自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”,而是通过模型内生的训练过程实现,使开发者无需手动调整即可处理不同时长的任务。

目前,OpenAI内部已将GPT-5-Codex集成至代码审查流程,每日可发现数百个问题。值得注意的是,在此次发布前,Codex已基于通用GPT-5模型运行约一个月,而此次升级标志着其正式转向专为智能体软件工程打造的模型。

全链路开发生态升级

伴随着新模型的发布,Codex产品线也迎来多项功能增强:

· Codex CLI:已围绕智能体工作流全面重构。CLI允许开发者直接附加图像(如线框图或截图)、共享上下文,并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异(diff)格式展示,以及对更长会话的支持。OpenAI已将CLI开源,这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。

· Codex IDE插件:现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码,同时在云端与本地环境间切换时保持上下文一致,实现更顺畅的协作。OpenAI表示,该IDE插件已迅速成为最受欢迎的使用方式。

· Codex云端环境:在后台,OpenAI对底层架构进行了优化,使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项,并支持UI任务的截图处理。开发者可以将前端任务交给Codex,它会自动启动浏览器、检查进度,并将截图附加到GitHub的拉取请求中。此外,Codex还新增了直接输出截图的功能,开发者无需在本地运行代码即可直观确认结果。

· 代码审查自动化:在GitHub仓库中启用后,Codex会在拉取请求的各个阶段自动进行审查,发现问题并在同一讨论线程中提出修复建议,甚至可以直接应用修改。开发者还可请求专项审查,例如安全漏洞检测。与传统静态分析工具不同,Codex会获取完整的代码库,跨依赖关系进行推理,并在反馈前运行测试。

开发者反馈与内部应用

早期使用者的反馈显示,Codex正在改变开发工作流程。

Duolingo高级软件工程师亚纶·王(Aaron Wang)表示,Codex在后端代码审查中超越了其他工具,能发现兼容性问题和其他工具遗漏的缺陷。

维珍大西洋公司数据与AI副总裁理查德·马斯特斯(Richard Masters)指出,现在只需在拉取请求中留言,Codex几乎能即时生成更新,大幅减少沟通成本。

在Cisco Meraki,技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项,Codex还交付了经过充分测试的高质量代码。

Vanta公司高级人工智能与机器学习工程师凯文·罗伊尔(Kevin Royer)表示,Codex通过在后台处理任务并返回清晰易懂的反馈,有效帮助他保持工作的流畅性。

Ramp公司AI Dev X团队负责人奥斯汀·雷伊(Austin Ray)特别提到,Codex成功发现了一个被其他代码审查工具遗漏的活动错误。

在OpenAI内部,Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中,Codex的使用量增长达十倍,体现出其在内外部应用中的依赖度显著提升。

安全机制与定价策略

OpenAI强调,Codex始终运行于沙盒环境中,无论是在云端还是本地部署,默认均禁用网络访问。开发者可根据需要授权特定功能(如网络搜索或外部工具连接),但OpenAI仍建议部署前对Codex的输出结果进行人工审核。

此外,针对生物、化学等敏感领域,OpenAI将GPT-5-Codex归类为“高能力”模型,并已实施相应的保障措施以严格控制潜在风险。其定位并非取代人工代码审查,而是作为额外的质量保障层。

Codex已全面集成于OpenAI的付费订阅服务中,包括ChatGPT Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)、教育版(Edu)和企业版(Enterprise),但后两个版本尚未公开定价。

各版本的使用限制有所不同:Plus、Edu和Business版本每周提供有限次数的专注编程会话;Pro版本则支持跨多个项目的整周开发;Business版本提供可扩展的额外信用额度;Enterprise版本则为大型团队设计了共享信用池。

战略定位:与Copilot互补

通过GPT-5-Codex,OpenAI将Codex的定位提升为一个智能编程伙伴,远超传统的自动补全或调试工具。它能自适应不同规模的任务需求,自主决策工作时间,并深度集成到开发流程中,为开发者提供跨环境的一致体验。

值得注意的是,OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争,而是形成互补关系:开发者可同时使用两者,即Copilot专注于代码级的实时辅助,而Codex致力于更高阶的任务委托和自动化开发。(小小)

延伸阅读
相关推荐
热点推荐
恩里克:我们和阿森纳的差距很小;大巴黎知道如何准备决赛

恩里克:我们和阿森纳的差距很小;大巴黎知道如何准备决赛

懂球帝
2026-05-30 04:10:17
为什么和马英九关系闹僵?萧旭岑称和访问大陆有关,我国台办回应

为什么和马英九关系闹僵?萧旭岑称和访问大陆有关,我国台办回应

DS北风
2026-05-29 14:15:16
接近 3nm 顶尖工艺!韬定律落地麒麟 9050!华为 Mate90 系列定档 9 月发布!

接近 3nm 顶尖工艺!韬定律落地麒麟 9050!华为 Mate90 系列定档 9 月发布!

科技富能量官方
2026-05-28 19:06:31
震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

火山詩话
2026-05-28 15:07:01
29岁广西女孩木木离世:抗癌10个月,最后一夜陪练赚20元却被跑单

29岁广西女孩木木离世:抗癌10个月,最后一夜陪练赚20元却被跑单

行者聊官
2026-05-29 17:09:25
丁向群任国家金融监督管理总局党委书记

丁向群任国家金融监督管理总局党委书记

澎湃新闻
2026-05-29 19:26:32
曝30岁央美艺术家苏航出轨多人!将备注改成亲人,还拍下私密视频

曝30岁央美艺术家苏航出轨多人!将备注改成亲人,还拍下私密视频

裕丰娱间说
2026-05-28 12:44:39
72岁TVB绿叶在成都提新车,自曝已在当地买房,每年旅居住三个月

72岁TVB绿叶在成都提新车,自曝已在当地买房,每年旅居住三个月

树娃
2026-05-28 13:20:21
3-2!中超神剧情:1分钟对轰2球 升班马爆冷绝杀 传统豪门7轮1胜

3-2!中超神剧情:1分钟对轰2球 升班马爆冷绝杀 传统豪门7轮1胜

狍子歪解体坛
2026-05-29 21:35:15
巴萨怎么突然就有钱了?1.8亿欧连签2大射手,辅佐18岁亚马尔争冠

巴萨怎么突然就有钱了?1.8亿欧连签2大射手,辅佐18岁亚马尔争冠

夏侯看英超
2026-05-29 23:52:52
豪赌全明星!火箭重磅交易方案出炉,目标锁定骑士核心米切尔

豪赌全明星!火箭重磅交易方案出炉,目标锁定骑士核心米切尔

夜白侃球
2026-05-29 15:53:04
“女人两个坎,熬过就高寿”“两坎”是指哪两年?男女都要多关注

“女人两个坎,熬过就高寿”“两坎”是指哪两年?男女都要多关注

芹姐说生活
2026-05-29 20:58:00
新本田CR-V曝光,外观大变,内配竖向大屏,搭载2.0L混合动力系统

新本田CR-V曝光,外观大变,内配竖向大屏,搭载2.0L混合动力系统

沙雕小琳琳
2026-05-29 17:18:56
正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

健康科普365
2026-05-09 21:05:04
公安紧急通知!1960–1978年出生的人注意了,身份证过期能坑惨你

公安紧急通知!1960–1978年出生的人注意了,身份证过期能坑惨你

笑熬浆糊111
2026-05-30 01:39:26
西红柿的最佳搭配不是鸡蛋,而是它!夏天吃护血管,远离便秘

西红柿的最佳搭配不是鸡蛋,而是它!夏天吃护血管,远离便秘

芹姐说生活
2026-05-28 15:08:48
家长因孩子调座反复投诉威胁,小学女老师选择硬刚将家长告上法庭

家长因孩子调座反复投诉威胁,小学女老师选择硬刚将家长告上法庭

观世记
2026-05-27 16:38:57
小米宣布大降价,这玩意跌成白菜价了!

小米宣布大降价,这玩意跌成白菜价了!

XCiOS俱乐部
2026-05-28 15:08:32
爆拉150美元!一夜之间,黄金剧本全改了......

爆拉150美元!一夜之间,黄金剧本全改了......

口袋贵金属官方
2026-05-29 17:14:48
淮海战役惨败后,王凌云只身脱逃,隐姓埋名潜入深山娶了个村姑

淮海战役惨败后,王凌云只身脱逃,隐姓埋名潜入深山娶了个村姑

磊子讲史
2026-05-29 16:17:30
2026-05-30 05:03:01

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
亲子
旅游
数码
公开课

家居要闻

云栖 舒展如流云

亲子要闻

营养师家一周快手学生早餐:10分钟搞定,娃超爱!

旅游要闻

云南文旅数智升级,旅游小镇游客满意度提升超过30%

数码要闻

宏碁推多款游戏新品:两款笔记本、一款串流掌机,还有键盘、背包

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×