网易首页 > 网易科技 > 网易科技 > 正文

一次能独立编程7小时!OpenAI发布GPT-5-Codex

0
分享至
核心提示
  • 01 OpenAI正式推出新一代AI模型GPT-5-Codex。作为GPT-5的专项优化版本,该模型针对“智能体编码”场景深度定制,凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务,旨在为开发者打造“虚拟编程伙伴”。
  • 02 该模型能持续数小时独立完成编码、测试、重构等复杂任务,其核心创新“自适应思考”能力可根据任务复杂度自主调整推理时间。
  • 03 该模型已全面集成于OpenAI的付费订阅服务中,所有付费ChatGPT用户均可使用,包括Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)等套餐。

9月16日消息,周一,OpenAI正式推出新一代AI模型GPT-5-Codex,为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务。

作为GPT-5的专项优化版本,GPT-5-Codex针对“智能体编码”场景深度定制,能够持续数小时独立完成复杂的编程任务,其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”,并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。

从9月15日起,GPT-5-Codex将陆续集成至Codex的全系列产品中,开发者可通过终端、集成开发环境(IDE)、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎,同时支持通过Codex命令行接口(CLI)和IDE插件在本地运行。

OpenAI表示,未来将在其应用程序编程接口(API)中增加该模型的选项,方便开发者更便捷地集成到现有应用或开发新应用。目前,所有付费ChatGPT用户,包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者,均可使用该模型。

自OpenAI于4月份推出开源CLI、5月份发布网页版以来,Codex在功能上持续演进。两周前,OpenAI将这些功能整合为与ChatGPT账户联通的统一体验,使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出,则在这一基础上进一步强化了其工程实践能力。

专属定制的智能编程引擎

与通用型GPT-5不同,GPT-5-Codex专为“智能体编码”优化,其本质是让AI智能体担任开发者的协作伙伴,能够独立完成编码、测试和修改等任务,单次持续工作时长可超过7小时。

这听起来与科技网站VentureBeat创始人马特·马歇尔(Matt Marshall)提出的“智能体群”趋势有相似之处,但侧重不同:后者强调多个(3个或更多)具备不同角色的智能体进行协同作业,而GPT-5-Codex则专注于提升单个智能体的深度工作能力。

OpenAI表示,GPT-5-Codex基于真实的工程任务训练,覆盖调试、添加测试、项目搭建和大规模重构等场景,特别在代码审查方面表现突出。它不仅能理解代码库结构,还能推理依赖关系并通过测试验证代码的正确性。

GPT-5-Codex的核心创新在于其“自适应思考”能力,即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务,响应速度较前代提升明显;而面对复杂项目时,它则能持续运行数小时。测试中,该模型曾独立完成了持续超过7小时的重构任务,通过多次迭代最终交付了可用的方案。

OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)指出:“GPT-5-Codex可在处理任务5分钟后,自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”,而是通过模型内生的训练过程实现,使开发者无需手动调整即可处理不同时长的任务。

目前,OpenAI内部已将GPT-5-Codex集成至代码审查流程,每日可发现数百个问题。值得注意的是,在此次发布前,Codex已基于通用GPT-5模型运行约一个月,而此次升级标志着其正式转向专为智能体软件工程打造的模型。

全链路开发生态升级

伴随着新模型的发布,Codex产品线也迎来多项功能增强:

· Codex CLI:已围绕智能体工作流全面重构。CLI允许开发者直接附加图像(如线框图或截图)、共享上下文,并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异(diff)格式展示,以及对更长会话的支持。OpenAI已将CLI开源,这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。

· Codex IDE插件:现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码,同时在云端与本地环境间切换时保持上下文一致,实现更顺畅的协作。OpenAI表示,该IDE插件已迅速成为最受欢迎的使用方式。

· Codex云端环境:在后台,OpenAI对底层架构进行了优化,使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项,并支持UI任务的截图处理。开发者可以将前端任务交给Codex,它会自动启动浏览器、检查进度,并将截图附加到GitHub的拉取请求中。此外,Codex还新增了直接输出截图的功能,开发者无需在本地运行代码即可直观确认结果。

· 代码审查自动化:在GitHub仓库中启用后,Codex会在拉取请求的各个阶段自动进行审查,发现问题并在同一讨论线程中提出修复建议,甚至可以直接应用修改。开发者还可请求专项审查,例如安全漏洞检测。与传统静态分析工具不同,Codex会获取完整的代码库,跨依赖关系进行推理,并在反馈前运行测试。

开发者反馈与内部应用

早期使用者的反馈显示,Codex正在改变开发工作流程。

Duolingo高级软件工程师亚纶·王(Aaron Wang)表示,Codex在后端代码审查中超越了其他工具,能发现兼容性问题和其他工具遗漏的缺陷。

维珍大西洋公司数据与AI副总裁理查德·马斯特斯(Richard Masters)指出,现在只需在拉取请求中留言,Codex几乎能即时生成更新,大幅减少沟通成本。

在Cisco Meraki,技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项,Codex还交付了经过充分测试的高质量代码。

Vanta公司高级人工智能与机器学习工程师凯文·罗伊尔(Kevin Royer)表示,Codex通过在后台处理任务并返回清晰易懂的反馈,有效帮助他保持工作的流畅性。

Ramp公司AI Dev X团队负责人奥斯汀·雷伊(Austin Ray)特别提到,Codex成功发现了一个被其他代码审查工具遗漏的活动错误。

在OpenAI内部,Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中,Codex的使用量增长达十倍,体现出其在内外部应用中的依赖度显著提升。

安全机制与定价策略

OpenAI强调,Codex始终运行于沙盒环境中,无论是在云端还是本地部署,默认均禁用网络访问。开发者可根据需要授权特定功能(如网络搜索或外部工具连接),但OpenAI仍建议部署前对Codex的输出结果进行人工审核。

此外,针对生物、化学等敏感领域,OpenAI将GPT-5-Codex归类为“高能力”模型,并已实施相应的保障措施以严格控制潜在风险。其定位并非取代人工代码审查,而是作为额外的质量保障层。

Codex已全面集成于OpenAI的付费订阅服务中,包括ChatGPT Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)、教育版(Edu)和企业版(Enterprise),但后两个版本尚未公开定价。

各版本的使用限制有所不同:Plus、Edu和Business版本每周提供有限次数的专注编程会话;Pro版本则支持跨多个项目的整周开发;Business版本提供可扩展的额外信用额度;Enterprise版本则为大型团队设计了共享信用池。

战略定位:与Copilot互补

通过GPT-5-Codex,OpenAI将Codex的定位提升为一个智能编程伙伴,远超传统的自动补全或调试工具。它能自适应不同规模的任务需求,自主决策工作时间,并深度集成到开发流程中,为开发者提供跨环境的一致体验。

值得注意的是,OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争,而是形成互补关系:开发者可同时使用两者,即Copilot专注于代码级的实时辅助,而Codex致力于更高阶的任务委托和自动化开发。(小小)

延伸阅读
相关推荐
热点推荐
每吃一次,大脑萎缩就快一步?劝告:这3物是老年痴呆“催化剂”

每吃一次,大脑萎缩就快一步?劝告:这3物是老年痴呆“催化剂”

坠入二次元的海洋
2025-09-18 12:25:03
沈阳太二酸菜鱼被曝已全部闭店,客服:属实,最近一家闭店时间是9月1日

沈阳太二酸菜鱼被曝已全部闭店,客服:属实,最近一家闭店时间是9月1日

极目新闻
2025-09-16 14:37:26
美国驻武汉总领事馆现招聘警卫一名工资:RMB110,270

美国驻武汉总领事馆现招聘警卫一名工资:RMB110,270

创作者_cLg1
2025-09-16 15:42:57
美联储降息,中国资产要涨了?普通人应该怎么买?

美联储降息,中国资产要涨了?普通人应该怎么买?

混知房产
2025-09-18 07:01:15
这位意大利摄影师的街头作品让人震撼!你绝对想不到

这位意大利摄影师的街头作品让人震撼!你绝对想不到

国际艺术大观
2025-09-18 18:21:33
A股涨到3899点回落,做好准备了,不出所料,明天大概率会这样走

A股涨到3899点回落,做好准备了,不出所料,明天大概率会这样走

小嵩
2025-09-18 14:49:28
刚查了下于朦胧的遗产情况,真是不看不知道,一看吓一跳

刚查了下于朦胧的遗产情况,真是不看不知道,一看吓一跳

小光侃娱乐
2025-09-15 09:00:14
高下立判!郝龙斌反悔引质疑,郑丽文机会来了,第二个卢秀燕出现

高下立判!郝龙斌反悔引质疑,郑丽文机会来了,第二个卢秀燕出现

科普100克克
2025-09-18 20:05:15
当色情行业赚不到钱时,经济真的该警惕了?

当色情行业赚不到钱时,经济真的该警惕了?

流苏晚晴
2025-09-17 18:05:22
1963年出生!这位广东的正局级干部被查!

1963年出生!这位广东的正局级干部被查!

知肇分子
2025-09-19 00:09:18
前所未有!俄军空袭刚开始,乌军就开始反击,直接与俄罗斯对轰!

前所未有!俄军空袭刚开始,乌军就开始反击,直接与俄罗斯对轰!

阿龙聊军事
2025-06-07 20:04:46
国安冲突全过程!惊心动魄40秒,亚冠变拳击台,对手挑事遭围殴

国安冲突全过程!惊心动魄40秒,亚冠变拳击台,对手挑事遭围殴

奥拜尔
2025-09-18 22:42:44
燃油车主请注意!10月1日车船税新政来袭,你的用车成本要变了

燃油车主请注意!10月1日车船税新政来袭,你的用车成本要变了

慧眼看世界哈哈
2025-09-17 05:19:02
他曾活埋5000多名红军,私吞十几箱财宝逃到国外,如今却被人歌颂

他曾活埋5000多名红军,私吞十几箱财宝逃到国外,如今却被人歌颂

健康快乐丁
2025-07-22 11:51:13
苹果承认 iPhone 17 系列、iPhone Air 相机故障,承诺尽快修复

苹果承认 iPhone 17 系列、iPhone Air 相机故障,承诺尽快修复

IT之家
2025-09-18 07:36:56
武汉一家五口移民加拿大,回国发现户籍被注销,全家堵派出所门口

武汉一家五口移民加拿大,回国发现户籍被注销,全家堵派出所门口

五元讲堂
2025-08-19 09:42:47
一夜之间,成千上万的小餐饮老板,仿佛约好了一样,集体“醒”了

一夜之间,成千上万的小餐饮老板,仿佛约好了一样,集体“醒”了

阿伧说事
2025-09-15 15:25:30
美国为什么禁止种植竹子?看后才知道,原来竹子比我们想象的可怕

美国为什么禁止种植竹子?看后才知道,原来竹子比我们想象的可怕

风眼军情
2025-09-04 20:32:02
9月19日世锦赛赛程出炉,央视直播,中国田径队冲击金牌

9月19日世锦赛赛程出炉,央视直播,中国田径队冲击金牌

老牛体育解说
2025-09-19 01:05:40
华为突然官宣:9月18日,全面降价!

华为突然官宣:9月18日,全面降价!

科技堡垒
2025-09-18 12:20:20
2025-09-19 04:12:49

科技要闻

英伟达50亿美元投资英特尔,但代工免谈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

体育要闻

身高170的他,让196的博尔特坐不住了

娱乐要闻

最美央视才女,甩掉孙红雷嫁给张嘉益

财经要闻

起底多校“发臭午餐”供应商绿捷

汽车要闻

女神代言/新增配色/智能升级 26款腾势N9售38.98万起

态度原创

游戏
家居
时尚
公开课
军事航空

魔兽怀旧服:HRS下周正式开放,玩家用脚投票,时光徽章暴跌!

家居要闻

多维交集 简意雅情结合

秋冬穿对红黄橙,温暖又高级

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

哈马斯高层在多哈遇袭后首次现身

无障碍浏览 进入关怀版
×