网易首页 > 网易号 > 正文 申请入驻

深夜突袭!OpenAI的AI程序员上线,人类仅需点按钮

0
分享至

智东西5月17日报道,刚刚,OpenAI推出一款基于云的软件工程Agent(智能体)——Codex的预览版。

Codex可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。

Codex由codex-1模型提供支持。codex-1是OpenAI o3针对软件工程优化后的版本。目前,Codex已面向ChatGPT Pro、Team和Enterprise用户上线,即将面向Plus用户上线。

OpenAI同步推出codex-1的精简版本,基于o4-mini专为轻量级开源编码Agent“Codex CLI”而打造,API定价为1.5美元/100万 tokens输入, 6美元/100万 tokens输出,即时缓存打七五折。

体验地址:https://chatgpt.com/codex

一、自己写代码提交更改,跑一次1-30分钟

现在,用户可以通过ChatGPT的侧边栏访问Codex,通过输入提示并点击“代码(Code)”按钮下达编程任务,也可以点击“Ask(提问)”向Codex询问有关代码库的问题。每个任务都在预加载了用户代码库的独立隔离环境中独立处理。

Codex可以读取和编辑文件,以及运行包括测试工具、类型检查器等在内的命令。任务完成通常需要1-30分钟,具体取决于复杂程度,用户可以实时监控Codex的进度。

Codex完成任务后,会在其环境中提交更改。通过引用终端日志和测试输出,Codex来提供其操作的可验证证据,让用户可以追踪任务完成过程中的每个步骤。

用户可以查看结果、请求进一步修订、提交GitHub拉取请求,或直接将更改集成到本地环境中。在产品中,用户可以配置Codex环境,使其尽可能与实际开发环境匹配。

Codex可以通过放置在用户代码库中的AGENTS.md文件进行引导。这些文本文件类似于README.md,用户可以在其中告知Codex如何导航代码库、运行哪些命令进行测试以及如何最好地遵循项目的标准实践。与人类开发人员一样,Codex在配置好开发环境、可靠的测试设置和清晰的文档后,性能最佳。

在编码评估和内部基准测试中,即使没有AGENTS.md文件或自定义代码生成器,codex-1也表现出强劲的性能。

23个无法在OpenAI内部基础架构上运行的SWE-Bench Verified样本被排除在外。codex-1的测试设置最大上下文长度为192k tokens,推理难度为中等,这也是目前产品中可用的设置。

二、报错自动告知用户,过程可检测

在安全和透明度方面,用户可以通过引用、终端日志和测试结果来检查Codex的工作。

当不确定或面临测试失败时,Codex会明确地告知这些问题,使用户能够就如何继续进行做出正确决策。

训练codex-1的主要目标,是让它的输出与人类的编程偏好和标准更接近。

如下图所示,与OpenAI o3模型相比,codex-1始终能够生成更清晰的补丁,可供立即进行人工审核并集成到标准工作流程中。

为了平衡安全性和实用性,Codex经过了训练,能够识别并精准拒绝旨在开发恶意软件的请求,同时清晰区分并支持合法任务;还增强了政策框架,并纳入了严格的安全评估。

Codex完全在云端安全隔离的容器中运行。

在任务执行期间,互联网访问被禁用,Agent的交互仅限于通过GitHub代码库明确提供的代码以及用户通过安装脚本配置的预安装项。Agent无法访问外部网站、API或其他服务。

三、Pro用户可免费体验,API收费1.5美元/100万 tokens输入

上个月,我们推出了Codex CLI,一款在终端中运行的轻量级开源编码Agent。它将o3和o4-mini等模型功能引入到用户的本地工作流程中。

今天,OpenAI还发布了codex-1的精简版本,这是专为Codex CLI使用而设计的o4-mini版本。

这个新模型支持CLI中更快的工作流程,并针对低延迟代码问答和编辑进行了优化,同时保留了指令遵循和样式方面的相同优势。它现在是Codex CLI中的默认模型,并在API中以codex-mini-latest的形式提供。

使用ChatGPT登录Codex CLI的Plus和Pro用户,今天晚些时候即可开始兑换价值5美元和50美元的免费API积分,有效期为30天。

对于使用codex-mini-latest构建的开发人员,该模型可在Responses API上使用,价格为1.5美元/100万 tokens(输入), 6美元/100万 tokens(输出),享受75%的即时缓存折扣。

OpenAI的技术团队已开始将Codex纳入其日常工具包。

工程师们最常使用它来卸载那些重复且范围明确的任务,例如重构、重命名和编写测试。它同样适用于构建新功能、连接组件、修复错误以及起草文档。

在发布之前,OpenAI还与一小群外部测试人员合作。

比如,思科​正在探索Codex如何帮助其工程团队更快地将想法付诸实践,并向OpenAI团队提供反馈;Temporal⁠使用Codex加速功能开发、调试问题、编写和执行测试以及重构大型代码库等。

根据早期经验,OpenAI建议同时将范围明确的任务分配给多个Agent,并尝试不同类型的任务和提示,以有效地探索模型的功能。

结语:Codex仍处早期阶段,未来或成主流

OpenAI坦言,Codex的开发仍处于早期阶段。作为研究预览版,它目前缺少一些功能,例如用于前端工作的图像输入,以及在Agent工作时对其进行方向修正的功能。此外委托给远程Agent比交互式编辑耗时更长,都需要时间改进。

这仅仅是一个开始,可以预测,Codex在ChatGPT中引入的异步多Agent工作流将成为工程师编写高质量代码的主流方式,实时配对和任务委托两种交互模式将逐渐融合。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
到底有多无知,才能做出这样的判决!

到底有多无知,才能做出这样的判决!

槽三刀
2026-03-25 22:01:04
姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

新民周刊
2026-03-26 19:12:17
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

英国那些事儿
2026-03-25 23:12:57
禁止将居民住宅专门用于安放骨灰!

禁止将居民住宅专门用于安放骨灰!

北青网-北京青年报
2026-03-26 16:11:05
官宣《浪姐7》遭全网抵制,49岁的范玮琪,终于迎来了“报应”!

官宣《浪姐7》遭全网抵制,49岁的范玮琪,终于迎来了“报应”!

阿纂看事
2026-03-26 20:49:43
翻到张雪峰2016年婚纱照,瞬间看哭了!

翻到张雪峰2016年婚纱照,瞬间看哭了!

魔都姐姐杂谈
2026-03-26 22:06:50
首个因中东战争宣布进入紧急状态的国家,为何是菲律宾?

首个因中东战争宣布进入紧急状态的国家,为何是菲律宾?

上观新闻
2026-03-26 19:36:04
塞尔维亚购买中国超音速导弹?国防部:正常军贸合作,不针对第三方

塞尔维亚购买中国超音速导弹?国防部:正常军贸合作,不针对第三方

澎湃新闻
2026-03-26 17:24:26
罗技中国致歉

罗技中国致歉

界面新闻
2026-03-26 23:25:51
网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

极目新闻
2026-03-26 17:01:19
苹果 Max 新品正式开售,3999 元起!

苹果 Max 新品正式开售,3999 元起!

科技堡垒
2026-03-26 11:36:39
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

洪观新闻
2026-03-26 10:56:49
本是状元郎,因慈禧不喜欢他的姓氏而落榜,没想到后来竟成主席

本是状元郎,因慈禧不喜欢他的姓氏而落榜,没想到后来竟成主席

黎庶文史
2026-03-25 23:58:02
清纯得不像动作片女一号!

清纯得不像动作片女一号!

贵圈真乱
2026-03-26 11:33:33
美团:2025年营收3,648.5亿元人民币 同比增长8.1%

美团:2025年营收3,648.5亿元人民币 同比增长8.1%

财联社
2026-03-26 17:40:04
突发!以色列彻底失控!

突发!以色列彻底失控!

财经要参
2026-03-26 21:58:11
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
盲目的大学扩招,正在反噬整个社会

盲目的大学扩招,正在反噬整个社会

凡人志
2026-03-25 01:34:53
2026-03-27 01:20:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11443文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
数码
游戏
旅游
军事航空

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版