网易首页 > 网易号 > 正文 申请入驻

新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了

0
分享至

就在 Anthropic Claude 陷入降智风波时,OpenAI 刚刚推出了 GPT-5-Codex——这是基于 GPT-5 优化后的 Codex 专用版本,专门针对「自主编程」进行了训练。

这次升级确实有些分量。

聚焦于真实的软件工程场景的 GPT-5-Codex,不仅能处理日常的编程交互,还能独立完成复杂耗时的工程项目。


它能像真正的程序员一样,连续工作超过 7 个小时,在复杂项目上不断迭代、修 bug、跑测试,最后交付一个完整可用的解决方案。

从四月份推出 CLI 版本,到五月份上线网页版,再到现在的全面升级,Codex 就是要把编程这件事彻底「自动化」。

现在无论你在终端、IDE、网页还是手机上开发,Codex 都能提供一致的编程辅助体验,而且已经整合进 ChatGPT 账号体系,本地和云端可以无缝切换。





向左滑动查看更多内容

根据介绍,GPT-5-Codex 最有意思的特性是「动态思考」能力。它能够根据任务复杂度灵活调整处理时间。

OpenAI 内部员工使用数据显示,按模型生成的 token 数排序,对于最底部 10% 的简单请求,GPT-5-Codex 比 GPT-5少用了 93.7% 的计算资源。


相反,对于最顶部 10% 的复杂请求,它会花费大约两倍的时间进行推理、代码编辑、测试和迭代。这意味着日常聊天和小任务响应会更快,而复杂的大型重构则会投入更多时间深度处理。

用人话说就是:日常小问题不磨蹭,大项目该花时间就花时间。终于有个编程模型懂得「好钢用在刀刃上」了。

基准测试方面,在 GPT-5 发布时,OpenAI 只在 477 个 SWE-bench Verified 任务上报告结果,在被 Anthropic 指出这一问题后,今天 OpenAI 算是长记性了。

他们表示这些问题已经修复,现在可以在全部 500 个任务上报告结果。结果如下:


代码重构评测更是涵盖了 Python、Go 甚至 OCaml 等语言,比如一个来自 Gitea 的 pull request 案例,修改了 232 个文件、3541 行代码,将 ctx 变量贯穿到应用逻辑中。

代码审查功能也很实用,它会在代码库中浏览分析,运行测试验证正确性,给出的审查意见准确性不错。在 OpenAI 内部,Codex 现在会审查大部分 PR,每天能发现数百个问题,很多时候比人工审查更早发现潜在 bug。


前端开发支持同样到位,GPT-5-Codex 不仅能创建桌面应用,移动端开发能力也有明显提升。它还能读取截图和设计稿,检查开发进度,把工作成果可视化展示,这对前端开发确实很有帮助。

工具层面的更新也相当丰富。全新改造的 Codex CLI 现在围绕自主编程流程重构,支持直接附加和分享图片,包括截图、线框图和架构图,用于建立对设计决策的共同理解。


处理复杂任务时,Codex 会通过待办清单跟踪进度,内置了网页搜索、MCP 等工具连接外部系统。

审批模式简化为三种:只读模式需要显式批准,自动模式对工作区有完整访问权限但工作区外需要批准,完全访问模式可以在任意位置读取文件并运行带网络访问的命令。

全新的 IDE 插件支持 VS Code、Cursor 等编辑器,让用户能无缝预览本地修改并与 Codex 协作编辑代码。插件还支持在云端与本地环境间流畅切换,可以直接在编辑器中创建云端任务、跟踪进行中的工作,以及审查已完成的任务。

云端基础设施也有明显改进,通过容器缓存将新任务和后续任务的中位完成时间缩短了 90%。Codex 能自动设置运行环境,扫描常见初始化脚本并执行,在配置网络访问权限时还能运行 pip install 等命令按需安装依赖。


安全方面,OpenAI 采用了沙箱运行环境,默认禁用网络访问,确保不会在用户电脑上执行有害操作,同时降低提示注入风险。

开发者可以根据风险承受度自定义安全设置,在云端可以限制网络访问只允许可信域名,在 CLI 和 IDE 插件中可以批准命令、允许全权限运行或使用网页搜索、连接 MCP 服务器。

与 GPT-5 管理方式一致,GPT-5-Codex 在生物与化学领域被归类为高能力模型,已采取相应安全措施。

价格上,Codex 已经集成到 ChatGPT 的各个付费套餐中,不同套餐提供不同的使用额度。

Plus、Edu 和 Business 适合每周几次专注的编程会话;

Pro 则能支持跨多个项目的一整周工作量。

Business 套餐可以购买额外额度,帮助开发者突破包含的上限;Enterprise 套餐则提供共享额度池,只需为团队实际使用部分付费。

对于使用 API key 的开发者,OpenAI 计划很快在 API 中开放 GPT-5-Codex。


值得一提的是, 目前 GPT-5-Codex 的系统提示词已经被网友扒出, 只有原始 GPT-5 的三分之一, 感兴趣的开发者可以研究一下。

系统提示词地址:

https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex\_Sep-15-2025.md


知名博主 Dan Shipper 在体验完 GPT-5-Codex 之后,给出的评价是:

我们在 @every 上测试了几天,结果相当震撼:

- 它会根据任务动态选择「思考」时间——难题上能长时间工作,简单问题则能即时给出答案。

- 在我们的生产代码库测试中,它可以自主运行 长达 35 分钟 ——相比之下,GPT-5 往往过于谨慎,这是一次明显的升级。

- 它支持 本地与网页开发环境的无缝切换。你可以在 VS Code 中启动一个任务,然后在去购物时把它交给 Codex Web 继续完成。

- 它配备了 代码审查智能体,会真正运行你的代码,因此能发现更多 bug。

以下是我们经过大量内部测试后的整体感受:

- 这是一次非常出色的升级,让 Codex CLI 成为了 Claude Code 的有力替代品。

- 不过,它需要合理的提示才能表现出最佳效果。比如 @kieranklaassen 最多只能让它运行 5 分钟,而 @DannyAziz97 找到了诀窍。

- 有时候它会「偷懒」——在某些任务上可能思考不足,或者如果认为任务过大就会直接拒绝。

- 我整个周末都在用 Codex CLI 为 @CoraComputer 提交一个新的 PR,体验下来发现它非常好用、易于引导——这是一个很棒的模型。


OpenAI Codex 产品负责人 Alexander Embiricos 表示,性能的大幅提升主要归功于 GPT-5-Codex 动态的「思考能力」。

Embiricos 解释说,GPT-5-Codex 的工作方式类似,但它内部没有路由器,而是能实时调整在某项任务上投入的时间。

Embiricos 指出,这比路由机制更具优势:后者在一开始就必须决定要为某个问题分配多少算力和时间,而 GPT-5-Codex 则可以在处理任务 5 分钟后决定「还需要再多花一个小时」。

最近几个月,几乎所有 AI 大厂的重磅更新都指向同一个方向——编程能力。相比之下,如果你仔细观察就会发现,针对普通用户的「优化」其实是在不断减少。

表面上看,这可能是因为面向普通消费者的 AI 产品已经陷入瓶颈期。聊天、写文案、做翻译,这些功能已经比较成熟,很难再有突破性进展。

但更深层的原因,还是绕不开商业逻辑。

开发先进的 AI 模型本就需要天文数字的巨额投入,这些成本总要有人承担。与其指望海量低付费用户慢慢回血,不如直接锁定那些真正愿意掏钱的高价值客户。而程序员是最愿意为 AI 工具付费、且粘性较高的群体之一。


新模型上线不久后, OpenAI CEO 山姆・奥特曼兴奋地透露,GPT-5-Codex 已经占据了 Codex 总流量的近四成,他判断在今天之内,这个比例就会反超,成为平台的主要来源。

从这个角度来说,放弃技术平权的营销叙事,AI 的未来可能比我们想象的更加「精英化」。这不一定是坏事,但至少我们应该对此有清醒的认识。

附上 OpenAI 博客地址:

https://openai.com/index/introducing-upgrades-to-codex/

封面来自:ZDNET

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大陆建那么多055驱逐舰干嘛?台名嘴:想去美国近海浪一浪吗?

大陆建那么多055驱逐舰干嘛?台名嘴:想去美国近海浪一浪吗?

文史旺旺旺
2025-09-15 23:22:08
同样是“预制菜”风波,对比汪小菲和贾国龙的做法,差别就出来了

同样是“预制菜”风波,对比汪小菲和贾国龙的做法,差别就出来了

科学发掘
2025-09-16 15:34:41
柯文哲案是否为政治迫害?最新民调出炉,郭正亮评:很严重

柯文哲案是否为政治迫害?最新民调出炉,郭正亮评:很严重

海峡导报社
2025-09-16 07:24:06
某高管:除非他大幅下滑或湖人夺冠 我认为詹姆斯会打到26-27赛季

某高管:除非他大幅下滑或湖人夺冠 我认为詹姆斯会打到26-27赛季

直播吧
2025-09-17 06:42:04
德泽尔比谈点球:可耻!绝非点球,就算获点是我们我也这样说

德泽尔比谈点球:可耻!绝非点球,就算获点是我们我也这样说

直播吧
2025-09-17 06:35:07
杨振宁的“长寿秘诀”,最核心的并不是多运动、喝水,而是这4点

杨振宁的“长寿秘诀”,最核心的并不是多运动、喝水,而是这4点

知鉴明史
2025-08-17 12:00:06
央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

大鱼简科
2025-09-02 19:34:00
朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

猫眼观史
2024-03-25 14:31:14
“央视一哥”康辉,丁克一辈子,却在四十岁接到一通电话让他后悔

“央视一哥”康辉,丁克一辈子,却在四十岁接到一通电话让他后悔

有范又有料
2025-09-04 09:25:49
48岁经理被裁员,获240万补偿后删310位前同事,领导傻眼了

48岁经理被裁员,获240万补偿后删310位前同事,领导傻眼了

朝暮书屋
2025-07-15 18:26:42
这一次,西贝贾国龙一反常态,罗永浩的一句话,给了他最后的体面

这一次,西贝贾国龙一反常态,罗永浩的一句话,给了他最后的体面

小丸子的娱乐圈
2025-09-16 19:34:53
“超越德国,中国内地首次跻身全球前十”

“超越德国,中国内地首次跻身全球前十”

观察者网
2025-09-16 21:31:03
收入1万以下的夫妻,吵架基本为了钱;收入1万以上的家庭,则是..

收入1万以下的夫妻,吵架基本为了钱;收入1万以上的家庭,则是..

诗词中国
2025-09-05 18:16:42
必有一战!

必有一战!

求实处
2025-09-17 00:02:06
王彬彬:实际上已出现研究生总体质量低于本科生的状况

王彬彬:实际上已出现研究生总体质量低于本科生的状况

尚曦读史
2025-09-16 09:54:02
惊爆!张雨绮直播卖内裤引热议,是她穿过的内裤?网友:真不尴尬吗?

惊爆!张雨绮直播卖内裤引热议,是她穿过的内裤?网友:真不尴尬吗?

八卦王者
2025-09-16 14:29:35
小县城的留守妇女,到底有多缺钱?

小县城的留守妇女,到底有多缺钱?

英军眼
2025-07-30 14:55:01
火速和解!字母哥申京联合发声:体育意义是团结一心而非彼此分裂

火速和解!字母哥申京联合发声:体育意义是团结一心而非彼此分裂

罗说NBA
2025-09-17 05:39:46
89岁谢贤生活近况曝光:四名工人24小时看护,王菲谢霆锋频繁探望

89岁谢贤生活近况曝光:四名工人24小时看护,王菲谢霆锋频繁探望

庭小娱
2025-09-16 19:21:18
一场1:2验出申花一大水货 斯卢茨基错用他成最大败笔 不能再用了

一场1:2验出申花一大水货 斯卢茨基错用他成最大败笔 不能再用了

零度眼看球
2025-09-17 06:20:59
2025-09-17 08:03:00
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
5671文章数 26644关注度
往期回顾 全部

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

以色列被认定为"种族灭绝" 多国寻求将其逐出联合国

头条要闻

以色列被认定为"种族灭绝" 多国寻求将其逐出联合国

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

游戏
亲子
旅游
家居
军事航空

《刺客信条:影》“淡路之爪”DLC试玩报告"/> 主站 商城 论坛 自运营 登录 注册 《刺客信条:影》“淡路之爪”DLC试玩报告:故事还未结束 ROO...

亲子要闻

宝宝:我有说我不招了吗?就直接给我上手段

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

家居要闻

江南秘境 理想生活模样

军事要闻

歼-20战机首次进行静态展示

无障碍浏览 进入关怀版