网易首页 > 网易号 > 正文 申请入驻

新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了

0
分享至

就在 Anthropic Claude 陷入降智风波时,OpenAI 刚刚推出了 GPT-5-Codex——这是基于 GPT-5 优化后的 Codex 专用版本,专门针对「自主编程」进行了训练。

这次升级确实有些分量。

聚焦于真实的软件工程场景的 GPT-5-Codex,不仅能处理日常的编程交互,还能独立完成复杂耗时的工程项目。它能像真正的程序员一样,连续工作超过 7 个小时,在复杂项目上不断迭代、修 bug、跑测试,最后交付一个完整可用的解决方案。

从四月份推出 CLI 版本,到五月份上线网页版,再到现在的全面升级,Codex 的——就是要把编程这件事彻底「自动化」。

现在无论你在终端、IDE、网页还是手机上开发,Codex 都能提供一致的编程辅助体验,而且已经整合进 ChatGPT 账号体系,本地和云端可以无缝切换。


GPT-5-Codex 最有意思的特性是「动态思考」能力。它能够根据任务复杂度灵活调整处理时间。

OpenAI 内部员工使用数据显示,按模型生成的 token 数排序,对于最底部 10% 的简单请求,GPT-5-Codex 比 GPT-5 少用了 93.7% 的计算资源。

相反,对于最顶部 10% 的复杂请求,它会花费大约两倍的时间进行推理、代码编辑、测试和迭代。这意味着日常聊天和小任务响应会更快,而复杂的大型重构则会投入更多时间深度处理。


用人话说就是:日常小问题不磨蹭,大项目该花时间就花时间。

终于有个编程模型懂得「好钢用在刀刃上」了。

基准测试方面,在 GPT-5 发布时,OpenAI 只在 477 个 SWE-bench Verified 任务上报告结果,在被 Anthropic 指出这一问题后,今天 OpenAI 宣布这些问题已经修复,现在可以在全部 500 个任务上报告结果。结果如下:


代码重构评测更是涵盖了 Python、Go 甚至 OCaml 等语言,比如一个来自 Gitea 的 pull request 案例,修改了 232 个文件、3541 行代码,将 ctx 变量贯穿到应用逻辑中。

代码审查功能也很实用,它会在代码库中浏览分析,运行测试验证正确性,给出的审查意见准确性不错。在 OpenAI 内部,Codex 现在会审查大部分 PR,每天能发现数百个问题,很多时候比人工审查更早发现潜在 bug。


前端开发支持同样到位,GPT-5-Codex 不仅能创建桌面应用,移动端开发能力也有明显提升。它还能读取截图和设计稿,检查开发进度,把工作成果可视化展示,这对前端开发确实很有帮助。

工具层面的更新也相当丰富。全新改造的 Codex CLI 现在围绕自主编程流程重构,支持直接附加和分享图片,包括截图、线框图和架构图,用于建立对设计决策的共同理解。


处理复杂任务时,Codex 会通过待办清单跟踪进度,内置了网页搜索、MCP 等工具连接外部系统。

审批模式简化为三种:只读模式需要显式批准,自动模式对工作区有完整访问权限但工作区外需要批准,完全访问模式可以在任意位置读取文件并运行带网络访问的命令。

全新的 IDE 插件支持 VS Code、Cursor 等编辑器,让用户能无缝预览本地修改并与 Codex 协作编辑代码。插件还支持在云端与本地环境间流畅切换,可以直接在编辑器中创建云端任务、跟踪进行中的工作,以及审查已完成的任务。

云端基础设施也有明显改进,通过容器缓存将新任务和后续任务的中位完成时间缩短了 90%。Codex 能自动设置运行环境,扫描常见初始化脚本并执行,在配置网络访问权限时还能运行 pip install 等命令按需安装依赖。


安全方面,OpenAI 采用了沙箱运行环境,默认禁用网络访问,确保不会在用户电脑上执行有害操作,同时降低提示注入风险。

开发者可以根据风险承受度自定义安全设置,在云端可以限制网络访问只允许可信域名,在 CLI 和 IDE 插件中可以批准命令、允许全权限运行或使用网页搜索、连接 MCP 服务器。

与 GPT-5 管理方式一致,GPT-5-Codex 在生物与化学领域被归类为高能力模型,已采取相应安全措施。

价格上,Codex 已经集成到 ChatGPT 的各个付费套餐中,不同套餐提供不同的使用额度。

  • Plus、Edu 和 Business 适合每周几次专注的编程会话;
  • Pro 则能支持跨多个项目的一整周工作量。

Business 套餐可以购买额外额度,帮助开发者突破包含的上限;Enterprise 套餐则提供共享额度池,只需为团队实际使用部分付费。对于使用 API key 的开发者,OpenAI 计划很快在 API 中开放 GPT-5-Codex。


目前 GPT-5-Codex 的系统提示词已经泄露,感兴趣的开发者可以研究一下。

系统提示词地址:https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex_Sep-15-2025.md

知名博主 Dan Shipper 在体验完 GPT-5-Codex 之后,给出的评价是:

我们在 @every 上测试了几天,结果相当震撼: - 它会根据任务动态选择「思考」时间——难题上能长时间工作,简单问题则能即时给出答案。 - 在我们的生产代码库测试中,它可以自主运行 长达 35 分钟 ——相比之下,GPT-5 往往过于谨慎,这是一次明显的升级。 - 它支持 本地与网页开发环境的无缝切换。你可以在 VS Code 中启动一个任务,然后在去购物时把它交给 Codex Web 继续完成。 - 它配备了 代码审查智能体,会真正运行你的代码,因此能发现更多 bug。 以下是我们经过大量内部测试后的整体感受: - 这是一次非常出色的升级,让 Codex CLI 成为了 Claude Code 的有力替代品。 - 不过,它需要合理的提示才能表现出最佳效果。比如 @kieranklaassen 最多只能让它运行 5 分钟,而 @DannyAziz97 找到了诀窍。 - 有时候它会「偷懒」——在某些任务上可能思考不足,或者如果认为任务过大就会直接拒绝。 - 我整个周末都在用 Codex CLI 为 @CoraComputer 提交一个新的 PR,体验下来发现它非常好用、易于引导——这是一个很棒的模型。

OpenAI Codex 产品负责人 Alexander Embiricos 表示,性能的大幅提升主要归功于 GPT-5-Codex 动态的「思考能力」。Embiricos 解释说,GPT-5-Codex 的工作方式类似,但它内部没有路由器,而是能实时调整在某项任务上投入的时间。

Embiricos 指出,这比路由机制更具优势:后者在一开始就必须决定要为某个问题分配多少算力和时间,而 GPT-5-Codex 则可以在处理任务 5 分钟后决定「还需要再多花一个小时」。他说,他见过该模型在某些情况下连续工作超过 7 小时。


最近几个月,几乎所有 AI 大厂的重磅更新都指向同一个方向——编程能力。相比之下,如果你仔细观察就会发现,针对普通用户的「优化」其实是在不断减少。

表面上看,这可能是因为面向普通消费者的 AI 产品已经陷入瓶颈期。聊天、写文案、做翻译,这些功能已经比较成熟,很难再有突破性进展。

但更深层的原因,还是绕不开商业逻辑。

开发先进的 AI 模型本就需要天文数字的巨额投入,这些成本总要有人承担。与其指望海量低付费用户慢慢回血,不如直接锁定那些真正愿意掏钱的高价值用户。而程序员是最愿意为 AI 工具付费、且粘性较高的群体之一。

从这个角度来说,放弃技术平权的叙事,AI 的未来可能比我们想象的更加「精英化」。这不一定是坏事,但至少我们应该对此有清醒的认识。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《鬼灭之刃》一来,年轻人又走进了电影院

《鬼灭之刃》一来,年轻人又走进了电影院

后浪电影
2025-11-16 10:06:20
王思聪新女友被曝光,陪逛街亲自拎包,没懒懒长得漂亮但身材超辣

王思聪新女友被曝光,陪逛街亲自拎包,没懒懒长得漂亮但身材超辣

千言娱乐记
2025-11-17 19:17:51
离谱!香港老戏骨被指欠债百亿,粗口回应,还拒转行当司机?

离谱!香港老戏骨被指欠债百亿,粗口回应,还拒转行当司机?

策略剖析
2025-11-18 13:28:24
比亚迪远程锁死印度电动大巴!看清印度宰客套路让其如意算盘落空

比亚迪远程锁死印度电动大巴!看清印度宰客套路让其如意算盘落空

诗意世界
2025-11-15 11:01:48
工龄40年,个人账户385565.08元,60岁2个月退休,养老金能拿多少?

工龄40年,个人账户385565.08元,60岁2个月退休,养老金能拿多少?

养老规划罗姐说
2025-11-16 19:54:29
约基奇轰36+18+13仍无缘今日最佳!对不起,你碰到暴走的马克西了

约基奇轰36+18+13仍无缘今日最佳!对不起,你碰到暴走的马克西了

世界体育圈
2025-11-18 12:45:59
高市早苗祸不单行!韩停合作、美军撤导弹,日本火山突然喷发!

高市早苗祸不单行!韩停合作、美军撤导弹,日本火山突然喷发!

观星赏月
2025-11-18 13:07:48
郭某刚案笔录披露:邻居证词透露关键信息,黑暗中申某良别无选择

郭某刚案笔录披露:邻居证词透露关键信息,黑暗中申某良别无选择

阿纂看事
2025-11-17 09:19:15
被抵毁的“东南互保”:实质是不抵抗的爱国

被抵毁的“东南互保”:实质是不抵抗的爱国

深度报
2025-11-17 23:00:01
张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

喜欢历史的阿繁
2025-11-18 13:18:51
广东6分险胜上海!宏远双少合砍51+16,朱正被打爆,杜锋开心鼓掌

广东6分险胜上海!宏远双少合砍51+16,朱正被打爆,杜锋开心鼓掌

多特体育说
2025-11-17 22:01:08
奋斗后发现大麻烦,网友:只要努力就必然负债!

奋斗后发现大麻烦,网友:只要努力就必然负债!

特约前排观众
2025-11-15 00:05:08
中日交涉开始,最大输家提前浮现,不是高市早苗,日本民调一边倒

中日交涉开始,最大输家提前浮现,不是高市早苗,日本民调一边倒

时时有聊
2025-11-17 20:11:23
开拓者官方:从发展联盟混音队召回中锋杨瀚森

开拓者官方:从发展联盟混音队召回中锋杨瀚森

北青网-北京青年报
2025-11-18 07:59:02
无论年轻时候多帅的男人,老了都会令人失望

无论年轻时候多帅的男人,老了都会令人失望

乡野小珥
2025-11-11 07:50:46
A股:全绿了,大跌的原因找到了,下午,或将迎来更大变盘?

A股:全绿了,大跌的原因找到了,下午,或将迎来更大变盘?

虎哥闲聊
2025-11-18 11:37:25
即将开建!重庆将新增一主题公园,明年6月全面完工

即将开建!重庆将新增一主题公园,明年6月全面完工

黄河新闻网吕梁频道
2025-11-18 11:05:46
官宅已被围,高市收辞职通牒,一个时代或结束,中方向钓鱼岛派人

官宅已被围,高市收辞职通牒,一个时代或结束,中方向钓鱼岛派人

小影的娱乐
2025-11-17 13:49:37
解晓东,经抢救无效去世!

解晓东,经抢救无效去世!

华人星光
2025-11-16 13:19:17
悬念已不大!欧洲直通世界杯12队基本确定,意大利附加赛对手如下

悬念已不大!欧洲直通世界杯12队基本确定,意大利附加赛对手如下

小火箭爱体育
2025-11-18 10:04:38
2025-11-18 14:28:49
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38038文章数 2600232关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

小伙和31岁女网友发生关系 婚礼上发现女方父母是演员

头条要闻

小伙和31岁女网友发生关系 婚礼上发现女方父母是演员

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

时尚
手机
本地
亲子
军事航空

听说冷帽是“美女检验神器”?

手机要闻

一加李杰透露Ace 6T搭载8开头大电池+ 100W快充

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

亲子要闻

“你知道孩子心中最害怕的是什么吗”,小孩哥分享五件最害怕父母做的事

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版