网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

收手吧GPT-5-Codex，外面全是AI编程智能体！

2025-09-16 09:43:38　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：定慧

【新智元导读】OpenAI重磅推出GPT-5-Codex，专为智能体编程设计，显著提升代码重构、审查和缺陷发现的表现。其动态资源分配机制让模型在低负载请求中更高效，在复杂任务中更深入。2025编程智能体大战全面升温，GPT-5-Codex能否突围？

刚刚，GPT-5「船新」版本上线！

这次OpenAI直接使用Codex品牌名称来作为新模型后缀，GPT-5-Codex！

新模型能力将更加擅长智能编码！

即使2025年只剩下三分之一，各家巨头在「编程智能体」的争夺依然是白热化啊！

OpenAI官博更是重新定义了「自动补全」，升级为「agent-complete」。

在OpenAI播客第六集中，总裁Greg与Codex负责人Thibault Sottiaux聊了很多关于GPT-5-Codex，以及到2030年软件开发可能会是「什么样子」。

首先来速通一下此次重大更新。

此次发布的GPT-5-Codex属于GPT-5的一个特殊版本，它专为智能体编程（agentic coding）重新设计。

GPT-5-Codex将具备全面的「双模」特长：

即时协作：与开发者实时配合，快速回答问题、修复小bug。

独立执行：能长时间自主推进复杂任务（如大规模重构、跨文件调试）。

简单说就是，GPT-5-Codex不仅快&而且更加可靠。

GPT-5-Codex的交互响应更灵敏，小任务几乎即时，大任务可持续执行数小时。

OpenAI内部测试可连续7小时完成大规模重构。

GPT-5-Codex三大性能全面提升

首先，在SWE-bench验证和代码重构任务上，GPT-5-Codex都超过了目前最先进的GPT-5-high。

尤其是在非常适合于真实世界任务的代码重构任务上，GPT-5-Codex的准确率达到了51.3%，远高于GPT-5-high的33.9%。

其次，GPT-5-Codex此次更新的关键特性就是「动态调整」资源！

根据OpenAI内部员工的使用数据，在按模型生成token量（含隐藏推理和最终输出）排序的后10%用户请求中，GPT‑5-Codex的token消耗量比GPT‑5减少93.7%，红色箭头处。

相反，在前10%的高复杂度请求中，GPT‑5-Codex会投入更多思考时间，其代码推理、编辑、测试和迭代的耗时达到两倍，黄色箭头处。

最后，这次的GPT‑5-Codex经过专门训练，非常擅于执行代码审查和发现关键缺陷。

按照OpenAI的说法，他们发现GPT‑5-Codex生成的评论更不容易出现错误或不重要的情况，从而让用户能将更多注意力集中在关键问题上，比如：

「不正确评论」显著降低：从13.7%降至4.4%。
「高影响力评论」显著增加：从39.4%提升到52.4%
「聚焦关键重点」：平均每个PR提出的评论数从1.32降至0.93

此消彼长，这让Vibe Coding更加接近于严肃的工程化编程！

为何用Codex命名？

在GPT-5-Codex的「发布会」上，Greg聊到了Codex的起源。

最早在GPT-3时代，他们就发现模型能根据文档串（docstring）自动补全函数代码，他们认为当时就具备了「语言模型写代码」的可行性。

2021年，OpenAI就率先推出Codex，并与GitHub合作打造Copilot，探索AI直接嵌入开发工作流的可能性。

现在Codex的Web界面

Greg说编程一直是OpenAI特别关注的领域，专门使用代码数据和指标来优化模型表现，与其他领域不同。

早于Vibe Coding的Harness概念

在这次讨论中，Greg还用一个新的词语「Harness」来解释了OpenAI其实比流行的Vibe Coding更早就发现「用语言模型编程」的魔力。

「Harness」这个词原意是马具、缰绳，用来把马与车或骑手连接起来，使力量可以被控制和发挥。

OpenAI的Greg在讲Codex时借用这个词，表达类似的作用：

模型本身就像「马」或「大脑」，能产生力量（智能、输入输出）。
Harness就像「缰绳/集成框架」，把模型和外部环境（工具、IDE、终端、云端等）连起来，让它能真正执行任务、发挥效能。

在做普通语言模型应用时，接口（interface）或「缰绳」（harness）其实很简单——模型只是补全一段文字，最多再跟进一两次对话就结束了。

但在编程场景下，文本会「活起来」，因为代码需要真正被执行、需要和工具连接才能发挥作用。

因此，人们意识到，harness的重要性几乎和模型本身的智能同等关键，它决定了模型是否真的可用。

OpenAI所谓的harness，就是把模型与其余的基础设施整合起来，让模型能够真正地对环境采取行动。

性能与使用体验

这次GPT-5-Codex的延迟是一大亮点，代码补全必须<1.5秒，否则用户体验差。

GPT-5-Codex可以连续执行长时间任务，特别适合大型重构、迁移任务。

此次更新后还支持多模式交互：终端vibe coding、IDE编辑、GitHub集成、Cursor集成等，应有尽有，满足不同开发习惯。

OpenAI内部实践

除了GPT-5-Codex外，Greg还爆料了更多内幕。

OpenAI在内部实践中孵化了几款关键工具，帮助团队探索AI编程智能体的潜力。

首先是10x，一款内部原型，最初在终端运行，能显著提高开发效率。

它支持异步长时间执行，工程师甚至可以合上笔记本让任务继续运行，因此被认为带来「十倍生产力」，但因尚未打磨成熟而未对外发布。

其次是Agents.md，这是一个放在代码库里的说明文件，类似专门写给Codex的README。

它能压缩上下文，减少模型探索代码的负担，同时存放团队的开发偏好（如测试位置、风格约定）。这样 Codex 能更快理解项目环境，执行任务更高效。

最后是Code ReviewAgent，这是在内部试点后效果最惊艳的工具。

它能理解PR的意图与实现是否一致，检查依赖关系，发现人类审查可能遗漏的bug。

内部团队甚至在上线前一晚依赖它审查数十个PR，并几乎零bug发布。

讨论中也提到，2030年的软件开发将不再是「人写代码+工具辅助」，而是「AI写大部分代码+人类监督和设计架构」。

开发者更像是团队的指挥官，专注于战略性问题和创意设计，而繁琐、重复、危险的工作则由 AI 智能体承担。

收手吧，GPT-5-Codex

现在，编程智能体已经成为各大AI巨头的火力集中点，打得火热！

OpenAI此次发布GPT-5-Codex也是再次「官宣加入战场」。

但是，收手吧，外面已经全是编程智能体了！

让我们盘点一下国内外今年到底有多少编程智能体～

国外通用/主流编程AI智能体

Cursor：深度集成在IDE中，有agent模式，会检索本地代码, 能跨文件操作、项目级别重构等。
Claude Code CLI：代码diff、工具调用能力、原型快速实验。
Gemini CLI：优势在上下文窗口（context window）、处理大型代码库的重构能力强。
GitHub Copilot+Copilot 的扩展

国内代表性产品 /平台

国内在这个赛道加速也非常快，不少大厂都在做「编程智能体\编程模型」的组合，已经有很多专门用于编程的模型和产品。

腾讯的代码助手CodeBuddy
通义千问的Qwen3-Coder
字节的TRAE
百度的文心智能体平台
DeepSeek最新的V3.1系列

比如DeepSeek官方公告指出，V3.1在编程智能体和在命令行 / 终端环境下解决复杂任务中表现比之前的 DeepSeek系列模型有明显提升。

总体来看，虽然2025年被称为智能体之年，但主要还是聚焦在编程智能体。

国外市场以Cursor、Gemini CLI、Claude Code等为代表，强调模型执行力、重构大上下文处理、IDE/CLI无缝集成等能力。

而国内也同步推出同类型产品对标Cursor和Claude Code等产品。

GPT-5-Codex的上线，让这场「编程智能体大战」更加的白热化！

虽然OpenAI很早就洞察到「语言模型能编程」，但是：

AI编程IDE的认知被Cursor摘取了

AI编程CLI的认知被Claude Code拿到了。

而且国内还同步跟进了各种同类型的产品。

不知道这次起个大早，赶了晚集的GPT-5-Codex能不能拿下「AI智能体编程」的头衔～

参考资料：

https://openai.com/index/introducing-upgrades-to-codex/

https://x.com/sama/status/1967650108285259822

https://x.com/OpenAI/status/1967650096813871266

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Cursor不香了？前0.01%大神倒戈Claude，万字叛逃笔记爆火！

新智元 2026-01-24 17:03:52
7 跟贴 7
成本0.3美元，耗时26分钟！CudaForge：颠覆性低成本CUDA优化框架

机器之心Pro 2025-11-17 18:45:03
0 跟贴 0

文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

智东西 2026-01-24 10:40:07
2 跟贴 2

把它「画」进隐空间！新框架RoT探索大模型隐空间推理新范式

机器之心Pro 2026-01-23 17:21:24
0 跟贴 0
大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0

要把智能体消灭在萌芽状态

芳芳爱剪辑 2026-01-24 15:19:06
13 跟贴 13

陈天奇、贾扬清点赞：Vibe Coding版PyTorch，连论文都是AI写的

机器之心Pro 2026-01-23 16:51:26
1 跟贴 1
Redis之父：手写代码？醒醒吧除非你图一乐

新智元 2026-01-25 19:59:01
0 跟贴 0

为什么你用智能体总是翻车？

周鸿祎 2026-01-21 08:53:23
0 跟贴 0
专家：已有欧洲国家开始考虑"联合中国对抗美国"

澎湃新闻 2026-01-25 11:23:52
22049 跟贴 22049
智能体卷王诞生！干活自动配结项报告，1.5张截图就把事说清了

量子位 2026-01-10 14:38:21
10 跟贴 10
2026年，大模型训练的下半场属于「强化学习云」

机器之心Pro 2026-01-12 14:03:47
0 跟贴 0
让两个大模型在线吵架，跑通全网95%科研代码｜深势Deploy-Master

机器之心Pro 2026-01-09 14:22:47
0 跟贴 0
初中几何动点最值经典模型，构造等边三角形

天天数理学习分享 2026-01-22 11:08:18
5 跟贴 5
10%-90%原则：10%的需求，凭什么让90%的人买单？

人人都是产品经理社区 2026-01-25 10:10:15
0 跟贴 0
斯坦福×英伟达发布AI推理新范式，刷新了多领域SOTA

新智元 2026-01-25 19:58:42
0 跟贴 0
MP5冲锋枪：从巅峰到淡出，不是失败儿是迭代！

科技树科普 2026-01-24 09:58:45
1 跟贴 1
MiniMax来承包你的桌面了-4

机器之心Pro 2026-01-20 20:19:42
0 跟贴 0
2026豆包封神润色指令随便套就能让文案秒变高级

AI智能体 2026-01-25 23:48:19
0 跟贴 0
20+ 鱼皮原创项目教程，春招有救了！

程序员鱼皮 2026-01-25 11:08:04
0 跟贴 0
U23国足主帅即将成为国奥主帅 2年后将挑战40年"魔咒"

澎湃新闻 2026-01-25 14:07:05
1180 跟贴 1180
周鸿祎预言颠覆认知 2026年全世界或将突破100亿个智能体百亿级公司在AI领域都算小公司

快科技 2026-01-25 04:10:27
0 跟贴 0
用TRAE Skills构建你的10倍效能工具箱-3

机器之心Pro 2026-01-22 14:24:16
0 跟贴 0
SOLO Coder 在现有项目基础上继续完善功能、修复问题

机器之心Pro 2025-11-13 14:18:40
0 跟贴 0
袁家军、胡衡华，共同为重庆两江新区行政区揭牌

新京报政事儿 2026-01-25 12:56:14
19 跟贴 19
美国运动员霍诺德成功徒手攀爬508米高台北101，耗时约1小时31分钟

潇湘晨报 2026-01-25 12:00:17
6976 跟贴 6976
时空编码：黑洞视界的二维全息图

老友地理 2026-01-25 00:24:31
1 跟贴 1
三维空间太难懂？2

机器之心Pro 2025-12-31 13:49:19
0 跟贴 0
一场8年谋局，让阿里市值涨了1000亿

虎嗅APP 2026-01-25 19:22:59
6 跟贴 6
实测实在Agent与Manus，谁更懂中国职场？

数据猿DataYuan 2026-01-22 18:36:40
0 跟贴 0
AI开始指挥人类写代码，记忆也能永存了？全球顶级资本涌入

究竟视频 2026-01-22 03:32:22
0 跟贴 0
智能体基础设施是AI时代操作系统，真正的智能体要能思考、能分析，能行动

量子位 2025-12-11 03:38:22
0 跟贴 0
严肃版AI编程助手 GitHub星标3k+

量子位 2025-12-08 15:29:06
0 跟贴 0
Claude Code之父，推特亲传使用技巧，超 500 万人关注

机器之心Pro 2026-01-05 13:26:18
0 跟贴 0
还以为AI只会聊天？它已经进化成能“主动做事”的智能体了！看完视频后，你希望哪个领域最先应用这样的...

健康报 2026-01-24 07:40:21
0 跟贴 0
开源AI编程工具CoStrict，GitHub星标3K+

量子位 2025-12-09 01:52:08
0 跟贴 0
开源鸿蒙重写世界，从一行微小的代码开始

量子位 2025-12-31 01:50:02
0 跟贴 0
现代汽车机器人2028年进工厂，工会：别抢我饭碗！

热点科技 2026-01-23 09:07:38
0 跟贴 0
开启存储下一个大机会！韩媒详解黄仁勋“神秘推理上下文内存平台”

华尔街见闻官方 2026-01-25 13:26:25
2 跟贴 2
永州队输了，永州赢了

三湘都市报 2026-01-25 13:16:53
14 跟贴 14

92年，成都军区司令员张太恒去北京开会，却被中央降职调去了南京

92年，成都军区司令员张太恒去北京开会，却被中央降职调去了南京

禾所思

2024-12-30 11:39:32

美媒哀叹时局大变，呛声特朗普不争气，不过一年就对中国举白旗

美媒哀叹时局大变，呛声特朗普不争气，不过一年就对中国举白旗

通文知史

2026-01-24 22:35:03

2-0爆大冷！中国金花爆发横扫世界第13，莎娃曾断言她必成世界第1

2-0爆大冷！中国金花爆发横扫世界第13，莎娃曾断言她必成世界第1

安海客

2026-01-25 11:38:30

中国存在“两大威胁”，一个台湾，另一个则曾需百万大军才镇住

中国存在“两大威胁”，一个台湾，另一个则曾需百万大军才镇住

无情有思ss

2026-01-23 08:30:45

马斯克预言成真：欧美加价疯抢中国20万变压器，订单排到2029年

马斯克预言成真：欧美加价疯抢中国20万变压器，订单排到2029年

坠入二次元的海洋

2026-01-26 00:45:59

装逼撞到你擅长的领域是啥体验？网友：我曾经也干过这种事呀

装逼撞到你擅长的领域是啥体验？网友：我曾经也干过这种事呀

夜深爱杂谈

2025-12-21 17:57:28

拒挂国旗、订单全给日韩,被停止合作封锁航线的长荣,今咎由自取

拒挂国旗、订单全给日韩,被停止合作封锁航线的长荣,今咎由自取

番茄说史聊

2026-01-21 10:06:55

华西村的金牛，现在看来真是一次成功的投资

华西村的金牛，现在看来真是一次成功的投资

次元君情感

2026-01-25 02:45:28

英超巨大争议！坎沃乌龙助攻后送点，手球尺度成疑，曼城太冤了

英超巨大争议！坎沃乌龙助攻后送点，手球尺度成疑，曼城太冤了

奥拜尔

2026-01-25 23:31:44

谁还记得曾经的顶流——郑爽，如今面相已沦为路人！

谁还记得曾经的顶流——郑爽，如今面相已沦为路人！

田心生活

2026-01-08 01:17:30

不敢置信！女子十二乐坊成员直播养不活自己，一晚上打赏不到3000

不敢置信！女子十二乐坊成员直播养不活自己，一晚上打赏不到3000

云中浮生

2026-01-24 21:37:46

昆明1W以上的工作都是干什么的？

昆明1W以上的工作都是干什么的？

夜深爱杂谈

2026-01-25 19:11:01

陪玩陪睡不够！集体开嫖、舔手指、目无王法，阴暗面彻底藏不住了

陪玩陪睡不够！集体开嫖、舔手指、目无王法，阴暗面彻底藏不住了

好贤观史记

2025-11-09 21:58:39

为何中国军力吓不倒日本，石破茂说得一针见血，还会走老路的

为何中国军力吓不倒日本，石破茂说得一针见血，还会走老路的

瑛派儿老黄

2025-12-02 21:11:13

“特朗普和企鹅漫步格陵兰岛”图遭群嘲！白宫发文：“企鹅从不在意那些无法理解它的人的看法”

“特朗普和企鹅漫步格陵兰岛”图遭群嘲！白宫发文：“企鹅从不在意那些无法理解它的人的看法”

都市快报橙柿互动

2026-01-25 17:50:22

网友：朋友说他听“听风的蚕”涨了好多见识，我果断与他断了往来

网友：朋友说他听“听风的蚕”涨了好多见识，我果断与他断了往来

读鬼笔记

2026-01-22 19:46:15

攀岩大神成功登顶台北101大楼，无保护自由独攀，耗时仅1小时35分

攀岩大神成功登顶台北101大楼，无保护自由独攀，耗时仅1小时35分

译言

2026-01-25 11:38:32

叶一茜母女体验簪花，18岁森碟温婉可人，淑女范十足！

叶一茜母女体验簪花，18岁森碟温婉可人，淑女范十足！

小小一米月儿

2026-01-25 00:25:05

张又侠发表署名文章

上观新闻

2025-11-12 08:41:04

布鲁克林手撕爹妈愚蠢至极，岳父大人的狠毒用心，他是一点看不懂

布鲁克林手撕爹妈愚蠢至极，岳父大人的狠毒用心，他是一点看不懂

情感大头说说

2026-01-25 07:05:56

AI产业主平台领航智能+时代

14411文章数 66530关注度

往期回顾全部

科技要闻

黄仁勋在上海逛菜市场，可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业不到2个月赚了6千

体育要闻

中国足球不会一夜变强，但他们已经创造历史

娱乐要闻

央八开播杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光新车将于一季度正式发布

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

数码

时尚

健康

家居要闻

在家度假 160平南洋混搭宅

教育要闻

西藏考生必看！合肥工业大学招生计划揭秘

数码要闻

AMD最强APU更新！锐龙AI Max+ 400详细规格曝光：5.2GHz CPU、3.0GHz GPU

看了鲁豫对章小蕙的采访，最大感触是这一点

耳石脱落为何让人天旋地转+恶心？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版