网易首页 > 网易号 > 正文 申请入驻

最强智能体编程模型!OpenAI重磅发布GPT-5.2 Codex

0
分享至


整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

当下,各家 AI 模型的能力还在你追我赶地往上「卷」,尤其是在编码领域。

就在今天,OpenAI 发布了智能体编程模型 Codex 的新版本——GPT-5.2 Codex,目标很直接:把更复杂、更耗时的软件工程工作,尽量交给 AI 来完成。

按照 OpenAI 的说法,GPT-5.2 Codex 是在 GPT-5.2 能力基础上的一次“强化升级”,重点补齐了几个工程里常见的痛点:长上下文处理、大规模代码重构、Windows 环境下的开发体验,以及网络安全相关能力。

从模型基准测试结果来看,这次更新也不只是“小修小补”。



更强的 GPT-5.2 Codex 来了

在衡量真实软件工程能力的 SWE-Bench Pro 测试中,GPT-5.2 Codex 拿下了 56.4% 的准确率,刷新了该基准的最高纪录,超过了目前已发布的其他编程模型。这一基准下,GPT-5.2 获得了 55.6% 的准确率,GPT-5.1 仅有 50.8%。

在 Terminal-Bench 2.0 中,它的成绩也达到了 64%,超过了 GPT-5.2 的 62.2% 和 GPT-5.1-Codex-Max 的 58.1%,该测试评估了智能体在真实终端环境下进行编译、训练和服务器配置的能力。

同时,模型的视觉能力也更强了,能更好地看懂屏幕截图、技术图表和用户界面,可以直接把设计稿转成可运行的原型。


OpenAI 在博客中反复强调,GPT-5.2 Codex 的核心目标是推动“软件工程”,而不仅仅是写几段代码。在工程实践中,设计、开发、测试、维护缺一不可,最终追求的是稳定、可靠、好维护、还能不断演进的软件。

在这些环节里,GPT-5.2 Codex 尤其擅长的一项能力是代码重构。简单说,就是在不加新功能的前提下,把代码写得更干净、更高效。OpenAI 举例称,这个模型可以调整代码结构,降低内存占用,或者让应用响应更快——这些往往是工程师最不想、但又不得不花时间做的事情。

从演进路线来看,GPT-5.2 Codex 也不是凭空出现的。在它之前,GPT-5-Codex、GPT-5.1-Codex-Max 已经在多步推理、长上下文理解,以及和开发工具协作方面持续打磨,而 5.2 版本正是在这些积累之上继续往前推了一步。

比如,得益于上下文压缩能力,GPT-5.2 Codex 在长时间、跨步骤的编程任务中更不容易“忘事”,能把复杂流程一口气跑完;在大规模代码库中,它对重构、迁移和新功能构建的支持也更成熟。此外,Windows 环境下的编程体验有所提升,并加入了更高级的安全能力,用于辅助漏洞发现、测试和缓解。


安全性进一步提升

除此之外,OpenAI 也特别提到,安全性是 AI 参与软件工程时绕不开的一环。企业级系统对稳定性和可靠性的要求极高,开发和安全团队在修复复杂漏洞时,既需要 AI 的帮助,也必须确保这些工具本身不会带来新的安全隐患。

这一次,在专业级 Capture-the-Flag(CTF)挑战赛中的 pass@12 成绩远超前几代模型,如 o3、GPT-5 和 GPT-5.1-Codex-Max。从 2025 年 4 月到 2026 年 1 月的走势图来看,它的能力呈指数级增长,但仍低于 OpenAI 定义的“高等级准备框架”门槛,因此官方在系统说明中设置了多层安全防护。


事实上,Codex 在安全方向上的潜力已经有过实际案例。本月早些时候,安全研究员 Andrew MacPherson 使用 GPT-5.1-Codex-Max 分析了 React 的一个漏洞(CVE-2025-55182)。他在博客中提到,模型通过多轮评估、模糊测试和漏洞利用分析相结合的方式,不仅帮助缓解了问题,还意外发现并修复了此前未被注意到的漏洞。

在 OpenAI 看来,GPT-5.2 Codex 的这些改进,能在现实中给企业带来直接价值:把最复杂、最重复的软件工程任务自动化,同时支持更复杂功能和更高等级的安全需求,帮助团队提高效率、减少人为失误,在激烈的工程竞争中保持优势。

这个模型是在竞争越来越激烈的情况下推出的。此前,OpenAI 内部就曾因为 Google 的 Gemini 3 进展而启动“红色警报”应对。GPT-5.2-Codex 可以在命令行工具(CLI)、IDE 插件、网页端、移动端以及 GitHub 代码审查中使用。

在发布节奏上,OpenAI 表示 GPT-5.2 Codex 即日起向所有付费 ChatGPT 用户开放。接下来一段时间,访问权限将扩展至 API 用户,同时还会推出一个仅限邀请的可信访问试点,面向经过审核、专注于防御型网络安全的安全专业人士。

更多关于 GPT-5.2 Codex 详见:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最新 | 突发讣告!知名企业创始人去世!

最新 | 突发讣告!知名企业创始人去世!

天津广播
2026-01-25 14:57:24
中国队获U23亚洲杯亚军,球员评分:2人满分,5人优秀,2人不及格

中国队获U23亚洲杯亚军,球员评分:2人满分,5人优秀,2人不及格

球场没跑道
2026-01-25 01:52:11
2024年诺贝尔文学奖《素食者》:你不吃肉,这世界的人就会吃掉你

2024年诺贝尔文学奖《素食者》:你不吃肉,这世界的人就会吃掉你

千秋文化
2026-01-25 10:43:19
向华强兄长出殡,向太陈岚爆已立遗嘱,曾狠批两个儿子难继承家业

向华强兄长出殡,向太陈岚爆已立遗嘱,曾狠批两个儿子难继承家业

一盅情怀
2026-01-25 19:00:08
伊朗国防部:伊朗的导弹防御能力得到加强

伊朗国防部:伊朗的导弹防御能力得到加强

财联社
2026-01-24 21:33:37
18岁身价5000万,却险些毁掉自己生涯,如今浪子回头闪耀法甲赛场

18岁身价5000万,却险些毁掉自己生涯,如今浪子回头闪耀法甲赛场

篮球圈里的那些事
2026-01-25 17:49:00
2000亿江苏国企换帅,人均薪酬约64万元

2000亿江苏国企换帅,人均薪酬约64万元

野火商经
2026-01-25 17:09:09
原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

另子维爱读史
2026-01-16 18:29:22
领导为什么通过一次谈话就知道你几斤几两?

领导为什么通过一次谈话就知道你几斤几两?

夜深爱杂谈
2026-01-24 21:42:12
特朗普自恋再升级,海湖庄园门前新路改名“特朗普大道”!

特朗普自恋再升级,海湖庄园门前新路改名“特朗普大道”!

世界探索者探索
2026-01-25 18:43:53
2-0爆大冷!中国金花爆发横扫世界第13,莎娃曾断言她必成世界第1

2-0爆大冷!中国金花爆发横扫世界第13,莎娃曾断言她必成世界第1

安海客
2026-01-25 11:38:30
年终奖八千同事七万,老板找我续约,我淡定递上离职信他慌了

年终奖八千同事七万,老板找我续约,我淡定递上离职信他慌了

晓艾故事汇
2026-01-06 09:08:51
美国22个州进入紧急状态 超13000架次航班被取消

美国22个州进入紧急状态 超13000架次航班被取消

每日经济新闻
2026-01-25 11:42:36
不满现有成绩,太阳报:200名本菲卡球迷闯入基地与穆帅对峙

不满现有成绩,太阳报:200名本菲卡球迷闯入基地与穆帅对峙

懂球帝
2026-01-25 10:30:22
台退将:大陆已经在做解放台湾的思想动员,最后时刻即将到来

台退将:大陆已经在做解放台湾的思想动员,最后时刻即将到来

始于初见见
2026-01-25 18:19:27
农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

白云故事
2026-01-22 17:30:05
美军舰护航对台军售船闯台海,百架F35撑腰,中方亮杀招硬刚到底

美军舰护航对台军售船闯台海,百架F35撑腰,中方亮杀招硬刚到底

达文西看世界
2026-01-22 09:28:01
湖人即将挑战东部苦主,后者豪取四连胜,一数据成决定胜负关键

湖人即将挑战东部苦主,后者豪取四连胜,一数据成决定胜负关键

谢说篮球
2026-01-25 18:12:37
曾是全美第一小前,活塞的建队核心,才26岁的他,3年已流浪4队!

曾是全美第一小前,活塞的建队核心,才26岁的他,3年已流浪4队!

篮球圈里的那些事
2026-01-25 17:30:25
重磅!广东队被曝欲签下山西主力内线,朱芳雨又要出手了?

重磅!广东队被曝欲签下山西主力内线,朱芳雨又要出手了?

绯雨儿
2026-01-25 11:45:25
2026-01-25 19:35:00
CSDN incentive-icons
CSDN
成就一亿技术人
26279文章数 242221关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

游客自称爬衡山时挂脖子上80克金牌遗失 价值超10万元

头条要闻

游客自称爬衡山时挂脖子上80克金牌遗失 价值超10万元

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

王玉雯方严正声明 剧方回应:涉事人员已被开除

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

本地
手机
教育
公开课
军事航空

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

手机要闻

荣耀泡泡玛特联名手机今日开售:首销即引爆,线下再现排队热潮

教育要闻

看似复杂,尖子生一个技巧口算

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版