网易首页 > 网易号 > 正文 申请入驻

突发!OpenAI 放出“代码之神”GPT-5.2 Codex 剑指谷歌、Anthropic,网友实测后感慨:很贵很好用

0
分享至


编辑|冬梅

北京时间昨日深夜,OpenAI 正式发布了新一代智能体编码模型 GPT-5.2 Codex,并在官网同步发布技术博客,对该模型的定位、能力改进及部署方式进行了说明。

OpenAI 重磅发布 GPT-5.2 Codex

据介绍,GPT-5.2 Codex 基于通用模型 GPT-5.2 构建,并针对“智能体编码”(Agentic Coding)场景进行了专门优化,主要面向复杂的软件工程任务。相较此前版本,新模型在长程任务执行、大规模代码变更、Windows 原生环境支持以及网络安全相关能力等方面进行了系统性改进。

在工程能力层面,OpenAI 表示,GPT-5.2 Codex 通过引入原生的上下文压缩(compaction)机制,提高了对超长上下文的理解与利用效率,使模型在跨文件、跨模块的长期编码任务中具备更稳定的表现。同时,该模型在代码重构、迁移等涉及大规模改动的场景下,整体可靠性和一致性有所提升。


安全能力也是此次更新的重点方向之一。OpenAI 在博客中提到,随着模型在推理与工具调用能力上的增强,其在网络安全领域的适用性也随之提升。

官方披露,就在上周,一名安全研究人员使用 GPT-5.1-Codex-Max 配合 Codex CLI,协助发现了 React 框架中的三个安全漏洞,并已通过负责任披露流程提交给相关方,这些漏洞可能导致拒绝服务或源代码泄露风险。

在此基础上,OpenAI 表示,GPT-5.2 Codex 是其目前网络安全能力最强的 Codex 模型,但相关能力仍具有“双重用途”属性。根据 OpenAI 内部的“准备框架”(Preparedness Framework)评估,该模型尚未被划定为“高等级”网络安全能力水平,但公司在部署策略上已提前考虑未来能力增长所带来的潜在风险。

在发布策略上,OpenAI 选择优先通过受控渠道提供 GPT-5.2 Codex。目前,该模型已在 Codex CLI、IDE 扩展、云端环境以及代码审查流程中上线,并从即日起向所有付费 ChatGPT 用户开放。与此同时,OpenAI 正在推进 API 层面的安全开放方案,为未来第三方接入做准备。

针对网络安全相关使用场景,OpenAI 还同步启动了一项仅限邀请的试点计划,向经过审查的安全研究人员和组织提供用途受限的访问权限。该机制旨在支持已授权的防御性安全研究,同时保持对模型使用范围和风险的控制。

性能表现如何?

具体而言,各项性能表现如何?

在能力融合方面,GPT-5.2 Codex 继承了 GPT-5.2 在专业推理与事实准确性方面的特性,同时整合了 GPT-5.1-Codex-Max 在智能体编码和终端操作上的能力。OpenAI 表示,这种组合使模型在复杂工程任务中能够更稳定地调用工具、理解多模态输入,并在控制 Token 使用效率的同时完成长时间推理。

官方还指出,新模型在处理编码过程中共享的截图、技术示意图、数据图表和用户界面时具备更高的理解精度。在 Windows 原生环境下,GPT-5.2 Codex 的智能体执行效率和可靠性也有所提升。

在基准测试方面,GPT-5.2 Codex 参与了 SWE-Bench Pro 以及 Terminal-Bench 2.0 的评测。这两项测试主要用于评估模型在真实代码库和终端环境中执行实际工程任务的能力。OpenAI 表示,相关结果显示模型在上述场景中的整体表现较此前版本有所改进。


OpenAI 透露的一项网络安全评估显示,从 GPT‑5-Codex 到 GPT‑5.1-Codex-Max 再到 GPT‑5.2-Codex,模型能力在持续提升。


OpenAI 预计,未来的 AI 模型将继续沿着这一发展轨迹前进。

网友:好用,但成本略高

GPT‑5.2-Codex 的发布在各大平台上引发热议。

在 Reddit 上,有用户称相比此前使用的 GPT-5.2,新模型在编码能力上体感大约有一成左右的提升。他目前将模型运行在较高配置下,整体感受是表现稳定、可预测性强,执行过程可靠且逻辑清晰,在完成任务的同时还会对推理和操作步骤给出较为详尽的说明。

不过,他也指出,这一模型在运行过程中会消耗更多的 Token,因此对个人用户、业余开发者或小型企业而言,成本压力可能较大,并不一定是最优选择。但如果是中型企业,正在处理高度复杂、时间紧迫且具有关键业务影响的软件工程问题,这一模型的价值会非常明显,甚至会让人“心存感激”。

另一位该模型的深度用户对上述观点表示赞同。他表示:

“我从模型发布之初就开始使用,目前主要在中等到高档配置下运行(尚未尝试最高档)。在我的使用场景中,新版本相较于 GPT-5.1 Codex 有明显提升。 我正在编写复杂的信号处理代码,并会让模型进行在线检索,以确保输出基于真实数据和已有研究成果。从实际体验来看,整体效果非常出色。尽管我尚未系统对比该版本与 GPT-5.2 高配或超高配模式的差异,但后者不仅 Token 消耗极大,而且运行速度较慢。相比之下,目前使用的这一版本在速度和成本控制上显得更为均衡。”


对于 OpenAI 公司如此快速的迭代产品的行为,有用户任何这是很不可思议的。即便是在 FAANG 级别的公司,通常也需要数月甚至更长时间才能完成。该用户表示:

“任何在大型组织工作过的人都知道,这种方向性的转向,即便是在 FAANG 级别的公司,通常也需要数月甚至更长时间才能完成。

反过来看一个例子:ChatGPT 发布之后,谷歌大约花了将近两年的时间才实现明显的技术追赶,这一点其实相当夸张——毕竟 Transformer 架构最早就是他们提出的。相比之下,OpenAI 只用了几个月时间就迅速缩小了差距。

这只是我个人的感受,但在技术类工作上,GPT-5.2 的表现已经优于 Gemini。当然,Opus 的能力确实不错,但成本也很高,而且很可能是体量更大的模型。在这种前提下,两者在实际表现上依然咬得很紧,本身就已经很令人意外了。

再加上 OpenAI 最近密集达成的各类合作,不得不说,Sam 在企业层面的运作和谈判能力确实相当强。”


OpenAI计划再融1000亿美元,

估值或达8300亿美元

在 GPT‑5.2-Codex 发布之际,OpenAI 还被曝开启新一轮融资,最高募集 1000 亿美元。

据《华尔街日报》19 日援引知情人士消息称,这笔新募集的资金将用来支持其在人工智能领域持续扩张的长期战略。

如果该轮融资顺利完成,OpenAI 的整体估值可能升至约 8300 亿美元。

报道指出,这轮融资目前仍处于早期阶段,相关交易结构和条款尚未最终敲定,未来仍存在调整空间。知情人士称,OpenAI 希望最快在明年第一季度末完成本轮融资,但具体时间表取决于市场环境和投资者反馈。

若按计划完成,这将成为 OpenAI 成立以来规模最大的一次融资,也将是当前全球私营科技公司中最具规模的资本运作之一。不过,市场是否具备足够的投资者需求来消化如此体量的融资,仍有不确定性。

在公开市场对人工智能相关支出趋于谨慎的背景下,这轮融资被视为对 OpenAI 融资能力和长期战略的一次重要考验。近期,关于 AI 行业可能存在泡沫的讨论持续升温,已对多家相关科技公司的股价表现形成压力。但对 OpenAI 而言,维持模型训练、算力建设以及产品迭代所需的资本投入,仍然处于高位。

OpenAI 首席执行官 Sam Altman 近年来持续在全球范围内接触潜在投资者,试图建立更为稳固的资本池。《华尔街日报》此前曾报道称,OpenAI 也在权衡未来进行首次公开募股(IPO)的可能性。知情人士指出,在模型能力快速演进、竞争持续加剧的环境下,OpenAI 对资金的需求已远超传统科技初创公司的规模。

在本轮融资计划中,软银集团被视为关键出资方之一。报道称,软银已同意向 OpenAI 投资约 300 亿美元。为支持这一投资承诺,软银上个月出售了价值约 58 亿美元的英伟达股份。按照当前计划,OpenAI 预计将在今年年底前从软银处获得剩余约 225 亿美元的资金。

除软银外,OpenAI 近期也密集推进多项交易。报道提到,该公司在年底前完成了一项内容许可协议,并获得来自迪士尼的 10 亿美元投资。知情人士表示,鉴于本轮融资规模庞大,OpenAI 预计将引入主权财富基金作为重要出资方。此前,该公司已获得阿联酋投资机构 MGX 的资金支持。

多笔交易显示,即便在整体融资环境趋紧的背景下,OpenAI 仍具备较强的资本吸引力,但其长期扩张计划的资金可持续性仍受到外界关注。

https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/

InfoQ 老友!请留步!极客邦 1 号客服上线工作啦!

后续我将通过微信视频号,以视频的形式持续更新技术话题、未来发展趋势、创业经验、商业踩坑教训等精彩内容,和大家一同成长,开启知识交流之旅

今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
7000 万!纽卡疯抢曼联弃将,托纳利离队成定局?

7000 万!纽卡疯抢曼联弃将,托纳利离队成定局?

澜归序
2026-02-26 06:45:20
离婚5年,47岁冯绍峰高调官宣喜讯,让前妻赵丽颖和内娱刮目相看

离婚5年,47岁冯绍峰高调官宣喜讯,让前妻赵丽颖和内娱刮目相看

银河史记
2026-02-25 18:22:15
逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

深圳晚报
2026-02-25 12:16:54
中方:对英方有关做法强烈不满!

中方:对英方有关做法强烈不满!

占豪
2026-02-26 00:02:47
单打16强出炉!国乒6人出局;日乒8人晋级;韩国单打14人仅剩3人

单打16强出炉!国乒6人出局;日乒8人晋级;韩国单打14人仅剩3人

莼侃体育
2026-02-26 08:02:52
奥运冠军“拉拉链露胸”,让耐克绷不住了!

奥运冠军“拉拉链露胸”,让耐克绷不住了!

品牌营销报
2026-02-23 11:31:10
春节返程名场面:全网都在错峰,结果全堵在高速开“聪明人大会”

春节返程名场面:全网都在错峰,结果全堵在高速开“聪明人大会”

据说说娱乐
2026-02-26 01:36:18
国家能源集团平庄煤业党委书记杜善周接受审查调查

国家能源集团平庄煤业党委书记杜善周接受审查调查

界面新闻
2026-02-25 15:33:15
中年以后的长相,特别准!

中年以后的长相,特别准!

神奇故事
2026-02-25 23:54:37
斯诺克战报!5场4-0,2大世界冠军被横扫,赵心童常冰玉创纪录!

斯诺克战报!5场4-0,2大世界冠军被横扫,赵心童常冰玉创纪录!

刘姚尧的文字城堡
2026-02-25 07:04:40
1986年的苹果巨无霸Mac电脑亮相:女孩打字演示 这键盘太狂了

1986年的苹果巨无霸Mac电脑亮相:女孩打字演示 这键盘太狂了

快科技
2026-02-23 17:00:11
售价36.8万起,2026款宝马5系官宣正式上市!

售价36.8万起,2026款宝马5系官宣正式上市!

Sky车志
2026-02-25 10:10:26
全票通过!委内瑞拉历史性大赦:27年政治恩怨,一朝和解

全票通过!委内瑞拉历史性大赦:27年政治恩怨,一朝和解

老马拉车莫少装
2026-02-20 15:13:49
村里最后饿死的那个人,只有九岁

村里最后饿死的那个人,只有九岁

霹雳炮
2026-02-22 20:24:41
历史上唯一一位“女状元”,白天处理政务,晚上沦为玩物

历史上唯一一位“女状元”,白天处理政务,晚上沦为玩物

谈史论天地
2026-02-23 10:39:15
一家四口春节“硬核”出游:从杭州自驾到嘉峪关,2700公里电车充电18次,“真香了”

一家四口春节“硬核”出游:从杭州自驾到嘉峪关,2700公里电车充电18次,“真香了”

极目新闻
2026-02-24 18:14:46
都说不去日本,春节赴日的却是这群人!日媒暗访揭示内幕

都说不去日本,春节赴日的却是这群人!日媒暗访揭示内幕

一盅情怀
2026-02-25 18:35:34
厄尔尼诺回归,我国气候大转折,今年夏天或有大变化

厄尔尼诺回归,我国气候大转折,今年夏天或有大变化

老特有话说
2026-02-24 23:26:27
“万恶的旧社会”到底什么样?百姓饿到食不果腹,别被电视剧骗了

“万恶的旧社会”到底什么样?百姓饿到食不果腹,别被电视剧骗了

小虎新车推荐员
2026-02-25 13:55:25
10秒抢光!300多万人开抢周杰伦杭州演唱会门票,周杰伦本人发文“吐槽”……

10秒抢光!300多万人开抢周杰伦杭州演唱会门票,周杰伦本人发文“吐槽”……

环球网资讯
2026-02-25 14:48:12
2026-02-26 09:40:49
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1321文章数 131关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

牛弹琴:特朗普宣称"美国赢麻了" 全世界都笑了

头条要闻

牛弹琴:特朗普宣称"美国赢麻了" 全世界都笑了

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

手机
数码
旅游
亲子
家居

手机要闻

全球首款:三星Galaxy S26 Ultra手机支持APV编解码器

数码要闻

消息称苹果平价版MacBook预计3月批量供货 起售价或高于预期

旅游要闻

春意渐浓 多地赏花游持续升温

亲子要闻

孩子半夜烧到39℃,该咋办呢?

家居要闻

艺居办公 温度与效率

无障碍浏览 进入关怀版