网易首页 > 网易号 > 正文 申请入驻

OpenAI发布GPT-5.3-Codex:性能提升25%,编程能力全面升级

0
分享至


OpenAI今天宣布推出GPT-5.3-Codex,该公司声称这是迄今为止发布的最强大的智能体编程模型。有趣的是,Claude Code的制造商Anthropic也在同一时间发布了一个新的强大模型。Anthropic的模型Opus 4.6是一个更通用的模型,但Anthropic以其Claude Code产品而闻名。

与Anthropic的Opus 4.6一样,OpenAI将GPT-5.3描述为"前沿模型"。这是AI行业用来描述性能和能力处于最前沿的模型的术语。据OpenAI称,新的5.3 Codex运行速度提高了25%,能够执行更长时间的任务。

OpenAI的GPT-5.3-Codex发布时间就在OpenAI宣布并发布专门用于Codex的Mac应用程序几天之后。

敏锐的OpenAI GPT模型观察者会注意到这个版本的5.3版本号。OpenAI目前最热门的GPT版本是GPT-5.2,而不是GPT-5.3。虽然还没有任何正式宣布或暗示,但我猜测在未来几天或几周内,我们距离通用GPT-5.3的发布不会太远。

我不确定这是令人兴奋还是深感不安。GPT-5.3-Codex是OpenAI的"第一个在创造自己过程中发挥关键作用的模型"。Codex团队使用Codex来调试自己的训练、管理自己的部署,并诊断测试结果。

OpenAI的博客文章说:"通过GPT-5.3-Codex,Codex从一个能够编写和审查代码的智能体,发展成为一个几乎能够完成开发人员和专业人士在计算机上能做的任何事情的智能体。"让我们希望它不会认为人类是多余的。

认识到开发人员、设计师、产品经理和数据科学家在工作中做的远不止编码,GPT-5.3-Codex被设计来支持"软件生命周期中的所有工作——调试、部署、监控、编写产品需求文档、编辑文案、用户研究、测试、指标等等"。该公司报告说,它可以帮助你构建任何你想要构建的东西,特别提到了构建幻灯片演示文稿和电子表格。

该公司表示,这个模型被设计为可以在任务中途调整,具有持续交互且不会丢失上下文的特性。新的Codex Mac应用程序(以及可能即将推出的Windows应用程序)绝对可以帮助在模型为你处理项目时维持与模型的交互。

操作范围也大大延长了。Codex可以运行需要超过一天时间的进程。作为测试,OpenAI构建了两个基于网络的游戏。使用Mac应用程序引入的"技能"功能,测试人员使用网络游戏开发技能通过数百万个Token构建了这两个游戏。

博客文章特别强调了GPT-5.3-Codex如何更好地理解意图。如果你在制作一个"日常网站",博客文章报告说"简单或规格不明确的提示现在默认为具有更多功能和合理默认设置的网站,为你提供一个更强大的起始画布来实现你的想法。"

换句话说,如果你要求Codex"给我做一些漂亮的东西",它就会做到。我在要求Codex 5.2重新设计我的WordPress安全插件的某些部分以使管理界面更具吸引力和说服力方面取得了显著成功。早期Codex版本中存在的一些设计功能在这个最新版本中得到了改进。

博客引用的其他例子包括动态价格显示和自动化客户评价轮播。

我在上周参加的Mac Codex应用程序技术简报中捕捉到的潜台词之一是,一些客户希望获得更快的响应时间。我知道我经常让Codex或Claude Code开始一个编程任务,然后在等待过程完成时切换到其他活动。

虽然我的经验是智能体编程将我的开发过程从几个月加速到几天,但等待仍然有些痛苦。因此,提高性能,从而提高模型的输出速度,总是一个胜利。

根据博客文章,"GPT-5.3-Codex在SWE-Bench Pro和Terminal Bench上创造了新的行业纪录。"该公司说任务需要更少的Token,提高了效率。OpenAI还说,"GPT-5.3-Codex在SWE-Bench Pro和Terminal Bench上创造了新的行业纪录,并在OSWorld和GDPVal上表现出强劲的性能。"这些是该公司用来衡量编码、智能体操作和现实世界能力的基准测试。

OpenAI有一个已发布的准备框架,用于衡量和防范前沿AI能力的严重危害。在宣布GPT-5.3-Codex的博客文章中,该公司表示这个新模型是它第一个在网络安全任务方面被归类为"高能力"的模型。

它经过训练可以识别软件漏洞,具有扩展的安全保障和监控。与此同时,该公司正在启动网络可信访问计划,这是一个加速网络防御研究的试点项目,并捐赠1000万美元的API信用补助来支持网络安全研究。如果你的组织从事"善意安全研究",你可以通过该公司的网络安全资助计划申请API信用。

支持这些行动,博客文章报告说,"我们正在采取预防性方法,部署迄今为止最全面的网络安全安全堆栈。我们的缓解措施包括双重用途安全训练、自动化监控、高级功能的可信访问,以及包括威胁情报在内的执行流程。"

GPT-5.3-Codex现已通过Codex应用程序、CLI、IDE扩展和网页在付费ChatGPT计划中提供。计划提供API访问,该公司预计将提供25%更快的交互。我们本周早些时候报告的针对免费ChatGPT用户的Codex使用促销活动仍然有效,但他们目前仅限于GPT-5.2-Codex。

Q&A

Q1:GPT-5.3-Codex与之前版本相比有什么提升?

A:GPT-5.3-Codex运行速度提高了25%,能够执行更长时间的任务,从原来只能编写和审查代码的智能体发展成为几乎能够完成开发人员和专业人士在计算机上能做的任何事情的智能体,支持软件生命周期中的所有工作。

Q2:GPT-5.3-Codex在网络安全方面有什么特殊能力?

A:GPT-5.3-Codex是OpenAI第一个在网络安全任务方面被归类为"高能力"的模型,经过训练可以识别软件漏洞,具有扩展的安全保障和监控,同时OpenAI部署了最全面的网络安全安全堆栈。

Q3:如何获得GPT-5.3-Codex的访问权限?

A:GPT-5.3-Codex现已通过Codex应用程序、CLI、IDE扩展和网页在付费ChatGPT计划中提供,API访问正在规划中。免费ChatGPT用户目前仅限于使用GPT-5.2-Codex版本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本妹子赤裸上身做引体向上引热议!背影比男人还壮?

日本妹子赤裸上身做引体向上引热议!背影比男人还壮?

姿势跑法
2026-02-09 11:46:08
绿营逢迎高市,郑丽文看不下去

绿营逢迎高市,郑丽文看不下去

环球时报国际
2026-02-10 11:31:01
潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

梅子的小情绪
2026-02-08 19:59:04
世界第一高楼本月将建到100层,两年后竣工,高度将突破1公里

世界第一高楼本月将建到100层,两年后竣工,高度将突破1公里

科普大世界
2026-02-09 20:27:40
一位班主任的大实话:长大有本事的孩子,大多都出生在这些家庭

一位班主任的大实话:长大有本事的孩子,大多都出生在这些家庭

青苹果sht
2026-02-09 06:15:29
马来西亚7名警察恐吓勒索中国游客,逼转35.2万元加密货币,已被逮捕!

马来西亚7名警察恐吓勒索中国游客,逼转35.2万元加密货币,已被逮捕!

扬子晚报
2026-02-10 07:34:45
43亿播放!华裔二代集体破防:恨父母带我移民,错失2000万家产!

43亿播放!华裔二代集体破防:恨父母带我移民,错失2000万家产!

李砍柴
2026-02-09 15:46:01
冲上热搜!华晨宇演唱会现场官宣:已拿下三块地;当地回应

冲上热搜!华晨宇演唱会现场官宣:已拿下三块地;当地回应

每日经济新闻
2026-02-10 01:02:53
别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

复转这些年
2026-02-09 23:45:54
因公交电池故障,龙洲股份孙公司被索赔4.31亿,法院一审判赔5183万

因公交电池故障,龙洲股份孙公司被索赔4.31亿,法院一审判赔5183万

红星新闻
2026-02-09 23:51:17
南博事件终于有结果了!万万没想到,徐湖平真是幕后大佬!

南博事件终于有结果了!万万没想到,徐湖平真是幕后大佬!

青青子衿
2026-02-09 22:50:54
刚刚,集体拉升!涨停潮来了

刚刚,集体拉升!涨停潮来了

新浪财经
2026-02-10 10:49:04
国防部:奉劝菲方停止不择手段的政治操弄和自导自演的海上闹剧

国防部:奉劝菲方停止不择手段的政治操弄和自导自演的海上闹剧

环球网资讯
2026-02-10 15:12:42
75岁有八个男朋友?凌晨在北京去世?刘晓庆私生活谣言有多离谱

75岁有八个男朋友?凌晨在北京去世?刘晓庆私生活谣言有多离谱

叨唠
2026-02-07 21:23:51
骑士119-117掘金!无解的不是逆转绝杀,而是米切尔对哈登的表态

骑士119-117掘金!无解的不是逆转绝杀,而是米切尔对哈登的表态

鱼崖大话篮球
2026-02-10 15:49:32
国家卫健委:生活类美容机构、美发店、美甲店等严禁开展“轻医美”项目

国家卫健委:生活类美容机构、美发店、美甲店等严禁开展“轻医美”项目

环球网资讯
2026-02-10 15:59:19
外交部:香港事务纯属中国内政,香港法治不容撼动,任何外国无权说三道四

外交部:香港事务纯属中国内政,香港法治不容撼动,任何外国无权说三道四

环球网资讯
2026-02-10 15:34:20
重磅打虎!全国人大财政经济委员会副主任委员易炼红被查

重磅打虎!全国人大财政经济委员会副主任委员易炼红被查

扬子晚报
2026-02-10 09:36:57
月薪三千怕捞女:相亲直播间堪比刷怪笼

月薪三千怕捞女:相亲直播间堪比刷怪笼

虎嗅APP
2025-12-07 15:53:15
这就是回家要脱裤子才能上床的原因!网友:看完天都塌了!

这就是回家要脱裤子才能上床的原因!网友:看完天都塌了!

夜深爱杂谈
2026-02-07 19:05:55
2026-02-10 16:16:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16033文章数 49690关注度
往期回顾 全部

科技要闻

Seedance刷屏:网友们玩疯 影视圈瑟瑟发抖

头条要闻

高市希望修宪将自卫队定位为"有实力组织" 国防部回应

头条要闻

高市希望修宪将自卫队定位为"有实力组织" 国防部回应

体育要闻

NBA上演全武行,超大冲突4人驱逐!

娱乐要闻

全红婵官宣喜讯,杂志首秀太惊艳

财经要闻

雀巢中国近千经销商的“追债记”

汽车要闻

应用于190KW四驱Ultra版 方程豹钛7搭载天神之眼5.0

态度原创

房产
艺术
本地
公开课
军事航空

房产要闻

海南又一千亿级赛道出现,京东、华润、中石化等巨头率先杀入!

艺术要闻

挑战您的眼力!这14个字的草书您能认全吗?

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以军持续在约旦河西岸多地发动突袭

无障碍浏览 进入关怀版