网易首页 > 网易号 > 正文 申请入驻

被对手怼暴后,OpenAI 发布最强代码模型

0
分享至

来源:市场资讯

(来源:极客公园)


从写代码到「接管电脑」,GPT-5.3-Codex 正在重新定义什么叫 AI 工具人。

作者|桦林舞王

编辑|靖宇

2 月 5 日,Anthropic 在超级碗上发布的讽刺广告,,却被科技圈嘲笑。

现在,Altman 的报复来了!

当地时间 2 月 5 日,OpenAI 发布 GPT-5.3-Codex,这款最新的代码模型不仅在测试中名列前茅,而且能真正接管电脑,自主切换程序,完成复杂任务。

,现在又是 GPT-5.3-Codex,来自 Altman 的反击,是如此迅速。

01

从「代码助手」到「电脑管家」

传统的 AI 编程工具,包括 GitHub Copilot 和之前的 Codex,本质上都是「代码补全器」——你写一行,它帮你写下一行。但 GPT-5.3-Codex 完全不同。

它能「接管」你的整台电脑。

OpenAI 在发布会上展示的场景让人印象深刻:Codex 不仅能写代码,还能运行测试、调试程序、管理数据库、处理文件系统,甚至能够自主地在不同应用程序之间切换,完成复杂的多步骤任务。

一位 Hacker News 用户的观察很有意思:「Codex 在发现错误和小的不一致性方面非常出色,这让我感到惊讶。Claude Code 在『原始编程』方面很好,但 Codex 在仔细、系统地发现『问题』方面是无敌的。」

说白了,这不再是一个编程工具,而是一个数字员工。

相比于之前的版本,GPT-5.3-Codex 的提升不再仅仅体现在代码生成的正确率,而是在「智能代理(Agentic)」能力上的质变。


5.3 Codex 和自家产品的对比|图片来源:OpenAI

在保持相同推理深度的情况下,运行速度比GPT-5.2-Codex快了25%。同时,新模型引入了「中途转向(Mid-turn Steering)」。你不再需要等待模型生成完毕后才反馈,可以在它运行长达数小时的任务(如重构整个代码库)时,随时插入指令进行纠偏。

就在 OpenAI 发布 5.3 的同一天(甚至只相差 15 分钟),Anthropic 发布了Claude Opus 4.6,火药味极浓。


OpenAI 和 Anthropic 最新代码模型的数据对比|图片来源:AI 自制

更有趣的是,这是OpenAI第一个「自己造自己」的模型。

研究团队用 Codex 来监控训练过程、分析代码质量、提出优化建议。AI 开始参与 AI 的诞生过程,这个循环一旦形成,进化速度将是指数级的。

02

90% 时间在编程的产品经理

最能说明 Codex 影响力的,不是技术指标,而是人的工作方式改变。

OpenAI 产品设计负责人 Ed Bayes 的话很直接:「我现在 90% 的时间都在编程。一年前正好相反,可能只有 10% 的时间。」

一个产品设计师,现在大部分时间在写代码——这个转变背后的逻辑很简单:当 AI 能够理解你的意图并直接实现时,传统的「产品-开发-测试」流水线就被压缩了。

这种变化不只发生在 OpenAI 内部。


两天前 OpenAI 刚刚发布 MacOS 版的 Codex 独立应用|图片来源:OpenAI

The New Stack 分析师指出:「GPT-5.3-Codex 不仅仅在单个任务上更好,而是朝着能够在现实世界技术工作的全谱中进行推理、构建和执行的单一通用代理迈出了一步。」

但这也带来了新的分工模式。

一位 Hacker News 用户总结了 Codex 与 Anthropic Claude 的区别:「在 Codex 中,定位是一个交互式协作者:你在执行过程中引导它,保持循环,在它工作时纠正方向。而在 Opus 4.6 中,强调的是相反的:一个更自主、更智能、更深思熟虑的系统。」

这意味着,程序员的角色正在从「执行者」转向「指挥者」。

03

AI Coding 大战升级

Codex 的发布时间点很微妙——就在超级碗前夕,OpenAI 和 Anthropic 都准备了竞争性广告。VentureBeat 将此次发布描述为「AI 编程战争的开场齐射」。

这不是偶然。当 AI 编程工具从「锦上添花」变成「必需品」时,这个市场的竞争就会变得异常激烈。

有 Hacker News 评论员直接警告 Anthropic:「他们最好采取重大行动,否则 OpenAI 将杀死 Claude Code。」话虽然说得直接,但反映了业内的普遍判断:Codex 这次的能力跃升,确实给竞争对手带来了巨大压力。

不过,Every.to 的对比测试显示了另一个角度:「在一项调试测试中,GPT-5.3 Codex 运行了超过 8 个工具调用,逐位分析但错过了实际问题。而 Opus 4.6 只读了一次文档就诊断出了问题。」

这说明,不同的 AI 编程工具正在形成差异化的优势:Codex 更像一个细致的执行者,Claude 更像一个敏锐的诊断师。

但无论如何,Sam Altman 的评价很能说明问题:「感觉,比基准测试显示的更像是一个真正的进步。」当CEO用「感觉」而不是数据来描述产品时,往往意味着这个产品已经超越了现有的评估体系。

这场 AI 编程战争,本质上是在争夺一个问题的答案:在软件开发这个万亿美元市场中,人和 AI 的边界到底在哪里?

Codex 给出的答案是:AI 可以做程序员能做的几乎所有事情,人类负责告诉 AI 要做什么。这个分工模式一旦被验证,整个软件行业的人才需求、薪酬结构、甚至教育体系都会发生根本性改变。

现在的问题不再是「AI 会不会取代程序员」,而是「什么样的程序员,不会被 AI 取代」。

*头图来源:OpenAI

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你怎么看 OpenAI 发布的最新代码模型?


马斯克曝光,苹果造车时挖角特斯拉,双倍工资免面试。

点赞关注极客公园视频号,

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋万安曾宣称:若大陆继续在台海军演的话,他就要停掉双城论坛

蒋万安曾宣称:若大陆继续在台海军演的话,他就要停掉双城论坛

百态人间
2026-02-02 15:44:34
跳台滑雪运动员通过注射增大男性生殖器提升飞行距离,WADA正在调查

跳台滑雪运动员通过注射增大男性生殖器提升飞行距离,WADA正在调查

懂球帝
2026-02-06 12:50:09
规模、效率、灵活,百胜中国的 3 万店增长计划

规模、效率、灵活,百胜中国的 3 万店增长计划

晚点LatePost
2026-02-05 22:44:25
至少14人被拍到!女大学生从广州坐高铁回家,网友:看着看着就哭了

至少14人被拍到!女大学生从广州坐高铁回家,网友:看着看着就哭了

环球网资讯
2026-02-06 14:06:36
易中天说风雨能进国王不能进,为啥也受到攻击?

易中天说风雨能进国王不能进,为啥也受到攻击?

书写者
2026-02-06 12:05:18
就在今天!詹姆斯打破尘封22年NBA纪录,登顶历史第一

就在今天!詹姆斯打破尘封22年NBA纪录,登顶历史第一

篮球大视野
2026-02-06 17:03:43
高速服务区被车主“抛弃”,只上厕所不消费,自带红烧肉开席

高速服务区被车主“抛弃”,只上厕所不消费,自带红烧肉开席

老特有话说
2026-02-05 17:23:29
火箭爽了!47+44+43!当今买断市场第一大鱼

火箭爽了!47+44+43!当今买断市场第一大鱼

篮球实战宝典
2026-02-06 17:12:18
乌克兰公布最新数据,历经4年作战乌军死亡5.5万,俄军死亡76.3万

乌克兰公布最新数据,历经4年作战乌军死亡5.5万,俄军死亡76.3万

碳基生物关怀组织
2026-02-05 23:11:54
库里缺席!勇士轰制胜10-0逆转太阳 斯潘塞20+6狄龙24+6

库里缺席!勇士轰制胜10-0逆转太阳 斯潘塞20+6狄龙24+6

醉卧浮生
2026-02-06 13:25:38
临沂女子付4980元买500双鞋仅收90余双且货不对板 涉事商家销号失联

临沂女子付4980元买500双鞋仅收90余双且货不对板 涉事商家销号失联

信网
2026-02-05 11:10:17
闹大了!现在全网都知道四川华西医院,神经外科王伟教授收礼了…

闹大了!现在全网都知道四川华西医院,神经外科王伟教授收礼了…

火山诗话
2026-02-06 14:09:25
触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

老特有话说
2026-02-04 23:42:16
六旬男子刚退休就瘫痪!小23岁女友坚持照护,终于正式登记结婚

六旬男子刚退休就瘫痪!小23岁女友坚持照护,终于正式登记结婚

观威海
2026-02-06 17:02:22
美国拉55国组团遏华,被迫进群的韩国,向中国发出“求救信号”

美国拉55国组团遏华,被迫进群的韩国,向中国发出“求救信号”

石江月
2026-02-06 10:09:26
巴拿马“毁约夺港”,中国震怒反击开始

巴拿马“毁约夺港”,中国震怒反击开始

凤眼论
2026-02-06 09:18:32
最后2天,高市早苗半场开香槟,中俄统一立场,日本收到直白警告

最后2天,高市早苗半场开香槟,中俄统一立场,日本收到直白警告

纪中百大事
2026-02-06 14:18:08
特朗普称全力支持高市早苗赢得大选 外交部:不评论日本内政

特朗普称全力支持高市早苗赢得大选 外交部:不评论日本内政

财联社
2026-02-06 15:24:11
巴拿马想认错也没机会,中国3份檄文通告全球!一颗螺丝钉都不留

巴拿马想认错也没机会,中国3份檄文通告全球!一颗螺丝钉都不留

余們搞笑段子
2026-02-06 01:33:56
因为一枚“假摄像头”,荣耀在海外惹上了大麻烦

因为一枚“假摄像头”,荣耀在海外惹上了大麻烦

金角财经
2026-02-05 16:21:42
2026-02-06 18:47:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2135928文章数 5375关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

房产
旅游
手机
艺术
公开课

房产要闻

新春三亚置业,看过这个热盘再说!

旅游要闻

各景区“随地大小躺”合照火了 游客们自发纷纷在景区里自然躺倒 与风景融为一体

手机要闻

新年换机指南:nova 15系列叠加国补成2000-3000元档的最优解

艺术要闻

Kristin Vestgard:挪威当代画家

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版