网易首页 > 网易号 > 正文 申请入驻

Claude Opus 4.6和GPT-5.3-Codex同日发布,谁是编程之王?

0
分享至

【TechWeb】2月6日消息,美国时间2月5日上午,Anthropic与OpenAI相隔不到10分钟先后发布了新一代旗舰模型——Claude Opus 4.6和GPT-5.3-Codex。

上午10点刚过,Anthropic率先扔出Claude Opus 4.6。官方的定义是“更聪明的模型”,强调其“规划更谨慎、能更长时间持续执行代理式任务”。


几乎就在同一时间,Sam Altman在X平台上简短而有力地宣布了GPT-5.3-Codex的登场。

两家公司就像约好了一样,在同一天同一时刻抛出了自己的重磅产品。这场“模型遭遇战”背后,是两大巨头对于AI智能体技术路线的明确宣示。

GPT-5.3-Codex VS Claude Opus 4.6

基于官方信息,我们先看看两款模型的定位与能力画像。

1、GPT-5.3-Codex:从编码助手到全能数字协作者

核心定位:

官方定义为“迄今为止能力最强的智能体编码模型”,其目标是成为一个能完成开发者和专业人士在计算机上几乎所有工作的智能体。

关键能力包括:

自我进化:首个在自身创建过程中发挥关键作用的模型,早期版本被用于调试自身训练、管理部署和诊断评估结果。

网络安全:被OpenAI自身归类为网络安全任务“高能力”模型,并首次直接训练以识别软件漏洞。为此,OpenAI配套推出了“可信网络访问”试点计划和1000万美元的API赠款计划。

交互性:在工作时提供频繁更新,允许用户实时提问、讨论方案并引导方向,如同协作的同事。

2. Claude Opus 4.6:深思熟虑的专业知识工作者

核心定位:在保持顶级安全性的前提下,于专业领域推理、长上下文处理及复杂任务规划上实现突破。



关键能力包括:

超长上下文:首次为Opus级模型推出100万token的上下文窗口(测试版)。在“大海捞针”测试中,其信息召回率从上一代的18.5%跃升至76%,实现了质的提升。

可控的智能:新增“effort”(努力)控制参数(低、中、高、最高),让开发者能在成本、速度和质量间取得平衡;并引入“自适应思考” 功能,让模型能根据任务难度自行调整思考深度。

专业领域卓越:在衡量金融、法律等领域知识工作的GDPval-AA评估中,其Elo评分比业内第二的模型(GPT-5.2)高出约144分。

以下表格整合了官方数据,直观展示二者的性能特征:


简单来说,如果你的工作像一名需要冲锋陷阵、在终端和各类工具中穿梭的“特种兵”,GPT-5.3-Codex 的交互性和执行力更强。

如果你的任务更像是一位需要审慎研究、处理海量资料并做出专业决策的“分析师”或“架构师”,Claude Opus 4.6 的深度和可靠性更优。

OpenAI和Anthropic路线分道扬镳?

虽然各有侧重,但两款模型的升级,共同指向并加速了同一个未来:AI智能体(Agent)的普及化。但它们选择从不同路径切入。

GPT-5.3-Codex将智能体的能力从“写代码”扩展到“运行并维护整个软件生命周期”,这意味着未来软件项目的开发、调试、部署、监控可能由AI智能体串联完成。Claude Opus 4.6则能自主管理大型代码库迁移、分配任务,扮演“技术主管”角色。

两者都深度融合了办公套件。Claude已推出Excel增强版和PowerPoint研究预览;GPT-5.3-Codex可根据模糊指令生成功能完备的网站和演示文稿。这标志着AI开始理解工作流背后的业务意图,而不仅仅是执行单一指令。

值得注意的是,两者均在网络安全能力上大幅提升,迫使行业进入新阶段。OpenAI配套推出了防御性工具和赠款计划,Anthropic也强调用AI帮助修补漏洞。这预示着AI将成为攻防两端的关键工具,生态建设(如为开源项目提供免费安全扫描)变得至关重要。

另一个值得关注的趋势是,GPT-5.3-Codex“自我用于开发”的实践具有里程碑意义,模型开发进入“自举”新阶段。这不仅是效率提升,更可能开启AI自我迭代优化的新范式,进一步加速技术进化速度。

此次发布并非简单的功能迭代,而是两大巨头关于AI未来形态的一次路线展示。

OpenAI的路线是“扩张与融合”,让Codex成为一个能操作计算机、打通所有数字任务的通用智能体底座,追求能力的广度与交互的自然度。

Anthropic的路线是“深化与可控”,在确保安全与可靠的前提下,将模型打造为在特定专业领域(金融、法律、编码)具有顶级深度分析能力的“专家”,并赋予开发者精细的控制权。

无论哪条路线,我们都在见证一个根本性转变:AI正从一个需要被“提示”的工具,转变为一个可以自主规划、执行复杂任务、并能与人实时协作的智能体。这不仅仅会改变开发者和知识工作者的工作方式,最终将重新定义软件、服务乃至整个数字生态的构建方式。

而竞争的下一个前沿,将是这些智能体如何被安全、高效、大规模地集成到真实世界的业务流程中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广州男子因狗吠乱拉投毒致宠物狗死亡,法院最终判决

广州男子因狗吠乱拉投毒致宠物狗死亡,法院最终判决

爱下厨的阿酾
2026-02-06 17:10:03
中国农业银行河北省分行原党委委员、副行长陈元良被开除党籍

中国农业银行河北省分行原党委委员、副行长陈元良被开除党籍

澎湃新闻
2026-02-06 15:45:06
体面分手!哈登声明揭露真相:我从未申请离队,只是看不到未来

体面分手!哈登声明揭露真相:我从未申请离队,只是看不到未来

键侃篮球
2026-02-07 02:19:56
马未都:我身价至少100亿,但这点钱,跟我母亲比,我就是个贫农

马未都:我身价至少100亿,但这点钱,跟我母亲比,我就是个贫农

忠于法纪
2026-01-15 22:08:28
成功了!中国向世界宣布重大科技成果

成功了!中国向世界宣布重大科技成果

元爸体育
2026-02-04 16:44:45
第一批独生子女的扎心现实:父母去世后,成了举目无亲的“孤儿”

第一批独生子女的扎心现实:父母去世后,成了举目无亲的“孤儿”

千秋文化
2026-02-01 20:31:47
第三次世界大战导火索如果中国拦截了美国的

第三次世界大战导火索如果中国拦截了美国的

林子说事
2026-02-07 00:57:11
霍金也被爱泼斯坦档案害惨了,都瘫痪成这样,真的还能玩女人吗?

霍金也被爱泼斯坦档案害惨了,都瘫痪成这样,真的还能玩女人吗?

我心纵横天地间
2026-02-05 19:14:54
终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

福建平子
2026-01-28 10:52:25
媒体人:申花吸金能力在中超第一档,胸前广告赞助额每年两亿元

媒体人:申花吸金能力在中超第一档,胸前广告赞助额每年两亿元

懂球帝
2026-02-07 01:04:18
11岁玥儿罕见穿黑衣现身,眼神哀伤克制:她其实什么都懂

11岁玥儿罕见穿黑衣现身,眼神哀伤克制:她其实什么都懂

橙星文娱
2026-02-05 17:06:04
逆行救出51人的刘海洋转院至长沙,病房里向女儿重述救援过程:这就是爸爸的警察故事

逆行救出51人的刘海洋转院至长沙,病房里向女儿重述救援过程:这就是爸爸的警察故事

潇湘晨报
2026-02-06 14:57:30
赖清德喊话大陆对话,提出两岸有三大共同敌人,国台办:有个前提

赖清德喊话大陆对话,提出两岸有三大共同敌人,国台办:有个前提

午夜搭车a
2026-02-07 02:23:47
最新任命!查尔斯宣布由威廉王子代替,哈里王子不得不“妥协”

最新任命!查尔斯宣布由威廉王子代替,哈里王子不得不“妥协”

夜深爱杂谈
2026-02-06 17:37:17
大反转!向嫣然医院捐款429.2万元?李亚鹏哽咽:感谢董宇辉!

大反转!向嫣然医院捐款429.2万元?李亚鹏哽咽:感谢董宇辉!

小娱乐悠悠
2026-02-06 09:09:39
樊振东球队三天内三位实力队友接连宣布离队,冠军阵容解体。

樊振东球队三天内三位实力队友接连宣布离队,冠军阵容解体。

章民解说体育
2026-02-06 04:33:53
正式复出!WTA多哈1000签表:郑钦文首秀对手出炉,或战莱巴金娜

正式复出!WTA多哈1000签表:郑钦文首秀对手出炉,或战莱巴金娜

大秦壁虎白话体育
2026-02-06 20:51:54
访华回国后,斯塔默日子不好过,被逼到公开道歉,首相当不成了?

访华回国后,斯塔默日子不好过,被逼到公开道歉,首相当不成了?

灿若银烂
2026-02-07 03:20:27
中央定调,延迟退休实施后,每晚1年退休,养老金能增加6%吗?

中央定调,延迟退休实施后,每晚1年退休,养老金能增加6%吗?

另子维爱读史
2026-02-05 17:45:59
戏子误国!离春节不到20天,4位明星相继塌房,一个比一个荒唐

戏子误国!离春节不到20天,4位明星相继塌房,一个比一个荒唐

往史过眼云烟
2026-02-06 16:40:38
2026-02-07 04:16:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
15838文章数 43059关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

艺术
本地
亲子
公开课
军事航空

艺术要闻

这颜色太美,不看太可惜!

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

亲子要闻

冬末春初娃燥慌,雪梨润燥超管用,给娃吃对更舒服

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版