网易首页 > 网易号 > 正文 申请入驻

OpenAI新型Spark模型编程速度比GPT-5.3-Codex快15倍但有缺陷

0
分享至


OpenAI的Codex团队再次发力。继不到两周前发布专用智能体的Codex Mac应用,以及一周前推出更快更可控的GPT-5.3-Codex大语言模型后,OpenAI再次推出重磅产品。

今天,该公司宣布推出GPT-5.3-Codex-Spark的研究预览版,这是GPT-5.3-Codex的精简版本,专为Codex中的实时编程而构建。公司报告称,它生成代码的速度快15倍,同时"在现实世界编程任务中保持高度能力"。不过这其中有个问题,稍后我会详细说明。

Codex-Spark最初仅向每月200美元的Pro tier用户开放,在预览期间有单独的频率限制。如果按照OpenAI通常的Codex发布策略,Plus用户将是下一批,其他层级用户也会很快获得访问权限。

OpenAI表示,Codex-Spark是其"第一个专门为与Codex实时协作而设计的模型——进行针对性编辑、重构逻辑或完善界面,并立即看到结果"。

让我们简单分析一下。大多数智能体AI编程工具需要一段时间来响应指令。在我的编程工作中,我可以给出一个指令(这适用于Codex和Claude Code),然后去做别的事情一段时间。有时只需要几分钟,其他时候可能需要足够长的时间去吃午饭。

Codex-Spark显然能够更快地响应,允许快速持续的工作。这可以大大加快开发速度,特别是对于简单的提示和查询。

我知道当我向AI问一个超级简单的问题时,应该得到立即回应,但仍然需要等待五分钟才能得到答案,这偶尔会让我感到沮丧。

通过将响应性作为核心特性,该模型支持更流畅的对话式编程。有时,使用编程智能体感觉更像老式的批处理风格编程。这个设计旨在克服这种感觉。

GPT-5.3-Codex-Spark并非要取代基础的GPT-5.3-Codex。相反,Spark被设计来补充那些为持续数小时、数天或数周的长期自主任务而构建的高性能AI模型。

Codex-Spark模型专为响应性与智能性同样重要的工作而设计。它支持任务中途的中断和重定向,实现紧密的迭代循环。

这很吸引我,因为我总是在给AI分配任务十秒钟后想到更多要告诉它的内容。

Spark模型默认进行轻量级、针对性的编辑,进行快速调整而不是大幅度改动。除非特别请求,否则它也不会自动运行测试。

OpenAI已经能够在完整的请求-响应管道中减少延迟(更快的周转时间)。它说每次客户端/服务器往返的开销减少了80%。每Token开销减少了30%。通过会话初始化和流式优化,首个Token的时间减少了50%。

另一个在迭代过程中改善响应性的机制是引入持久的WebSocket连接,这样连接就不必持续重新协商。

今年1月,OpenAI宣布与AI芯片制造商Cerebras建立合作关系。我们一直在关注Cerebras。我们报道了其推理服务、与DeepSeek的合作、提升Meta的Llama模型性能的工作,以及Cerebras发布的超大AI芯片,旨在将大语言模型性能翻倍。

GPT-5.3-Codex-Spark是上个月宣布的OpenAI/Cerebras合作关系的第一个里程碑。Spark模型运行在Cerebras的Wafer Scale Engine 3上,这是一种高性能AI芯片架构,通过将所有计算资源放在一个煎饼大小的晶圆级处理器上来提升速度。

通常,半导体晶圆包含一堆处理器,在生产过程的后期会被切开并放入各自的封装中。Cerebras晶圆只包含一个芯片,使其成为一个非常非常大的处理器,具有非常非常紧密耦合的连接。

据Cerebras的首席技术官兼联合创始人Sean Lie说:"GPT-5.3-Codex-Spark最让我们兴奋的是与OpenAI和开发者社区合作,发现快速推理的可能性——新的交互模式、新的用例和根本不同的模型体验。这个预览只是开始。"

现在,这里有一些问题。

首先,OpenAI表示"当需求量大时,您可能会看到访问速度变慢或临时排队,因为我们要平衡所有用户的可靠性"。所以,快速,除非太多人想要快速。

关键问题来了。该公司说:"在评估智能体软件工程能力的两个基准SWE-Bench Pro和Terminal-Bench 2.0上,GPT-5.3-Codex-Spark表现不如GPT-5.3-Codex,但可以在短时间内完成任务。"

上周,在GPT-5.3-Codex发布时,OpenAI表示GPT-5.3-Codex是其根据已发布的准备框架分类为网络安全"高能力"的第一个模型。另一方面,该公司承认GPT-5.3-Codex-Spark"没有合理的机会达到我们网络安全高能力的准备框架阈值"。

请仔细思考这些陈述,亲爱的读者。这个AI没那么聪明,但它确实能以更快的速度做那些不那么聪明的事情。15倍的速度确实不容小觑。但你真的希望AI以15倍的速度犯编程错误并产生不太安全的代码吗?

让我告诉你这一点。当你有成千上万愤怒的用户拿着火把和干草叉冲向你,因为你突然用新版本破坏了他们的软件时,"嗯,足够好了"真的不够好。问我怎么知道的。

上周,我们了解到OpenAI使用Codex来编写Codex。我们也知道它使用它能够更快地构建代码。所以该公司显然有一个更快但不那么聪明的用例。当我更好地理解这是什么以及Spark的适用范围时,我会告诉你。

OpenAI分享说它正在为其Codex模型努力实现推理和实时工作的双重模式。

该公司说:"Codex-Spark是朝着具有两种互补模式的Codex迈出的第一步:更长期的推理和执行,以及用于快速迭代的实时协作。随着时间推移,这些模式将融合。"

它设想的工作流模型很有趣。据OpenAI称,最终的意图是"Codex可以让你保持紧密的交互循环,同时将长期运行的工作委派给后台的子智能体,或者当你需要广度和速度时将任务扇出到多个并行模型,这样你就不必预先选择单一模式。"

本质上,它正在努力实现两全其美。但现在,你可以选择快速或准确。这是一个艰难的选择。但准确的正在变得更准确,现在,至少当你想要的时候你可以选择快速(只要你记住权衡,并且你在支付Pro层级费用)。

你呢?你会为了15倍更快的编程响应而牺牲一些智能和安全能力吗?实时、可中断的AI协作者的想法吸引你,还是你更喜欢为严肃开发工作提供更深思熟虑、更高准确性的模型?

你对Codex-Spark和完整GPT-5.3-Codex模型之间的网络安全区别有多担心?如果你是Pro用户,你会根据任务在"快速"和"智能"模式之间切换吗?

Q&A

Q1:GPT-5.3-Codex-Spark相比GPT-5.3-Codex有什么优势?

A:GPT-5.3-Codex-Spark生成代码的速度比GPT-5.3-Codex快15倍,专为实时编程设计,能够进行针对性编辑、重构逻辑并立即看到结果。它支持任务中途的中断和重定向,实现紧密的迭代循环,让编程工作更加流畅和对话式。

Q2:Spark模型的性能权衡是什么?

A:虽然Spark模型速度快15倍,但在SWE-Bench Pro和Terminal-Bench 2.0两个评估智能体软件工程能力的基准测试中,表现不如GPT-5.3-Codex。更重要的是,Spark模型在网络安全方面没有达到"高能力"阈值,这意味着它可能产生不太安全的代码。

Q3:谁可以使用Codex-Spark模型?

A:Codex-Spark目前仅向每月200美元的Pro tier用户开放,在预览期间有单独的频率限制。按照OpenAI通常的发布策略,Plus用户将是下一批获得访问权限的用户,其他层级用户也会随后获得访问权限。当需求量大时,用户可能会遇到访问速度变慢或临时排队的情况。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英国亿万富翁阿尔菲·贝斯特二世皈依伊斯兰教

英国亿万富翁阿尔菲·贝斯特二世皈依伊斯兰教

达文西看世界
2026-02-10 14:55:04
过年买菜,建议大家:少买芹菜和萝卜,多买3样,应季鲜美寓意好

过年买菜,建议大家:少买芹菜和萝卜,多买3样,应季鲜美寓意好

江江食研社
2026-02-14 20:30:03
7比1!皇马拜仁大胜,揭萨拉赫严重下滑主因,比年龄影响更大

7比1!皇马拜仁大胜,揭萨拉赫严重下滑主因,比年龄影响更大

林子说事
2026-02-15 18:44:19
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
关停潮来了!五星级大酒店,集体大甩卖,煤老板们趁机捡漏

关停潮来了!五星级大酒店,集体大甩卖,煤老板们趁机捡漏

毒sir财经
2026-02-15 18:23:38
戴旭:中国从来没有单独彻底战胜过日本,未来一战永绝后患

戴旭:中国从来没有单独彻底战胜过日本,未来一战永绝后患

黄丽搞笑小能手
2026-02-16 10:26:58
李思思给恩师拜年,开100万奔驰送茅台酒,彭老师已是艺术界泰斗

李思思给恩师拜年,开100万奔驰送茅台酒,彭老师已是艺术界泰斗

地理三体说
2026-02-14 23:43:11
实话实说,隆妮的身材被严重低估了,珠圆玉润的太哇塞了!

实话实说,隆妮的身材被严重低估了,珠圆玉润的太哇塞了!

手工制作阿歼
2026-02-14 13:53:10
毛主席批评彭雪枫搞山头主义,彭雪枫怒拍桌子:有山头,但没主义

毛主席批评彭雪枫搞山头主义,彭雪枫怒拍桌子:有山头,但没主义

鹤羽说个事
2026-01-15 14:50:02
6-2,6-4!张之臻破荒解锁2大纪录:积分+75,近12万奖金到手!

6-2,6-4!张之臻破荒解锁2大纪录:积分+75,近12万奖金到手!

刘姚尧的文字城堡
2026-02-16 06:07:55
劝告大家:如果不是特有钱,就不要回农村建房,更不要回村养老

劝告大家:如果不是特有钱,就不要回农村建房,更不要回村养老

小马达情感故事
2026-01-27 12:15:03
有关薄一波的十个冷知识

有关薄一波的十个冷知识

深度报
2026-02-13 22:45:30
3个亿砸给一个网红,换来14年牢饭,这个富二代到底哪儿疯了?

3个亿砸给一个网红,换来14年牢饭,这个富二代到底哪儿疯了?

流云随风去远方
2026-01-25 08:49:43
油车降费电车缴费,2026年公路税费大改,你的车一年到底亏没亏?

油车降费电车缴费,2026年公路税费大改,你的车一年到底亏没亏?

复转这些年
2026-02-03 23:53:45
合砍27+10+7!这或是詹杜库最后的合体,老詹祝中国球迷新年快乐

合砍27+10+7!这或是詹杜库最后的合体,老詹祝中国球迷新年快乐

小路看球
2026-02-16 13:01:55
不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

凡知
2025-08-16 09:25:44
国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

南权先生
2026-02-12 15:41:39
高市话音未落,日舰直扑钓鱼岛!一场豪赌开场,局面将是一边倒?

高市话音未落,日舰直扑钓鱼岛!一场豪赌开场,局面将是一边倒?

薛小荣
2026-02-15 11:50:14
克林顿不是男人!要用雪茄助兴?莱温斯基:他把我当成“自助餐”

克林顿不是男人!要用雪茄助兴?莱温斯基:他把我当成“自助餐”

老蝣说体育
2026-01-05 14:59:04
春晚合肥分会场阵容公布,陈晓张远马思纯参加,没有许嵩让人吃惊

春晚合肥分会场阵容公布,陈晓张远马思纯参加,没有许嵩让人吃惊

小徐讲八卦
2026-02-16 07:19:34
2026-02-16 16:07:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16214文章数 49690关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw之父 承诺开源绝不动摇

头条要闻

66岁台大教授苑举正首次回山东老家过年:台湾年味太淡

头条要闻

66岁台大教授苑举正首次回山东老家过年:台湾年味太淡

体育要闻

遭针对?谷爱凌炮轰国际雪联安排

娱乐要闻

好甜蜜!郭富城随方媛回安徽过年

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

教育
房产
亲子
数码
军事航空

教育要闻

“马上”为什么是“立刻”的意思,和“马”有关系吗?

房产要闻

三亚新机场,又传出新消息!

亲子要闻

有意义的春节:5件小事,让孩子成长看得见

数码要闻

搭载iPhone芯片的低价MacBook或在下月推出 将提供多种彩色款式

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版