网易首页 > 网易号 > 正文 申请入驻

OpenAI 推出 GPT-5.1-Codex-Max 编程模型:可 “通宵” 处理任务,性能跑分超越谷歌

0
分享至

来源:环球网

【环球网科技综合报道】11月20日消息,据VentureBeat报道,OpenAI昨日正式发布新一代智能体编程模型GPT-5.1-Codex-Max,该模型在长远推理、工作效率及实时交互能力上实现显著提升,将取代GPT-5.1-Codex成为Codex集成界面的默认模型,为全球开发者带来更高效的编程辅助体验。


作为OpenAI在编程模型领域的重要升级产品,GPT-5.1-Codex-Max在多项关键编程基准测试中表现亮眼。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,其准确率达到77.9%,小幅领先于谷歌Gemini 3 Pro的76.2%;在Terminal-Bench 2.0测试中,以58.1%的准确率优于Gemini 3 Pro的54.2%;而在竞争激烈的LiveCodeBench Pro编码Elo基准测试中,该模型与Gemini 3 Pro的2439分持平,展现出强劲的综合性能。

此次模型升级的核心亮点是引入“压缩”(Compaction)机制。这一创新架构允许模型在接近上下文窗口限制时,智能保留关键信息并丢弃无关细节,实现了跨越数百万token的连续工作而不降低性能。依托该机制,模型在内部测试中成功完成了持续超过24小时的复杂任务,包括多步骤代码重构和自主调试,同时token效率提升约30%,有效降低了开发成本与响应延迟。

目前,GPT-5.1-Codex-Max已集成到OpenAI旗下多个Codex开发环境,涵盖官方命令行工具(Codex CLI)、内部代码审查工具及各类交互式编程环境。开发者可通过这些工具体验强化学习训练可视化、光学定律模拟等实时交互功能。该模型暂未通过公共API开放,官方表示后续将逐步推进,普通用户需订阅ChatGPT Plus、Pro或企业版等付费计划使用。

据OpenAI透露,其内部95%的工程师每周都会使用Codex系列工具,自采用以来,工程师平均拉取请求(Pull Requests)提交量提升约70%,开发效率显著提高。针对模型的自主性应用,OpenAI明确强调其定位为编码“助手”而非人类替代品。为保障开发安全与透明度,模型会生成详细的终端日志和测试引用,方便开发者审查验证代码,且默认运行于严格的沙盒环境,禁用网络访问以防范安全风险。(纯钧)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子喉咙痛自行服抗生素一个月,去医院检查发现咽喉长满雪花

男子喉咙痛自行服抗生素一个月,去医院检查发现咽喉长满雪花

看晓天下事
2025-11-09 14:17:49
苏神最后一舞无缘领奖台!全运会4×100米接力:广东队第4名完赛

苏神最后一舞无缘领奖台!全运会4×100米接力:广东队第4名完赛

全景体育V
2025-11-20 20:33:43
部门裁员50人匿名互投,我投自己想拿钱走人,结果另外49票都是我

部门裁员50人匿名互投,我投自己想拿钱走人,结果另外49票都是我

二十一号故事铺
2025-11-17 18:00:09
上市8年造假8年,创始人套现20.2亿后离场,国资24亿投资全亏光

上市8年造假8年,创始人套现20.2亿后离场,国资24亿投资全亏光

文史旺旺旺
2025-11-13 21:42:28
1949年,在北平不愿跟傅作义起义的李文和石觉,他们的下场如何?

1949年,在北平不愿跟傅作义起义的李文和石觉,他们的下场如何?

博览历史
2025-11-18 23:28:44
俄罗斯专家把中国武器贬为废铁:参数世界第一,但没打过仗。

俄罗斯专家把中国武器贬为废铁:参数世界第一,但没打过仗。

柏林观察
2025-08-12 08:27:22
被打服?25岁王楚钦头磕球台+苦笑叉腰!5天内两遭樊振东逆转双杀

被打服?25岁王楚钦头磕球台+苦笑叉腰!5天内两遭樊振东逆转双杀

我爱英超
2025-11-20 19:54:45
王欣瑜一日双败让广东全运会网球38年冠军荒继续,网友称意料之中

王欣瑜一日双败让广东全运会网球38年冠军荒继续,网友称意料之中

网球之家
2025-11-20 13:04:11
马筱梅回应争议,Sam是S最后托付,汪小菲不舍辞退

马筱梅回应争议,Sam是S最后托付,汪小菲不舍辞退

南风的温柔
2025-11-18 19:30:09
被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

书雁飞史oh
2025-09-12 16:09:35
听说,越来越多的北上广家庭放弃鸡娃,开始养“老式小孩”了

听说,越来越多的北上广家庭放弃鸡娃,开始养“老式小孩”了

三个妈妈六个娃
2025-11-19 22:01:11
即使荷兰政府花200亿,光刻机大厂ASML依旧决定搬迁,原因何在?

即使荷兰政府花200亿,光刻机大厂ASML依旧决定搬迁,原因何在?

云上乌托邦
2025-11-06 16:18:45
中国正在上演的诡异经济

中国正在上演的诡异经济

难得君
2025-10-29 19:26:55
不回头了?富士康决定转移3000亿产能,外媒:郭台铭把饭碗端走了

不回头了?富士康决定转移3000亿产能,外媒:郭台铭把饭碗端走了

混沌录
2025-10-22 21:54:06
张本美和四川见面会取消!5999元陪你吃午餐,入日籍还赚咱钱

张本美和四川见面会取消!5999元陪你吃午餐,入日籍还赚咱钱

三十年莱斯特城球迷
2025-11-19 18:02:14
小天才电话手表惊爆“大瓜”:孩子的孤独,正在被偷偷卖钱…

小天才电话手表惊爆“大瓜”:孩子的孤独,正在被偷偷卖钱…

妈咪OK
2025-11-17 15:43:33
京东001号快递员退休1年多,勤恳工作16年,刘强东承诺的房给了吗

京东001号快递员退休1年多,勤恳工作16年,刘强东承诺的房给了吗

揽星河的笔记
2025-10-30 21:38:08
先升后降!陕西即将大降温

先升后降!陕西即将大降温

鲁中晨报
2025-11-20 16:13:16
库里缺席勇士惨负热火吞2连败 鲍威尔25分波杰20+8

库里缺席勇士惨负热火吞2连败 鲍威尔25分波杰20+8

醉卧浮生
2025-11-20 10:57:35
成也饭圈败也饭圈!摘银的孙颖莎表情耐人寻味,陈梦的话有人信了

成也饭圈败也饭圈!摘银的孙颖莎表情耐人寻味,陈梦的话有人信了

林轻吟
2025-11-20 09:35:22
2025-11-20 23:39:00
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1280730文章数 2706398关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

教育
时尚
亲子
房产
本地

教育要闻

30天冲刺!下一站,“上岸”!

全球颜值最高女孩集体掀桌,网友:太爽了

亲子要闻

重庆知名幼儿园爆雷后:负责人已被批捕,接收方收餐费遭反对

房产要闻

超95亿!三亚巨量资产,突然甩出!

本地新闻

卖力整活儿的大湾鸡,靠疯癫成了新顶流

无障碍浏览 进入关怀版