网易首页 > 网易号 > 正文 申请入驻

OpenAI 推出 GPT-5.1-Codex-Max 编程模型:可 “通宵” 处理任务,性能跑分超越谷歌

0
分享至

来源:环球网

【环球网科技综合报道】11月20日消息,据VentureBeat报道,OpenAI昨日正式发布新一代智能体编程模型GPT-5.1-Codex-Max,该模型在长远推理、工作效率及实时交互能力上实现显著提升,将取代GPT-5.1-Codex成为Codex集成界面的默认模型,为全球开发者带来更高效的编程辅助体验。


作为OpenAI在编程模型领域的重要升级产品,GPT-5.1-Codex-Max在多项关键编程基准测试中表现亮眼。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,其准确率达到77.9%,小幅领先于谷歌Gemini 3 Pro的76.2%;在Terminal-Bench 2.0测试中,以58.1%的准确率优于Gemini 3 Pro的54.2%;而在竞争激烈的LiveCodeBench Pro编码Elo基准测试中,该模型与Gemini 3 Pro的2439分持平,展现出强劲的综合性能。

此次模型升级的核心亮点是引入“压缩”(Compaction)机制。这一创新架构允许模型在接近上下文窗口限制时,智能保留关键信息并丢弃无关细节,实现了跨越数百万token的连续工作而不降低性能。依托该机制,模型在内部测试中成功完成了持续超过24小时的复杂任务,包括多步骤代码重构和自主调试,同时token效率提升约30%,有效降低了开发成本与响应延迟。

目前,GPT-5.1-Codex-Max已集成到OpenAI旗下多个Codex开发环境,涵盖官方命令行工具(Codex CLI)、内部代码审查工具及各类交互式编程环境。开发者可通过这些工具体验强化学习训练可视化、光学定律模拟等实时交互功能。该模型暂未通过公共API开放,官方表示后续将逐步推进,普通用户需订阅ChatGPT Plus、Pro或企业版等付费计划使用。

据OpenAI透露,其内部95%的工程师每周都会使用Codex系列工具,自采用以来,工程师平均拉取请求(Pull Requests)提交量提升约70%,开发效率显著提高。针对模型的自主性应用,OpenAI明确强调其定位为编码“助手”而非人类替代品。为保障开发安全与透明度,模型会生成详细的终端日志和测试引用,方便开发者审查验证代码,且默认运行于严格的沙盒环境,禁用网络访问以防范安全风险。(纯钧)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有没有姐妹跟我一样,越看国乒女队比赛越觉得王曼昱真的太能打了

有没有姐妹跟我一样,越看国乒女队比赛越觉得王曼昱真的太能打了

小光侃娱乐
2026-01-31 14:45:07
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
日本政坛剧变:166票公明党倒戈,高市时代终结,中方回应

日本政坛剧变:166票公明党倒戈,高市时代终结,中方回应

江山此夜季
2026-01-31 03:19:14
蒋仲平:江西省人民政府原副省长,江西省人大常委会原副主任

蒋仲平:江西省人民政府原副省长,江西省人大常委会原副主任

王姐懒人家常菜
2026-01-31 11:58:37
金晨事件的通报里,有三句话很值得商榷!

金晨事件的通报里,有三句话很值得商榷!

麦杰逊
2026-01-30 19:38:02
铜价要爆了?高盛警告:谁卡住了“铜”,谁就掐住了AI时代的脖子

铜价要爆了?高盛警告:谁卡住了“铜”,谁就掐住了AI时代的脖子

大鱼简科
2026-01-31 14:16:04
日军中最负盛名的板垣师团,为什么最终击败他的却是一支杂牌军?

日军中最负盛名的板垣师团,为什么最终击败他的却是一支杂牌军?

聚焦真实瞬间
2026-01-31 10:52:17
徐彬是狼队历史上第四名中国球员,此前几人仅代表梯队出场

徐彬是狼队历史上第四名中国球员,此前几人仅代表梯队出场

懂球帝
2026-01-30 19:00:12
10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

阿器谈史
2026-01-26 20:05:32
A股:从下周一起,历史或将惊人相似!A股或将再次上演2021年大行情?

A股:从下周一起,历史或将惊人相似!A股或将再次上演2021年大行情?

股市皆大事
2026-01-31 11:09:01
大S离世一周年,两个侄女登上ELLE杂志二月刊,像极刚出道的大小S

大S离世一周年,两个侄女登上ELLE杂志二月刊,像极刚出道的大小S

小娱乐悠悠
2026-01-30 09:06:05
河南一男子闯入女澡堂打人,洗浴中心:他进去打他媳妇;涉事男子已被警方控制

河南一男子闯入女澡堂打人,洗浴中心:他进去打他媳妇;涉事男子已被警方控制

扬子晚报
2026-01-30 12:20:05
49条航线“熔断”仅一天,让人恶心的一幕出现,中方罕见升级警告

49条航线“熔断”仅一天,让人恶心的一幕出现,中方罕见升级警告

壹知眠羊
2026-01-30 21:59:52
秦基伟专程登门看望赋闲的梁兴初,见他闷闷不乐,轻声告知有好消息

秦基伟专程登门看望赋闲的梁兴初,见他闷闷不乐,轻声告知有好消息

磊子讲史
2026-01-15 13:00:57
溥仪9岁仍在吃奶,给他当乳娘有2规矩:一是喂奶,另一个毫无人性

溥仪9岁仍在吃奶,给他当乳娘有2规矩:一是喂奶,另一个毫无人性

小豫讲故事
2026-01-31 06:00:10
别买这种“加绒裤”!央视曝光,真的有毒,穿得越久,危害越大!

别买这种“加绒裤”!央视曝光,真的有毒,穿得越久,危害越大!

张例喜欢软软糯糯
2026-01-31 00:20:07
刘强东上千亿身家背后,儿子却是他一生的痛,感谢章泽天视如己出

刘强东上千亿身家背后,儿子却是他一生的痛,感谢章泽天视如己出

次元君情感
2026-01-30 16:42:20
为什么许多美国人一年四季都不关空调?他们不怕浪费吗?

为什么许多美国人一年四季都不关空调?他们不怕浪费吗?

向航说
2026-01-31 00:25:03
突然发现孩子真的很平庸,难以接受怎么办?网友分享引起万千共鸣

突然发现孩子真的很平庸,难以接受怎么办?网友分享引起万千共鸣

另子维爱读史
2026-01-27 20:48:17
乡村振兴奇观:刘强东发年货,竟顺手解决了全村婚姻大事?

乡村振兴奇观:刘强东发年货,竟顺手解决了全村婚姻大事?

念得小柔
2026-01-30 06:45:46
2026-01-31 15:40:50
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1320227文章数 2708947关注度
往期回顾 全部

科技要闻

中国车企和特斯拉的下一战,战场已定

头条要闻

罕见画面公开 多架"黄皮"歼-20战机完成体系化试飞

头条要闻

罕见画面公开 多架"黄皮"歼-20战机完成体系化试飞

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

成龙入驻小红书,怼脸近照没有老年斑

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

教育
本地
艺术
亲子
军事航空

教育要闻

五年级必会题,最大公因数

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

艺术要闻

15位当代国外画家的16幅具象人物绘画

亲子要闻

白百何终于晒儿子正脸!元宝帅气模样公开,网友:比爸爸还好看

军事要闻

轰-6k在黄岩岛战备警巡示意图公布

无障碍浏览 进入关怀版