网易首页 > 网易号 > 正文 申请入驻

OpenAI发布最强编程模型:AI程序员能“通宵”,性能跑分反超谷歌

0
分享至

IT之家 11 月 20 日消息,OpenAI 昨日(11 月 19 日)发布博文,宣布推出 GPT-5.1-Codex-Max 智能体编程模型,显著提升了长远推理能力、效率和实时交互能力。此外该模型将取代 GPT-5.1-Codex,成为 Codex 集成界面上的默认模型。


IT之家援引博文介绍,此次发布紧随谷歌 Gemini 3 Pro 之后,但在多个关键编程基准测试中,Codex-Max 展现出更强的实力。例如,在衡量解决实际软件问题的 SWE-Bench Verified 测试中,Codex-Max 以 77.9% 的准确率小幅领先于 Gemini 3 Pro 的 76.2%。



Codex-Max 在 Terminal-Bench 2.0 测试中也领先,准确率达到 58.1%,而 Gemini 的准确率为 54.2%;在 LiveCodeBench Pro(一项竞争激烈的编码 Elo 基准测试)测试中,它的得分与 Gemini 的 2439 分持平。


GPT-5.1-Codex-Max 的一项重大架构升级是引入了名为“压缩”(Compaction)的机制。该机制允许模型在接近其上下文窗口限制时,智能地保留关键上下文信息并丢弃无关细节,从而实现跨越数百万 token 的连续工作而不会出现性能下降。


得益于此,该模型在内部测试中已成功完成持续超过 24 小时的复杂任务,如多步骤代码重构和自主调试。同时,这项技术还提升了约 30% 的 token 效率,有效降低了成本与延迟。

新模型目前已集成到 OpenAI 自家的多个 Codex 开发环境中,包括其官方命令行工具(Codex CLI)、内部代码审查工具以及各类交互式编程环境。

开发者可以通过这些工具体验到模型强大的实时交互能力,例如在可视化界面中进行强化学习训练或模拟光学定律。不过,GPT-5.1-Codex-Max 尚未通过公共 API 提供,但官方表示即将开放。普通用户则需要订阅 ChatGPT Plus、Pro 或企业版等付费计划才能使用。

OpenAI 透露,其内部 95% 的工程师每周都会使用 Codex,自采用以来,这些工程师平均多提交了约 70% 的拉取请求(Pull Requests),显著提升了内部开发速度。

尽管 Codex-Max 具备高度的自主性,OpenAI 仍强调它应作为编码“助手”而非人类的替代品。为保证透明度,模型会生成详细的终端日志和测试引用,以便开发者审查和验证其生成的所有代码。此外,模型在默认情况下运行于严格的沙盒环境中,并禁用了网络访问,以确保安全性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大骗子成为首席科学家,起底江苏科技大学郭伟

大骗子成为首席科学家,起底江苏科技大学郭伟

财话连篇
2025-11-19 16:53:05
《渴望》这3位演员再也见不到了,以为退居幕后,其实早已去世

《渴望》这3位演员再也见不到了,以为退居幕后,其实早已去世

温读史
2025-11-11 19:27:55
把不同的自己,都装在生活的取景框里。

把不同的自己,都装在生活的取景框里。

侦姐有料
2025-10-23 10:31:44
夏思凝这个腿真粗!

夏思凝这个腿真粗!

时分秒说
2025-10-28 10:51:40
欧足联明令禁止科索沃与波黑在世预赛附加赛交锋

欧足联明令禁止科索沃与波黑在世预赛附加赛交锋

星耀国际足坛
2025-11-19 23:24:36
新秀榜更新:湖人被截胡的次轮秀升至第四!弗拉格场均15分排第三

新秀榜更新:湖人被截胡的次轮秀升至第四!弗拉格场均15分排第三

你的篮球频道
2025-11-20 08:30:55
不应该把精力放在防农民工“返乡滞乡”上, 要放在防经济滑坡上

不应该把精力放在防农民工“返乡滞乡”上, 要放在防经济滑坡上

三农雷哥
2025-11-19 17:18:15
李春平死了

李春平死了

霹雳炮
2025-11-05 22:34:23
一张图证明刘景扬真没主管教练 意外之金靠自己拼!今后教练会有的

一张图证明刘景扬真没主管教练 意外之金靠自己拼!今后教练会有的

劲爆体坛
2025-11-20 09:58:10
三级片没有死,只是换了个活法而已!

三级片没有死,只是换了个活法而已!

时分秒说
2025-11-03 11:19:46
辛芷蕾的炸裂10分钟,让人大受震撼

辛芷蕾的炸裂10分钟,让人大受震撼

Yuki女人故事
2025-11-19 15:01:11
中日一战不可避免,日本达成一致:解放军若武统,日本定武力介入

中日一战不可避免,日本达成一致:解放军若武统,日本定武力介入

胖福的小木屋
2025-11-20 00:02:51
前辈是怎么找到她同事家的?!

前辈是怎么找到她同事家的?!

贵圈真乱
2025-11-19 14:14:07
钓鱼台国宾馆18号楼:需要什么资格才可以住进去

钓鱼台国宾馆18号楼:需要什么资格才可以住进去

贱议你读史
2025-11-19 15:20:43
林志玲首谈离婚,自曝患抑郁:结婚才3年,简直像换了一个人!

林志玲首谈离婚,自曝患抑郁:结婚才3年,简直像换了一个人!

热闹吃瓜大姐
2025-11-17 19:59:42
86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

知鉴明史
2025-10-23 14:01:49
巴萨离谱操作:要求莱万别进球!否则要付250万 莱万懵了

巴萨离谱操作:要求莱万别进球!否则要付250万 莱万懵了

叶青足球世界
2025-11-20 16:01:23
请神容易送神难!有一说一,现役NBA最无交易市场的5大巨星如下

请神容易送神难!有一说一,现役NBA最无交易市场的5大巨星如下

毒舌NBA
2025-11-12 14:45:50
收评|太离谱!全球大涨!A股怎么了?

收评|太离谱!全球大涨!A股怎么了?

龙行天下虎
2025-11-20 15:22:55
被剪刀差剪掉的一生:1.8亿农村老人为何只能靠百元养老金度日?

被剪刀差剪掉的一生:1.8亿农村老人为何只能靠百元养老金度日?

霹雳炮
2025-11-02 20:52:08
2025-11-20 17:51:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
316078文章数 606767关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

"最美光二代"高海纯即将大婚 新郎是霸王茶姬创始人

头条要闻

"最美光二代"高海纯即将大婚 新郎是霸王茶姬创始人

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

换购价15.98万起 广汽丰田全新威兰达上市

态度原创

时尚
本地
数码
房产
健康

这四组绝美的冬季配色,很“暖”!

本地新闻

卖力整活儿的大湾鸡,靠疯癫成了新顶流

数码要闻

王自如:AI眼镜无法取代手机 它仅仅是手机的延伸

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

警惕超声报告这六大"坑"

无障碍浏览 进入关怀版