网易首页 > 网易号 > 正文 申请入驻

OpenAI 推出 GPT-5.1-Codex-Max 编程模型:可 “通宵” 处理任务,性能跑分超越谷歌

0
分享至

来源:环球网

【环球网科技综合报道】11月20日消息,据VentureBeat报道,OpenAI昨日正式发布新一代智能体编程模型GPT-5.1-Codex-Max,该模型在长远推理、工作效率及实时交互能力上实现显著提升,将取代GPT-5.1-Codex成为Codex集成界面的默认模型,为全球开发者带来更高效的编程辅助体验。


作为OpenAI在编程模型领域的重要升级产品,GPT-5.1-Codex-Max在多项关键编程基准测试中表现亮眼。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,其准确率达到77.9%,小幅领先于谷歌Gemini 3 Pro的76.2%;在Terminal-Bench 2.0测试中,以58.1%的准确率优于Gemini 3 Pro的54.2%;而在竞争激烈的LiveCodeBench Pro编码Elo基准测试中,该模型与Gemini 3 Pro的2439分持平,展现出强劲的综合性能。

此次模型升级的核心亮点是引入“压缩”(Compaction)机制。这一创新架构允许模型在接近上下文窗口限制时,智能保留关键信息并丢弃无关细节,实现了跨越数百万token的连续工作而不降低性能。依托该机制,模型在内部测试中成功完成了持续超过24小时的复杂任务,包括多步骤代码重构和自主调试,同时token效率提升约30%,有效降低了开发成本与响应延迟。

目前,GPT-5.1-Codex-Max已集成到OpenAI旗下多个Codex开发环境,涵盖官方命令行工具(Codex CLI)、内部代码审查工具及各类交互式编程环境。开发者可通过这些工具体验强化学习训练可视化、光学定律模拟等实时交互功能。该模型暂未通过公共API开放,官方表示后续将逐步推进,普通用户需订阅ChatGPT Plus、Pro或企业版等付费计划使用。

据OpenAI透露,其内部95%的工程师每周都会使用Codex系列工具,自采用以来,工程师平均拉取请求(Pull Requests)提交量提升约70%,开发效率显著提高。针对模型的自主性应用,OpenAI明确强调其定位为编码“助手”而非人类替代品。为保障开发安全与透明度,模型会生成详细的终端日志和测试引用,方便开发者审查验证代码,且默认运行于严格的沙盒环境,禁用网络访问以防范安全风险。(纯钧)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大布妻子每月零花钱100万刀,富豪岳父认为小贝没给儿子足够支持

大布妻子每月零花钱100万刀,富豪岳父认为小贝没给儿子足够支持

云隐南山
2026-01-30 11:40:07
小学生“倒数第一”试卷又火了,老师:这孩子智商太高,我教不了

小学生“倒数第一”试卷又火了,老师:这孩子智商太高,我教不了

浩源的妈妈
2026-01-27 06:29:07
鹿哈将“成为”闫学晶?称连30万都拿不出来,忘记初心易翻车

鹿哈将“成为”闫学晶?称连30万都拿不出来,忘记初心易翻车

然哥闲聊
2026-01-30 21:00:03
杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

体坛大事记
2026-01-30 11:01:10
可控核聚变、固态电池、存储芯片:三个前沿技术赛道,普通人咋看

可控核聚变、固态电池、存储芯片:三个前沿技术赛道,普通人咋看

Thurman在昆明
2026-01-30 20:00:24
行货iPhone15跌成狗!全新卖2000多元,摆明要清仓下架了

行货iPhone15跌成狗!全新卖2000多元,摆明要清仓下架了

科技良辰
2026-01-28 15:51:07
CBA首个主场之夜:主队全胜客队全败,悬殊胶着菜鸟互啄

CBA首个主场之夜:主队全胜客队全败,悬殊胶着菜鸟互啄

老嗮说体育
2026-01-30 23:18:46
没时间了,中俄刚挂断电话,特朗普告知全世界,伊朗灭国之战在即

没时间了,中俄刚挂断电话,特朗普告知全世界,伊朗灭国之战在即

萧鑟科普解说
2026-01-30 17:45:21
天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

削桐作琴
2026-01-28 18:17:22
恩比德赛后警告马克西:别再故意罚丢!76人险胜背后的惊险决策

恩比德赛后警告马克西:别再故意罚丢!76人险胜背后的惊险决策

大眼瞄世界
2026-01-30 12:11:09
央视最新曝光:中美疑似爆发激烈海上交锋,外舰挑衅被我052D锁定

央视最新曝光:中美疑似爆发激烈海上交锋,外舰挑衅被我052D锁定

壹知眠羊
2026-01-27 20:03:05
末节崩盘23中4!完全打不了硬仗,内线支柱倒下,还不交易?

末节崩盘23中4!完全打不了硬仗,内线支柱倒下,还不交易?

阿浪的篮球故事
2026-01-30 16:50:09
原来李莉就是“春晚钉子户”孙涛的老婆,难怪孙涛每年都能上春晚

原来李莉就是“春晚钉子户”孙涛的老婆,难怪孙涛每年都能上春晚

李健政观察
2026-01-29 09:23:45
赵丽颖和赵德胤分手了?男方与前女友复合拍新片,没和赵丽颖二搭

赵丽颖和赵德胤分手了?男方与前女友复合拍新片,没和赵丽颖二搭

萌神木木
2026-01-30 16:44:57
起风了!加拿大对华改口,禁止与中签协定,65万吨油菜籽白买?

起风了!加拿大对华改口,禁止与中签协定,65万吨油菜籽白买?

花小猫的美食日常
2026-01-30 06:49:18
绿色旗袍美女 身材曼妙 多姿多彩

绿色旗袍美女 身材曼妙 多姿多彩

喜欢历史的阿繁
2026-01-31 00:55:33
创维退市!“彩电大王”成弃子?

创维退市!“彩电大王”成弃子?

互联网那些事
2026-01-30 18:32:55
2026款宝马7系上市!售价80.8万起,豪华行政外观,搭3.0T V6引擎

2026款宝马7系上市!售价80.8万起,豪华行政外观,搭3.0T V6引擎

小史谈车
2026-01-28 18:08:05
中国春节赴日2376班航班取消!中国游客消费2万亿被嫌弃,日网友:欧美游客多了,不亏!

中国春节赴日2376班航班取消!中国游客消费2万亿被嫌弃,日网友:欧美游客多了,不亏!

东京新青年
2026-01-27 17:56:04
万茜自曝上学时没人追,看清她的校服照后,网友:这谁敢追啊!

万茜自曝上学时没人追,看清她的校服照后,网友:这谁敢追啊!

背包旅行
2026-01-17 15:03:45
2026-01-31 01:52:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1320100文章数 2708913关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

金晨是否构成肇事逃逸 助理顶包有何后果 律师解读

头条要闻

金晨是否构成肇事逃逸 助理顶包有何后果 律师解读

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

健康
艺术
手机
旅游
军事航空

耳石症分类型,症状大不同

艺术要闻

惊艳!越南摄影师镜头下的妩媚女子!

手机要闻

差200元!红米Turbo 5与Max该怎么选?这4点核心差异看完不纠结!

旅游要闻

“先回家再出游” 火了!春节错峰旅行,省钱还不挤

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版