网易首页 > 网易号 > 正文 申请入驻

OpenAI最强编程模型登场!连续干活24小时,一次处理几百万token

0
分享至


智东西
作者 陈骏达
编辑 心缘

智东西11月20日报道,今天,OpenAI发布了其最新的智能体编程模型GPT‑5.1‑Codex‑Max,这一模型基于OpenAI最新的推理模型打造,专门面向软件工程、研究、数学等复杂任务进行训练。

与此同时,OpenAI还将GPT-5 Pro升级为GPT-5.1 Pro,据说这一模型在写作、数据分析等方面的能力比前一代模型更强。不过,OpenAI并未披露更多GPT-5.1 Pro的细节。

GPT‑5.1‑Codex‑Max能在单一任务中连贯地处理上百万个token,跨多个上下文窗口运行。这得益于一项叫做压缩(compaction)的技术:模型在接近上下文窗口限制时会自动压缩上下文,保留重要信息,并赋予对话新的上下文窗口,直到任务完成。

这一模型是由OpenAI研究科学家Noam Brown牵头完成的,他在OpenAI专门从事测试时计算,也就是推理的研究。


OpenAI认为,能够持续进行连贯工作,是迈向更通用、更可靠AI系统的基础能力。GPT-5.1-Codex-Max可以独立工作数小时。在OpenAI的内部评估中,GPT-5.1-Codex-Max甚至可以针对同一任务连续工作24小时,持续迭代实现,修复测试失败,最终交付成功的结果。

性能方面,GPT‑5.1‑Codex‑Max在多个编程基准测试中评测优于前代GPT‑5.1‑Codex。该模型还是OpenAI训练的首个适用于在Windows环境里进行编程操作的模型。


推理效率上,GPT‑5.1‑Codex‑Max在中等推理强度下完成任务时,所使用的思考token比GPT‑5.1‑Codex少约30%,但仍能取得更高准确性。

对于不那么敏感延迟但追求质量的任务,还可以开启超高强度推理,让模型花更多时间思考,输出更优解。

OpenAI预计,这种token效率的提升,可以为开发者带来实际的成本节省。


▲GPT‑5.1‑Codex‑Max用更少token实现更高的准确率

目前,GPT-5.1-Codex-Max现已在Codex中提供,可用于CLI、IDE扩展、云端和代码审查,API访问也即将推出。

OpenAI分享了GPT-5.1-Codex-Max打造的多个网页。根据提示词,GPT-5.1-Codex-Max直接打造了一个完全运行在浏览器中的CartPole(倒立摆)强化学习沙箱。

用户不仅可以观看倒立摆的动态,还能通过内置的策略梯度控制器直接训练模型,让AI在实验中不断优化策略。


它提供了神经网络可视化功能,在训练或推理时,用户可以实时观察模型的权重和激活状态,直观理解决策机制。

此外,应用界面清晰展示了每个回合的步数和奖励,并记录了上一次存活时间及历史最佳存活时间,让训练过程和成果一目了然。

在成功实现类似功能的前提下,GPT-5.1-Codex-Max所使用的token数量为27k,而GPT-5.1-Codex的用量为37k。

GPT-5.1-Codex-Max还开发出一个太阳系重力的模拟器。这一应用的目标是让用户直接观察天体的运动轨迹,通过拖拽、点击与操控界面元素,直观理解轨道、速度与引力之间的关系。

这一网页的功能运行流畅,提示词中的功能都得到了不错的实现。用户可点击画布放置带质量的天体,再次点击即可为测试设置初速度向量,借此构建出任意的简易行星系统。

界面提供用于调节中心天体质量与整体时间缩放因子的滑块,允许用户观察同一轨道结构在不同物理条件下的演化过程。


GPT-5.1-Codex-Max打造的下一个案例,可帮助用户直观、动态的方式理解光在两种介质界面上的折射规律——斯涅尔定律(Snell’s Law)。

用户可以通过左右滑块调节介质1与介质2的折射率。折射率改变时,界面实时更新折射角度,呈现不同光学环境下的光线偏折情况。


也有不少网友分享了自己的使用体验。这位网友试着让昨天发布的Gemini 3 Pro和GPT-5.1-Codex-Max对决,提示词是创建一个鹈鹕骑自行车的SVG。

可以看到,GPT-5.1-Codex-Max打造的鹈鹕、自行车等元素明显包含更多细节,也更逼真。


英国定制化贺卡公司Moonpig的AI部门负责人Peter Gostev分享,自己试着让GPT-5.1-Codex-Max打造了一个金门大桥模拟器,他称这绝对是自己从类似提示词中获得的最好的效果。


与GPT-5.1-Pro相比,Gostev认为GPT-5.1-Codex-Max明显更勤快,而且速度也更快。要让GPT-5.1-Pro完成类似的效果,需要不断指出问题,给出明确要求,GPT-5.1-Codex-Max则更有主动性。

AI工程师Peter Dedene分享,自己体验时发现,GPT-5.1-Codex-Max盯着问题看了5分钟,决定以后再处理,自己以前从没见过Codex这么做。在他看来,模型似乎已经拥有意识了。


不过,需要注意的是,随着模型能力的持续提升,安全性也成为一大挑战。OpenAI称GPT-5.1-Codex-Max尚未在内部的Preparedness Framework中达到“高等级网络安全能力”,不过其安全能力已经是业内迄今为止最强大的。

目前,Codex系列模型默认运行在高度隔离的安全沙箱中,文件写入仅限自身工作空间,网络访问被关闭,除非开发者主动启用。这些措施可减少提示词注入(prompt injection)等风险。

OpenAI希望通过渐进式部署的方法从真实世界收集反馈,并及时更新模型的安全防护。

结语:编程模型正在走向“智能体化”时代

从GPT-5.1-Codex-Max可以看出,新一代编程模型已不再是简单的代码生成器,而是能够持续工作、自动调试、主动规划的编程智能体。其长时推理、上下文压缩、自我修复等能力,让模型能独立完成项目级任务。

随着运行成本下降、安全沙箱强化、能力全面增强,未来的软件开发方式也可能出现变化,从“写代码”转向“描述需求+审核结果”,智能体有望承担更多实现与迭代工作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
联盟榜首之争!豪取11连胜的活塞能与卫冕冠军雷霆掰一掰手腕吗?

联盟榜首之争!豪取11连胜的活塞能与卫冕冠军雷霆掰一掰手腕吗?

田先生篮球
2025-11-19 21:00:56
太美了!23岁清华学霸3个月3冠王:和吴艳妮都是有实力的漂亮女生

太美了!23岁清华学霸3个月3冠王:和吴艳妮都是有实力的漂亮女生

念洲
2025-11-20 10:28:19
要交易了?美媒:克莱心里很清楚,他的独行侠生涯早已进入倒计时

要交易了?美媒:克莱心里很清楚,他的独行侠生涯早已进入倒计时

移动挡拆
2025-11-20 02:47:33
演员罗晋父亲去世,享年70岁,知情人:罗晋1年没拍戏,照顾父亲

演员罗晋父亲去世,享年70岁,知情人:罗晋1年没拍戏,照顾父亲

花心电影
2025-11-20 20:05:05
美女美图7139期

美女美图7139期

手工制作阿歼
2025-11-14 08:13:28
解放军警告日本

解放军警告日本

极目新闻
2025-11-19 22:40:07
中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

等风来育儿联盟
2025-08-01 12:21:35
武汉女足2-0!亚冠2轮不败登顶 王霜双响 外援中柱+3次错失必进球

武汉女足2-0!亚冠2轮不败登顶 王霜双响 外援中柱+3次错失必进球

我爱英超
2025-11-20 16:58:37
雷士照明创始人吴长江:一晚输5亿,赌掉300亿公司,送自己进大牢

雷士照明创始人吴长江:一晚输5亿,赌掉300亿公司,送自己进大牢

霹雳炮
2025-11-17 23:20:46
直落两盘横扫!朱琳2-0轻取高馨妤,5次征战全运会圆梦金牌

直落两盘横扫!朱琳2-0轻取高馨妤,5次征战全运会圆梦金牌

全景体育V
2025-11-20 15:36:50
大学生牛掰!困扰警方34年的悬案,一群大学生接手,直接破了?!

大学生牛掰!困扰警方34年的悬案,一群大学生接手,直接破了?!

英国那些事儿
2025-11-19 23:25:36
闷声发大财!中国手机界迎来新王者,连续三季度销冠,反超华为?

闷声发大财!中国手机界迎来新王者,连续三季度销冠,反超华为?

毒sir财经
2025-11-19 21:12:02
南海打捞出日军沉船,一铁箱被焊死,切开后专家哽咽:不是人!

南海打捞出日军沉船,一铁箱被焊死,切开后专家哽咽:不是人!

大千世界观
2025-11-17 21:46:22
全世界找不出第二个国家,能把所有邻国都得罪遍,还都是领土问题

全世界找不出第二个国家,能把所有邻国都得罪遍,还都是领土问题

扶苏聊历史
2025-11-18 17:47:25
太遗憾!2米26的张子宇, 又一次无缘WCBA

太遗憾!2米26的张子宇, 又一次无缘WCBA

体育哲人
2025-11-19 23:17:52
郑丽文提出“一国两区”,最新民调出炉,支持率飙升,赖清德急了

郑丽文提出“一国两区”,最新民调出炉,支持率飙升,赖清德急了

井普椿的独白
2025-11-20 13:07:29
5轮2分垫底!14亿人口大国丢脸:无缘世界杯后 连亚洲杯都进不去

5轮2分垫底!14亿人口大国丢脸:无缘世界杯后 连亚洲杯都进不去

侃球熊弟
2025-11-20 10:24:43
又一则励志新闻翻车了!

又一则励志新闻翻车了!

清书先生
2025-10-21 15:51:40
林徽因生母何雪媛罕见留影,气质阴郁又无能,亲手把女儿逼进地狱

林徽因生母何雪媛罕见留影,气质阴郁又无能,亲手把女儿逼进地狱

浩渺青史
2025-11-17 17:35:39
73岁普京完成年度体检,称:在医院待了两天,谢天谢地一切正常

73岁普京完成年度体检,称:在医院待了两天,谢天谢地一切正常

鲁中晨报
2025-11-20 16:33:03
2025-11-20 23:44:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10775文章数 116905关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

游戏
时尚
亲子
房产
公开课

SIE社长:对PlayStation品牌在日本衰落深感危机

全球颜值最高女孩集体掀桌,网友:太爽了

亲子要闻

重庆知名幼儿园爆雷后:负责人已被批捕,接收方收餐费遭反对

房产要闻

超95亿!三亚巨量资产,突然甩出!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版