OpenAI发布GPT-5.4：支持100万Token上下文，83%专业任务超越人类|编程|gpt|工作流|新论文|token|openai

OpenAI发布GPT-5.4：支持100万Token上下文，83%专业任务超越人类

2026-03-06 10:13:44　来源: 宗熙先生

湖北举报

分享至

2026年3月5日，OpenAI正式重磅发布GPT-5.4，这是该公司迄今为止推出的最强大、最高效的专业工作前沿模型，全方位刷新了行业对通用AI的性能认知。同时，OpenAI同步发布GPT-5.4 Pro版本，该版本专门面向需要在复杂任务中追求极致性能的专业用户，进一步满足高端场景需求。

GPT-5.4主要具有以下几个方面的核心优势：

一、在ChatGPT中的主要升级

GPT-5.4 Thinking新增提前思考规划功能，用户可在模型生成内容的过程中实时调整方向，无需多次反复交互，就能在单次对话中获得更精准、更贴合预期的最终输出。

该模式还大幅提升了深度网络研究能力，尤其在处理高度特定化、精细化查询时表现更为突出，同时能在长时思考任务中更稳定地维持上下文连贯性，避免信息断层。这些改进共同作用，为用户带来更高质量、更快速且更贴合任务需求的交互体验。

二、在Codex与API中方面的突破

GPT-5.4 是该公司首个原生具备世界领先级计算机使用能力的通用模型，可支持代理在真实计算机环境中自主操作，顺畅执行跨应用、多步骤的复杂工作流，无需额外插件辅助。它支持高达100万token的超长上下文长度，让代理能够在长周期、多环节的复杂任务中，完整完成规划、执行、验证的全流程，无需频繁中断或分段处理。

同时，该模型创新引入工具搜索机制，在大型工具生态中能大幅提升工具选择的精准度与效率，且完全不牺牲模型本身的智能决策水平，实现效率与质量的兼顾。

三、知识工作能力大幅提升

在GDPval测试中（覆盖美国GDP前九大行业、44个职业的真实知识工作任务），GPT-5.4 以83.0%的胜率或平局率，成功匹配或超越行业专业人士，这一成绩远超GPT-5.2的70.9%，优势显著。测试覆盖的任务类型广泛，包括销售演示文稿制作、财务电子表格处理、急诊排班表制定、制造图纸解析等各类高频专业场景。

四、计算机使用与视觉理解

作为首个原生支持计算机使用的通用模型，GPT-5.4 在OSWorld-Verified桌面环境基准测试中，达成75.0%的成功率，不仅超过人类平均水平（72.4%），更较GPT-5.2的47.3%实现跨越式提升。在视觉理解基准MMMU-Pro上，其无工具得分达81.2%（GPT-5.2为79.5%），在无需外部工具辅助的情况下，视觉识别与理解能力持续优化。

API中新增的图像输入细节级别，可支持最高1024万像素的全保真感知，能精准捕捉图像细微细节，大幅提升定位精度与点击准确性，完美适配高精度视觉相关任务需求。

五、编程能力

GPT-5.4深度融合GPT-5.3-Codex的核心编程优势，在SWE-Bench Pro编程基准测试中，不仅实现更高的代码准确率，同时维持更低的响应延迟，兼顾编程效率与代码质量。启用/fast模式后，token生成速度可提升至1.5倍，大幅缩短编程、文本生成的等待时间，进一步提升开发工作流效率。

六、工具使用优化

引入工具搜索机制后，在MCP Atlas基准的250个任务中，token总消耗降低47%，而任务准确率始终保持不变，实现效率与质量的双重优化。此外，代理式工具调用在Toolathlon基准测试中，实现准确率与效率的双重提升，进一步优化复杂任务的处理体验。

七、网络搜索与浏览能力

在BrowseComp基准（硬核信息检索场景）中，GPT-5.4得分达82.7%，Pro版更是高达89.3%，较GPT-5.2实现显著提升，信息检索的精准度与效率得到大幅优化，能更好地满足深度信息查询需求。

八、可控性与安全性

GPT-5.4 Thinking支持响应前置规划功能，用户可在模型生成响应的过程中中途干预、调整方向，实现更灵活的交互控制。目前该功能已正式上线chatgpt.com和Android应用，iOS版也将在近期推出。

安全层面，提供高网络安全能力防护策略，同时新增CoT可控性评估机制，可有效确认模型不会故意隐藏推理链，便于后续监控与风险管控，进一步提升模型使用安全性。

九、可用性与定价

GPT-5.4（API名称：gpt-5.4）及GPT-5.4 Pro（gpt-5.4-pro）已正式上线API，开发者可立即接入使用，快速体验新一代模型的核心优势。ChatGPT平台中，GPT-5.4 Thinking自今日起向Plus、Team、Pro用户全面开放，将逐步取代GPT-5.2 Thinking，后者将在模型选择器“旧版模型”中保留至2026年6月5日，方便用户过渡适应。

企业类、教育类用户可通过管理员设置提前启用该功能；Pro版用户与企业计划用户则可直接使用性能更强劲的GPT-5.4 Pro。Codex平台现已支持实验性100万token上下文功能，但需注意的是，超限请求将按2倍标准计费。

总的来看，此次GPT-5.4的发布，标志着通用人工智能在专业工作领域的应用迈入了一个全新的阶段。它不仅是单纯的性能迭代，更是对AI作为生产力工具的一次根本性重构。通过引入原生计算机使用能力、超长上下文记忆、前瞻性的思考规划以及精准的工具搜索机制，GPT-5.4成功将AI从被动的信息提供者，转变为一个能够主动规划、执行并验证复杂任务的自主智能体。

无论是面向专业人士的极致性能追求，还是为普通用户带来的高效交互体验，OpenAI再次证明了其在推动AI技术落地与商业化进程中的引领地位。随着GPT-5.4系列产品的全面上线，我们正见证一个由AI深度赋能的工作新时代的到来。（完）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.