![]()
2026年3月5日,OpenAI正式重磅发布GPT-5.4,这是该公司迄今为止推出的最强大、最高效的专业工作前沿模型,全方位刷新了行业对通用AI的性能认知。同时,OpenAI同步发布GPT-5.4 Pro版本,该版本专门面向需要在复杂任务中追求极致性能的专业用户,进一步满足高端场景需求。
GPT-5.4主要具有以下几个方面的核心优势:
一、在ChatGPT中的主要升级
GPT-5.4 Thinking新增提前思考规划功能,用户可在模型生成内容的过程中实时调整方向,无需多次反复交互,就能在单次对话中获得更精准、更贴合预期的最终输出。
该模式还大幅提升了深度网络研究能力,尤其在处理高度特定化、精细化查询时表现更为突出,同时能在长时思考任务中更稳定地维持上下文连贯性,避免信息断层。这些改进共同作用,为用户带来更高质量、更快速且更贴合任务需求的交互体验。
二、在Codex与API中方面的突破
GPT-5.4 是该公司首个原生具备世界领先级计算机使用能力的通用模型,可支持代理在真实计算机环境中自主操作,顺畅执行跨应用、多步骤的复杂工作流,无需额外插件辅助。它支持高达100万token的超长上下文长度,让代理能够在长周期、多环节的复杂任务中,完整完成规划、执行、验证的全流程,无需频繁中断或分段处理。
同时,该模型创新引入工具搜索机制,在大型工具生态中能大幅提升工具选择的精准度与效率,且完全不牺牲模型本身的智能决策水平,实现效率与质量的兼顾。
![]()
三、知识工作能力大幅提升
在GDPval测试中(覆盖美国GDP前九大行业、44个职业的真实知识工作任务),GPT-5.4 以83.0%的胜率或平局率,成功匹配或超越行业专业人士,这一成绩远超GPT-5.2的70.9%,优势显著。测试覆盖的任务类型广泛,包括销售演示文稿制作、财务电子表格处理、急诊排班表制定、制造图纸解析等各类高频专业场景。
![]()
四、计算机使用与视觉理解
作为首个原生支持计算机使用的通用模型,GPT-5.4 在OSWorld-Verified桌面环境基准测试中,达成75.0%的成功率,不仅超过人类平均水平(72.4%),更较GPT-5.2的47.3%实现跨越式提升。在视觉理解基准MMMU-Pro上,其无工具得分达81.2%(GPT-5.2为79.5%),在无需外部工具辅助的情况下,视觉识别与理解能力持续优化。
API中新增的图像输入细节级别,可支持最高1024万像素的全保真感知,能精准捕捉图像细微细节,大幅提升定位精度与点击准确性,完美适配高精度视觉相关任务需求。
五、编程能力
GPT-5.4深度融合GPT-5.3-Codex的核心编程优势,在SWE-Bench Pro编程基准测试中,不仅实现更高的代码准确率,同时维持更低的响应延迟,兼顾编程效率与代码质量。启用/fast模式后,token生成速度可提升至1.5倍,大幅缩短编程、文本生成的等待时间,进一步提升开发工作流效率。
![]()
六、工具使用优化
引入工具搜索机制后,在MCP Atlas基准的250个任务中,token总消耗降低47%,而任务准确率始终保持不变,实现效率与质量的双重优化。此外,代理式工具调用在Toolathlon基准测试中,实现准确率与效率的双重提升,进一步优化复杂任务的处理体验。
七、网络搜索与浏览能力
在BrowseComp基准(硬核信息检索场景)中,GPT-5.4得分达82.7%,Pro版更是高达89.3%,较GPT-5.2实现显著提升,信息检索的精准度与效率得到大幅优化,能更好地满足深度信息查询需求。
![]()
八、可控性与安全性
GPT-5.4 Thinking支持响应前置规划功能,用户可在模型生成响应的过程中中途干预、调整方向,实现更灵活的交互控制。目前该功能已正式上线chatgpt.com和Android应用,iOS版也将在近期推出。
安全层面,提供高网络安全能力防护策略,同时新增CoT可控性评估机制,可有效确认模型不会故意隐藏推理链,便于后续监控与风险管控,进一步提升模型使用安全性。
九、可用性与定价
![]()
GPT-5.4(API名称:gpt-5.4)及GPT-5.4 Pro(gpt-5.4-pro)已正式上线API,开发者可立即接入使用,快速体验新一代模型的核心优势。ChatGPT平台中,GPT-5.4 Thinking自今日起向Plus、Team、Pro用户全面开放,将逐步取代GPT-5.2 Thinking,后者将在模型选择器“旧版模型”中保留至2026年6月5日,方便用户过渡适应。
企业类、教育类用户可通过管理员设置提前启用该功能;Pro版用户与企业计划用户则可直接使用性能更强劲的GPT-5.4 Pro。Codex平台现已支持实验性100万token上下文功能,但需注意的是,超限请求将按2倍标准计费。
总的来看,此次GPT-5.4的发布,标志着通用人工智能在专业工作领域的应用迈入了一个全新的阶段。它不仅是单纯的性能迭代,更是对AI作为生产力工具的一次根本性重构。通过引入原生计算机使用能力、超长上下文记忆、前瞻性的思考规划以及精准的工具搜索机制,GPT-5.4成功将AI从被动的信息提供者,转变为一个能够主动规划、执行并验证复杂任务的自主智能体。
无论是面向专业人士的极致性能追求,还是为普通用户带来的高效交互体验,OpenAI再次证明了其在推动AI技术落地与商业化进程中的引领地位。随着GPT-5.4系列产品的全面上线,我们正见证一个由AI深度赋能的工作新时代的到来。(完)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.