网易首页 > 网易号 > 正文 申请入驻

OpenAI发布GPT-5.4:支持100万Token上下文,83%专业任务超越人类

0
分享至



2026年3月5日,OpenAI正式重磅发布GPT-5.4,这是该公司迄今为止推出的最强大、最高效的专业工作前沿模型,全方位刷新了行业对通用AI的性能认知。同时,OpenAI同步发布GPT-5.4 Pro版本,该版本专门面向需要在复杂任务中追求极致性能的专业用户,进一步满足高端场景需求。

GPT-5.4主要具有以下几个方面的核心优势:

一、在ChatGPT中的主要升级

GPT-5.4 Thinking新增提前思考规划功能,用户可在模型生成内容的过程中实时调整方向,无需多次反复交互,就能在单次对话中获得更精准、更贴合预期的最终输出。

该模式还大幅提升了深度网络研究能力,尤其在处理高度特定化、精细化查询时表现更为突出,同时能在长时思考任务中更稳定地维持上下文连贯性,避免信息断层。这些改进共同作用,为用户带来更高质量、更快速且更贴合任务需求的交互体验。

二、在Codex与API中方面的突破

GPT-5.4 是该公司首个原生具备世界领先级计算机使用能力的通用模型,可支持代理在真实计算机环境中自主操作,顺畅执行跨应用、多步骤的复杂工作流,无需额外插件辅助。它支持高达100万token的超长上下文长度,让代理能够在长周期、多环节的复杂任务中,完整完成规划、执行、验证的全流程,无需频繁中断或分段处理。

同时,该模型创新引入工具搜索机制,在大型工具生态中能大幅提升工具选择的精准度与效率,且完全不牺牲模型本身的智能决策水平,实现效率与质量的兼顾。



三、知识工作能力大幅提升

在GDPval测试中(覆盖美国GDP前九大行业、44个职业的真实知识工作任务),GPT-5.4 以83.0%的胜率或平局率,成功匹配或超越行业专业人士,这一成绩远超GPT-5.2的70.9%,优势显著。测试覆盖的任务类型广泛,包括销售演示文稿制作、财务电子表格处理、急诊排班表制定、制造图纸解析等各类高频专业场景。



四、计算机使用与视觉理解

作为首个原生支持计算机使用的通用模型,GPT-5.4 在OSWorld-Verified桌面环境基准测试中,达成75.0%的成功率,不仅超过人类平均水平(72.4%),更较GPT-5.2的47.3%实现跨越式提升。在视觉理解基准MMMU-Pro上,其无工具得分达81.2%(GPT-5.2为79.5%),在无需外部工具辅助的情况下,视觉识别与理解能力持续优化。

API中新增的图像输入细节级别,可支持最高1024万像素的全保真感知,能精准捕捉图像细微细节,大幅提升定位精度与点击准确性,完美适配高精度视觉相关任务需求。

五、编程能力

GPT-5.4深度融合GPT-5.3-Codex的核心编程优势,在SWE-Bench Pro编程基准测试中,不仅实现更高的代码准确率,同时维持更低的响应延迟,兼顾编程效率与代码质量。启用/fast模式后,token生成速度可提升至1.5倍,大幅缩短编程、文本生成的等待时间,进一步提升开发工作流效率。



六、工具使用优化

引入工具搜索机制后,在MCP Atlas基准的250个任务中,token总消耗降低47%,而任务准确率始终保持不变,实现效率与质量的双重优化。此外,代理式工具调用在Toolathlon基准测试中,实现准确率与效率的双重提升,进一步优化复杂任务的处理体验。

七、网络搜索与浏览能力

在BrowseComp基准(硬核信息检索场景)中,GPT-5.4得分达82.7%,Pro版更是高达89.3%,较GPT-5.2实现显著提升,信息检索的精准度与效率得到大幅优化,能更好地满足深度信息查询需求。



八、可控性与安全性

GPT-5.4 Thinking支持响应前置规划功能,用户可在模型生成响应的过程中中途干预、调整方向,实现更灵活的交互控制。目前该功能已正式上线chatgpt.com和Android应用,iOS版也将在近期推出。

安全层面,提供高网络安全能力防护策略,同时新增CoT可控性评估机制,可有效确认模型不会故意隐藏推理链,便于后续监控与风险管控,进一步提升模型使用安全性。

九、可用性与定价



GPT-5.4(API名称:gpt-5.4)及GPT-5.4 Pro(gpt-5.4-pro)已正式上线API,开发者可立即接入使用,快速体验新一代模型的核心优势。ChatGPT平台中,GPT-5.4 Thinking自今日起向Plus、Team、Pro用户全面开放,将逐步取代GPT-5.2 Thinking,后者将在模型选择器“旧版模型”中保留至2026年6月5日,方便用户过渡适应。

企业类、教育类用户可通过管理员设置提前启用该功能;Pro版用户与企业计划用户则可直接使用性能更强劲的GPT-5.4 Pro。Codex平台现已支持实验性100万token上下文功能,但需注意的是,超限请求将按2倍标准计费。

总的来看,此次GPT-5.4的发布,标志着通用人工智能在专业工作领域的应用迈入了一个全新的阶段。它不仅是单纯的性能迭代,更是对AI作为生产力工具的一次根本性重构。通过引入原生计算机使用能力、超长上下文记忆、前瞻性的思考规划以及精准的工具搜索机制,GPT-5.4成功将AI从被动的信息提供者,转变为一个能够主动规划、执行并验证复杂任务的自主智能体。

无论是面向专业人士的极致性能追求,还是为普通用户带来的高效交互体验,OpenAI再次证明了其在推动AI技术落地与商业化进程中的引领地位。随着GPT-5.4系列产品的全面上线,我们正见证一个由AI深度赋能的工作新时代的到来。(完)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
租用无人机运棺材上山土葬,无人机运输从业者:价格一万出头,一般运送的棺材约七八百斤,云贵川需求多

租用无人机运棺材上山土葬,无人机运输从业者:价格一万出头,一般运送的棺材约七八百斤,云贵川需求多

观威海
2026-03-06 14:23:13
陈幸同击败陈熠获世乒赛资格,国乒3男3女名单樊振东在列

陈幸同击败陈熠获世乒赛资格,国乒3男3女名单樊振东在列

三秋体育
2026-03-06 19:28:19
中日关系跌至冰点,日企却用55.5%的暴涨,打了高市早苗一记耳光

中日关系跌至冰点,日企却用55.5%的暴涨,打了高市早苗一记耳光

李健政观察
2026-03-06 10:52:22
黄仁勋:仅用3周 OpenClaw 超越 Linux 30年!

黄仁勋:仅用3周 OpenClaw 超越 Linux 30年!

EETOP半导体社区
2026-03-06 11:36:41
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
79比98狂输19分!女篮争冠热门惨遭爆冷:没张子宇冲冠悬了?

79比98狂输19分!女篮争冠热门惨遭爆冷:没张子宇冲冠悬了?

篮球快餐车
2026-03-06 01:58:58
美伊打了足足6天,朝鲜突然发射巡航导弹,特朗普收到一封挑战书

美伊打了足足6天,朝鲜突然发射巡航导弹,特朗普收到一封挑战书

军机Talk
2026-03-05 18:22:21
阿联酋考虑冻结伊朗资产!此举或重创伊朗经济命脉

阿联酋考虑冻结伊朗资产!此举或重创伊朗经济命脉

财联社
2026-03-06 17:15:05
浙江17岁高中生率先发现新物种,联合发文登上SCI,当事人回应质疑:家长是普通人没人脉,未来想从事生科方向专业

浙江17岁高中生率先发现新物种,联合发文登上SCI,当事人回应质疑:家长是普通人没人脉,未来想从事生科方向专业

潇湘晨报
2026-03-06 13:00:40
法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
不可错过!3月6日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

不可错过!3月6日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

林子说事
2026-03-06 10:11:22
两会第一天,48岁王励勤的“采访”火了,孙颖莎的心愿恐将达成

两会第一天,48岁王励勤的“采访”火了,孙颖莎的心愿恐将达成

小徐讲八卦
2026-03-06 06:05:12
伊朗导弹击中耶路撒冷,驻有美军基地多国传出爆炸声

伊朗导弹击中耶路撒冷,驻有美军基地多国传出爆炸声

界面新闻
2026-03-02 15:09:03
深圳南山再添一所新高校!今年5月正式启用!

深圳南山再添一所新高校!今年5月正式启用!

深圳晚报
2026-03-06 16:39:10
艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

今朝牛马
2025-12-31 19:31:04
阿里决绝“干掉”林俊旸,一场关于千问“集体叛逃”的误读

阿里决绝“干掉”林俊旸,一场关于千问“集体叛逃”的误读

一视财经
2026-03-05 21:21:03
老挝待了三个月,我被问懵了:“你们中国人是不是都没有家?”

老挝待了三个月,我被问懵了:“你们中国人是不是都没有家?”

天下霸奇
2026-02-24 07:59:23
林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

达文西看世界
2026-03-04 15:07:30
为了巴结英日,撕毁中国百亿投资项目,被耍后还想和中国再续前缘

为了巴结英日,撕毁中国百亿投资项目,被耍后还想和中国再续前缘

流史岁月
2026-02-26 16:45:04
货到了客户却被炸死了!中东战事重创义乌,500万迪拜订单失联

货到了客户却被炸死了!中东战事重创义乌,500万迪拜订单失联

温读史
2026-03-06 14:09:39
2026-03-06 22:00:49
宗熙先生
宗熙先生
分享科技、数码、互联网信息。
2971文章数 542关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

媒体:成本2万美元 伊朗的"穷人巡航导弹"把美国打心疼

头条要闻

媒体:成本2万美元 伊朗的"穷人巡航导弹"把美国打心疼

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

家居
数码
房产
手机
公开课

家居要闻

暖棕撞色 轻法奶油风

数码要闻

维咖NUT108铝合金机械键盘发布:套件499元起,成品599元起

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

手机要闻

一加15T爆料汇总,就差价格了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版