网易首页 > 网易号 > 正文 申请入驻

GPT-5.4重磅发布:多模态跃迁,开发者狂欢

0
分享至

2026年3月6日,OpenAI官方正式上线GPT-5.4系列大模型,分为适配日常复杂任务的Thinking版与主打专业场景的Pro版。这一具有里程碑意义的更新,迅速点燃全球开发者社区的热情,作为OpenAI首次将前沿推理、编码能力与智能体功能深度融合的核心产品,GPT-5.4凭借多模态能力的突破性提升,重新界定AI与人类的协作边界,推动人工智能从“被动响应”向“主动执行”加速迈进。


核心升级:多模态能力突破,多项指标赶超人类水平

GPT-5.4最具突破性的升级,集中在多模态能力的全面升级,尤其在原生计算机操控、视觉感知及专业任务处理三大领域实现关键性突破,多项权威基准测试指标成功赶超人类平均水平。该模型无需额外搭载第三方工具,仅通过截图识别与键盘鼠标指令,就能完成跨应用的复杂操作,大幅优化了AI与计算机的交互逻辑。

在多项权威基准测试中,GPT-5.4表现突出:OSWorld-Verified桌面操作基准测试中,其成功率达到75.0%,较前代GPT-5.2提升28个百分点,首次超越人类平均水平(72.4%);Online-Mind2Web网页操作测试中,成功率高达92.8%,显著优于ChatGPT Atlas智能体模式的70.9%。此外,其MMMU-Pro视觉理解测试成功率达81.2%,OmniDocBench文档解析平均错误率降至0.109,较前代均有大幅提升。

与此同时,GPT-5.4新增“思考过程预览”功能,可提前展示自身推理逻辑,方便用户及时调整需求;支持100万tokens的上下文窗口(可理解为AI能同时处理的文本长度),助力智能体高效完成长周期任务,进一步拓宽了多模态技术的应用场景。

里程碑价值:AI从“辅助工具”向“数字员工”升级

GPT-5.4的正式发布,不仅是OpenAI发展历程中的重要节点,更标志着全球AI产业正式迈入“全能协作”的全新阶段。与前代模型“能力碎片化”“需外挂工具才能实现复杂操作”的局限不同,该模型将推理、编码、智能体三大核心能力深度整合,定位为“可独立完成各类真实工作的AI数字员工”,实现了从“对话交互”到“落地执行”的模式升级。

在专业领域,GPT-5.4的表现已接近人类专家水平:GDPval基准测试中,83.0%的项目达到行业专业标准,较前代提升12个百分点;投行级电子表格建模平均得分87.3%,其生成的演示文稿获得68.0%评审者的认可。同时,该模型的单个陈述错误率下降33%,有效改善了前代模型“幻觉现象突出”的行业痛点。

OpenAI相关负责人表示,GPT-5.4的迭代核心是“让AI更贴合人类需求、更易落地应用”,其原生集成的多元能力,将推动AI技术在金融、法律、设计等多个领域实现规模化落地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
25岁感染艾滋病女生自述:我不怪任何人,只恨自己太无知

25岁感染艾滋病女生自述:我不怪任何人,只恨自己太无知

千秋文化
2026-04-05 19:07:08
真牛!10公斤残骸砸中Model Y车顶没击穿,特斯拉又被讨论疯了

真牛!10公斤残骸砸中Model Y车顶没击穿,特斯拉又被讨论疯了

华人生活网
2026-04-05 04:13:12
NBA场均得分乔丹最高 总得分詹姆斯最高 到底谁才是历史第一

NBA场均得分乔丹最高 总得分詹姆斯最高 到底谁才是历史第一

体坛八点半的那些事儿
2026-04-06 19:13:23
赛义德·马吉德·哈德米,遇袭身亡

赛义德·马吉德·哈德米,遇袭身亡

南方都市报
2026-04-06 16:57:31
很多人,都低估了30年房贷的杀伤力

很多人,都低估了30年房贷的杀伤力

一条要飞跃的咸鱼
2026-04-06 11:08:43
上海市中心租金回报翻车.....

上海市中心租金回报翻车.....

新浪财经
2026-04-05 17:52:46
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

共工之锚
2026-03-31 00:27:37
研究:中国全球支持率超越美国达到36%

研究:中国全球支持率超越美国达到36%

俄罗斯卫星通讯社
2026-04-05 16:06:24
伊朗正式回复调解方:未来几天里不愿在巴基斯坦与美国官员会面

伊朗正式回复调解方:未来几天里不愿在巴基斯坦与美国官员会面

财联社
2026-04-04 02:04:15
哈萨克斯坦2000万吨稀土转卖美日,签完协议发现,还是绕不开中国

哈萨克斯坦2000万吨稀土转卖美日,签完协议发现,还是绕不开中国

触摸史迹
2026-04-06 18:30:43
这可能是中日经济最后一战!GDP最新数据,打了高市早苗一记耳光

这可能是中日经济最后一战!GDP最新数据,打了高市早苗一记耳光

趣味萌宠的日常
2026-04-06 02:37:31
61岁港星清明回乡祭祖!蹲泥地徒手啃烤猪,吃得满嘴油光,接地气

61岁港星清明回乡祭祖!蹲泥地徒手啃烤猪,吃得满嘴油光,接地气

小娱乐悠悠
2026-04-06 08:40:19
伊朗外交部:伊朗已准备好对调解方的回应

伊朗外交部:伊朗已准备好对调解方的回应

澎湃新闻
2026-04-06 18:17:06
1938年老蒋制造黄河决堤,日军淹死数量惊人,真实情况你可能不信

1938年老蒋制造黄河决堤,日军淹死数量惊人,真实情况你可能不信

浩舞默画
2026-04-06 09:22:04
张雪与凯越老总私下会面,对方主动祝贺,张雪顺势澄清辞职原因

张雪与凯越老总私下会面,对方主动祝贺,张雪顺势澄清辞职原因

潮鹿逐梦
2026-04-04 23:43:09
随着西汉姆联4-6出局,英格兰足总杯4强全部出炉:2大豪门在列

随着西汉姆联4-6出局,英格兰足总杯4强全部出炉:2大豪门在列

侧身凌空斩
2026-04-06 05:12:22
现在已经不是美国敢不敢打中国的问题,是中国让不让美国打的问题

现在已经不是美国敢不敢打中国的问题,是中国让不让美国打的问题

走进事件的中心
2026-04-05 16:43:25
联合国曾警告:中国一旦人口迅速萎缩,或将是全球“最大的挑战”

联合国曾警告:中国一旦人口迅速萎缩,或将是全球“最大的挑战”

冷眼看尽世间繁华
2026-04-06 10:25:06
10名主教练或下岗!最强洗牌潮要来了....

10名主教练或下岗!最强洗牌潮要来了....

柚子说球
2026-04-06 17:18:22
33岁程序员午休健身时猝死!公司:属于工作时间,人社局:不算工伤!法院判了……

33岁程序员午休健身时猝死!公司:属于工作时间,人社局:不算工伤!法院判了……

环球网资讯
2026-04-05 13:56:06
2026-04-06 19:47:00
运营缓存中
运营缓存中
实用运营工具分享
22文章数 0关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

头条要闻

媒体:付出不菲代价 "拯救大兵"行动仍有疑点未解开

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

游戏
时尚
数码
旅游
艺术

连续两年!XBOX第一方霸榜PS游戏商店 索尼是喜是忧?

AI时代,辨别真相的成本变高了

数码要闻

消息称LG电子有意三星显示QD-OLED 27" UHD 240Hz显示器面板

旅游要闻

天坛、智化寺的绝美梨花,能结出梨吗?

艺术要闻

殊相——中国油画学会创作研修作品展 | 油画选刊(五)

无障碍浏览 进入关怀版