3月6日,OpenAI正式推出GPT-5.4系列模型,同步上线ChatGPT、API及Codex平台。这是OpenAI首个原生支持“计算机使用”能力的通用模型,可跨应用操控电脑执行复杂工作流,支持100万token上下文。
GPT-5.4整合推理、编程、代理式工作流三大能力。在GDPval测试中,83%任务达到或超越专业水平。计算机操作能力超人类,OSWorld测试成功率75.0%,超人类72.4%。模型可通过截图理解界面,执行鼠标点击和键盘输入。
编程融合GPT-5.3-Codex优势,新增“Playwright Interactive”实验功能,SWE-Bench Pro测试57.7%。Codex中/fast模式token生成速度提升1.5倍。工具搜索功能使token消耗降低47%,Toolathlon测试准确率54.6%。
价格引发开发者热议。AI云服务创企Hyperbolic CTO Yuchen Jin吐槽,对GPT-5.4 Pro说了一句“Hi”,模型思考5分18秒,花掉80美元(约合人民币551元)。有开发者称“价格太疯狂,完全没法基于它做开发”。更有网友称其为现实版的龙虾。
GPT-5.4 Thinking向ChatGPT付费用户开放,Pro版面向企业和开发者。GPT-5.2 Thinking将在三个月后下线,GPT-5.1系列将于3月11日从ChatGPT中移除。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.