网易首页 > 网易号 > 正文 申请入驻

刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对

0
分享至


就在刚刚,OpenAI 正式推送了 GPT-5.5 Instant,将其设为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant,面向所有用户开放。

Instant 系列是 ChatGPT 的日常主力模型,每天有数以亿计的用户在用。官方说,在这个量级上,哪怕只是小幅改进,积累起来的效果也相当可观。

这个版本主打三件事:更准确、更简洁、更懂你。


与上一版本相比,新模型在保持低延迟的同时,在准确性、回复风格和个性化能力上都有明显提升。

准确性的提升,在高风险领域最为突出。内部测试显示,GPT-5.5 Instant 在医疗、法律、金融类问题上的幻觉率较上一版本下降了 52.5%。对用户此前标记过的错误对话,错误率也减少了 37.3%。除文字问答外,图片和照片的分析能力、理科问题的解答质量,以及判断何时应当主动调用搜索工具,都有所改善。


数学和科学能力的跃升幅度更大。在 AIME 2025 竞赛数学测试中,GPT-5.5 Instant 得分 81.2,GPT-5.3 Instant 仅为 65.4。博士级科学测试 GPQA 的得分从 78.5 升至 85.6,多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76,科学图表理解 CharXiv 从 75 升至 81.6,文档解析错误率则从 14.6% 降至 12.5%。

OpenAI 用一道代数题演示了两个版本的差距。用户提交了一道根式方程的解题过程,询问是否正确。GPT-5.3 Instant 发现 x=3 代入原方程不成立后,直接判定「无实数解」,没有再往前追查。GPT-5.5 Instant 同样发现 x=3 无效,但随后定位到用户展开 (x-1)² 时的具体错误,并正确解答。

回复风格也是这次更新的重点。

新模型更简短,不再堆砌格式和表情符号,也减少了不必要的追问。官方以一个日常场景为例:问如何委婉地让话多的同事少说点话。


GPT-5.3 Instant 给出了五种分类策略,还附上「不该做什么」清单,结构完整但略显过度。GPT-5.5 Instant 的回复少了 30.2% 的字数和 29.2% 的行数,语气更像朋友给的建议,把重点放在如何把问题引到自己的专注需求上,而不是对方的说话习惯上。


个性化能力是此次更新的另一条主线。

Plus 和 Pro 用户可以让模型调取历史对话、上传文件以及关联的 Gmail 内容,从而获得更贴合个人情况的回答,不需要每次重新解释背景。官方展示了一个茶馆推荐的对比:GPT-5.3 Instant 只知道用户在旧金山,推荐了几家通用热门店。GPT-5.5 Instant 则从历史对话里找到用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录,据此推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics,并说明了推荐理由。

与此同时,所有消费者版本将上线「记忆来源」功能。

当回答用到了个人背景信息,用户可以看到具体调用了哪些历史对话或已保存的记忆条目,并可随时删除或修正过时内容。OpenAI 说明,这个视图展示的是最相关的部分来源,不一定覆盖模型检索过的全部记录,后续会持续完善。不想被记录的用户也可以选择临时对话模式,该模式不会读取或更新任何记忆。分享对话时,对方看不到这些来源记录。


GPT-5.3 Instant 将保留三个月供付费用户使用,之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放,移动端及免费、Go、企业等版本的推送计划在未来几周内陆续跟进,具体功能因地区而异。对开发者而言,GPT-5.5 Instant 已通过 API 以「chat-latest」名称提供。

哦,对了,今天 OpenAI 也即将举行一场派对。

奥特曼在 Stripe Sessions 的一场对谈里聊到,他在筹备 GPT-5.5 的上线派对时,顺手问了模型一句:你想要什么样的派对?模型认真给了一份清单。它希望派对定在美国当地时间 5 月 5 日,演讲环节越短越好,要有人类创造者上台致祝酒词,但它自己不想上台祝酒。


它还提议现场设一个专门收集 GPT-5.6 建议的环节,并把这些建议反馈给它自己。Sam Altman 说,这些要求「很美好」,能让派对顺利进行。时间最终定在下午 5 点 55 分,也是模型自己的选择。

而派对地点则定在 OpenAI 旧金山总部,非本地嘉宾的机票和酒店由 OpenAI 负责。

受邀名单由 Codex 从推文回复中筛选,报名链接于 4 月 30 日下午 5 点 55 分关闭。24 小时内有超过 8000 人报名,已有用户晒出了收到的邀请邮件。没被选上的人也收到了一封邮件,OpenAI 给他们的 Codex 调用额度提升了 10 倍,有效期到 6 月 5 日。

奥特曼还回应了用户的调侃:马斯克如果想来也可以来,世界需要更多爱。话是这么说,可惜马斯克现在的爱全在状告奥特曼以及 OpenAI 的起诉书里了,庆祝 GPT-5.5 的香槟只能留给奥特曼自己喝了。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
斯基拉:阿利松与尤文谈妥个人条款,3年合同,年薪500万欧

斯基拉:阿利松与尤文谈妥个人条款,3年合同,年薪500万欧

懂球帝
2026-05-06 16:54:07
神州租车一口气又买1万台坦克300!这波操作我看懂了三点

神州租车一口气又买1万台坦克300!这波操作我看懂了三点

小南看车
2026-05-04 16:52:43
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
完爆英维克!CPU价格暴涨,6家核心唯一龙头蓄势翻倍!

完爆英维克!CPU价格暴涨,6家核心唯一龙头蓄势翻倍!

慧眼看世界哈哈
2026-05-04 12:29:45
钱再多有什么用,郭富城称无法接受年过六旬,每天喝几十杯咖啡

钱再多有什么用,郭富城称无法接受年过六旬,每天喝几十杯咖啡

阿斚田侃故事
2026-03-12 11:10:42
“愿为美兵”“分中国为七国”,北大教授遭开除,如今下场怎么样

“愿为美兵”“分中国为七国”,北大教授遭开除,如今下场怎么样

今墨缘
2026-05-03 10:23:55
最高法最新司法解释明确:超过法定退休年龄的劳动者也获赔误工费

最高法最新司法解释明确:超过法定退休年龄的劳动者也获赔误工费

中国青年报
2026-05-06 11:46:22
煽动躺平的阴谋注定破产

煽动躺平的阴谋注定破产

此地无言
2026-05-05 15:19:57
男子开车返沪路上看懵:旁边的车里,主驾副驾2个女孩在睡觉?头都歪在一边,主驾的手不在方向盘上,腿还蜷缩着

男子开车返沪路上看懵:旁边的车里,主驾副驾2个女孩在睡觉?头都歪在一边,主驾的手不在方向盘上,腿还蜷缩着

新民晚报
2026-05-05 20:20:14
1936年亲手活捉蒋介石的孙铭九:建国后,上级部门破例为他谋工作

1936年亲手活捉蒋介石的孙铭九:建国后,上级部门破例为他谋工作

磊子讲史
2026-01-22 10:13:17
绿清“绿皮书”| 绿清控股《企业文化手册(修订版)》焕新发布

绿清“绿皮书”| 绿清控股《企业文化手册(修订版)》焕新发布

家园卫士
2021-07-13 17:51:34
化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

宝哥精彩赛事
2026-05-03 21:36:21
卫健委已将奥美拉唑列为重点监控药物!医生:服用千万注意4个点

卫健委已将奥美拉唑列为重点监控药物!医生:服用千万注意4个点

路医生健康科普
2026-05-06 17:44:35
中国股市唯一赚钱最快思路:就买这一种股票,赚到盆满钵满!

中国股市唯一赚钱最快思路:就买这一种股票,赚到盆满钵满!

股经纵横谈
2026-05-06 16:40:33
我年过六十岁才恍然大悟:为什么大多数女人都对六十岁以上的男人敬而远之,甚至会主动回避,两个原因

我年过六十岁才恍然大悟:为什么大多数女人都对六十岁以上的男人敬而远之,甚至会主动回避,两个原因

心理观察局
2026-05-04 08:51:10
2026高龄补贴新规升级,80岁以上每月最高领500元,千万别错过了

2026高龄补贴新规升级,80岁以上每月最高领500元,千万别错过了

颐年斋
2026-05-06 08:35:21
十二星座2026年5月7号运势:挫败时需要反思,莫冲动

十二星座2026年5月7号运势:挫败时需要反思,莫冲动

YAO叔星座
2026-05-06 21:02:57
实施不到48小时,特朗普紧急喊停“霍尔木兹自由计划”:美伊在达成一项全面且最终的协议方面取得重大进展

实施不到48小时,特朗普紧急喊停“霍尔木兹自由计划”:美伊在达成一项全面且最终的协议方面取得重大进展

都市快报橙柿互动
2026-05-06 08:07:25
全固态硬盘时代结束了?2026年装机新逻辑

全固态硬盘时代结束了?2026年装机新逻辑

野生运营
2026-05-05 21:05:19
李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

西楼知趣杂谈
2026-04-26 10:18:11
2026-05-07 01:28:49
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38804文章数 2601618关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

手机
房产
时尚
公开课
军事航空

手机要闻

“iPhone Ultra”或将成为业内最易维修的折叠屏手机

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

有些路,不必每一步都走得那么用力

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版