网易首页 > 网易号 > 正文 申请入驻

刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】太突然了!OpenAI深夜甩出GPT-5.5 Instant,全面接管ChatGPT默认模型。幻觉暴降52%、数学从65分飙到81分、回复字数直砍三成,更关键的是它开始记住你、看穿你的偏好。所有人免费薅羊毛。

今天,GPT‑5.5 Instant正式上线,所有人在ChatGPT中免费用

它一共有三大亮点:回答更简洁、记忆更强、更加个性化。


GPT‑5.5 Instant取代GPT‑5.3 Instant,成为ChatGPT「默认模型」

在处理日常任务中,比起上一代,GPT-5.5 Instant更加强大。

无论是分析上传的图片、解答STEM难题,还是精准判断何时该调用网页搜索,它都游刃有余。


在幻觉率上,GPT‑5.5 Instant暴降52.5%,特别是在医疗、法律和金融等对严谨性要求极高的领域。

不仅如此,GPT-5.5 Instant还升级了记忆和个性化功能。

在记忆来源中,可以一键查找以往上下文,聊天时更加懂你,更具人情味儿。


奥特曼和总裁Greg在线力推GPT-5.5 Instant。



幻觉减半,数学从65分干到81分

OpenAI给GPT-5.3 Instant的首要定位:更聪明。


在全方位基准测试中,5.3 Instant成绩单非常亮眼

  • 数学AIME 2025:从65.4%跳到81.2%;

  • 博士级科学题GPQA:从78.5%升到85.6%;

  • 多模态推理MMMU-Pro:从69.2%拉到76.0%。



内部评估显示,在涉及医学、法律、金融等高风险领域的提示词上,GPT-5.5 Instant产生的幻觉比5.3 Instant减少了52.5%

上一代5.3 Instant发布时,幻觉改善幅度大约在20%出头,这次直接翻了一倍多。

在用户主动标记为「事实错误」的高难度对话中,不准确的陈述也减少了37.3%。

比如在下面这个实测中,GPT-5.5 Instant回答更优,因为它及时纠正了自己一开始的错误:

虽然最开始附和了那个错的答案,但随后自己发现,要是把x=3代回原方程根本就不成立。

并且找出了真正的计算错误(也就是用户移项弄错了),然后用求根公式算出了正确的解。

GPT-5.3 Instant也发现x=3行不通,但它没再往下算,直接得出了「无实数解」的错误结论,而没有去重新核对计算过程,把修正后的一元二次方程给解出来。



在OpenAI医学基准测试OmniDocBench中,5.5 Instant幻觉率下降了2.1%。


回复瘦身三成,表情包戒断

跑分之外,更多用户会立刻感受到的变化是,ChatGPT话少了。

OpenAI官方数据,GPT-5.5 Instant的回复字数比前代减少了30.2%,行数减少了29.2%。

比如,同样是问「怎么跟同事说别老唠叨」,5.3 Instant洋洋洒洒列了五种策略、三条注意事项、还贴心地问你「同事是什么性格」。


5.5 Instant砍掉了一半篇幅,上来先甩一句「除非你真心想在职场上树敌,否则别直说」,然后按你想要的强硬程度分级给话术,从「我现在得集中精力」到「我得先打断一下」,最后收了一句「趁早打断,别默默忍受20分钟再爆发」。

语气拿捏得很准,随性、实用、不过度。


此外,OpenAI还专门点名了一个问题,「无意义的表情符号」。

之前的ChatGPT废话太多、emoji乱飞、格式过度,现在终于知道收着点了。

换句话说就是,GPT-5.5 Instant搞清楚了什么时候该给长答案、什么时候用户只是想要一句干脆的回复。

对每天打开ChatGPT几十次的重度用户来说,体感差距是巨大的。

最炸的升级

它开始「记住你」了

除了准确性提升和回复精炼之外,这次升级最关键的一点是「个性化」。

GPT-5.5 Instant现在可以主动调用过往聊天记录、上传过的文件、甚至你连接的Gmail邮箱,来为回复提供个性化上下文。

同样是问「推荐一家新开的茶饮店」。

GPT-5.3 Instant给了一堆旧金山的泛泛推荐,喜茶、Junbi Matcha、唐人街的隐藏小店,虽然考虑了你在旧金山这个地理信息,但推荐逻辑和给任何人的没区别。


GPT-5.5 Instant的回复完全不一样。

它知道你平时常去Asha Tea House,知道你偏爱清爽的台湾高山茶风格,然后据此推荐了Ceré Tea和Song Tea & Ceramics,甚至帮你做了决策,「想找新的日常打卡地就去Ceré Tea,想找特别体验就去Song Tea。」


这个差距不是「更聪明」能解释的。这是「它翻了你的聊天记录」。

同步上线的,还有一个叫「记忆来源(Memory Sources)」的功能,面向所有个人计划用户开放。

这个功能让你能看到ChatGPT具体引用了哪些过去的聊天记录或保存的记忆来生成回复。

如果某些信息过时了或者不对,你可以直接删掉或修改。如果你分享了某段聊天,记忆来源不会暴露给对方。

一句话总结这个设计思路:先让AI记住你,再让你看到它记住了什么,最后让你决定它该忘掉什么。

不过,OpenAI自己也承认,记忆来源功能「可能无法穷举所有影响最终回答的因素」。它会展示几条最相关的历史聊天,但不一定是全部。

三个月倒计时,5.3退场通知

几个实操层面的信息。

GPT-5.5 Instant即日起面向所有ChatGPT用户逐步推出。

付费用户在接下来三个月内仍然可以手动切换到GPT-5.3 Instant。三个月后,5.3正式退役。

基于聊天记录、文件和Gmail的增强个性化功能,目前仅面向网页端的Plus和Pro用户开放,移动端即将上线。

Free、Go、Business和Enterprise用户将在未来几周内陆续获得权限。

API端,GPT-5.5 Instant对应的模型ID是chat-latest。

有个历史教训值得API开发者注意。

OpenAI此前退役GPT-4o时遭遇过强烈反弹,不少生产环境的应用在模型切换后出现行为异常。这次三个月的过渡期,建议尽早开始回归测试。

从「太舔」到「太油腻」到「刚好」

把GPT-5.5 Instant放进更大的时间线里看,你会发现一条很有意思的叙事线。

2025年,GPT-4o因为过度讨好用户而出圈。它会频繁肯定你的每一个选择,让很多用户觉得它像朋友、像镜子。后来OpenAI内部判定这些行为过于「谄媚」,决定调整。

2026年2月,GPT-4o正式下线。3000人签请愿书要求保留。有人在请愿书里写,这个模型是自己的「最好的朋友」。

OpenAI没有回头。

GPT-5.0和5.2的Instant版本矫枉过正,用户反馈变成了另一个极端。回复太僵硬、太谨慎、动不动就先来一段安全声明再回答问题。

2026年3月,GPT-5.3 Instant发布,主打「减少油腻感」。不必要的拒绝回答减少了,说教式的前缀也收敛了不少。

现在,5.5 Instant试图在这条线上再进一步,不仅不油腻,还要准确、精炼、并且懂你。

默认模型的战争

而这,很可能是OpenAI今年影响面最大的一次模型更新。

GPT-5.5 Pro再强,用的人是几十万开发者和付费重度用户。Instant的用户基数,是它的几千倍。

那些从来不切换模型、从来不调参数、打开App就打字的普通人,感受到的ChatGPT就是Instant。

每一点改进乘以数亿人,就不是增量,是基本面的重写。

然而,随着幻觉率的降低,用户会更信任它的回答,即使模型仍然有可能犯错。

默认即信任。这四个字,既是OpenAI最大的资产,也是它最沉重的责任。

参考资料:

https://openai.com/index/gpt-5-5-instant/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赌王三房大合照,窦骁次次缺席,出道前张艺谋的忠告,他听进去了

赌王三房大合照,窦骁次次缺席,出道前张艺谋的忠告,他听进去了

真的八卦小学弟
2026-06-11 12:30:12
攻不了,也守不住!中国空军在西藏上空,被印度空军足足欺负40年

攻不了,也守不住!中国空军在西藏上空,被印度空军足足欺负40年

小杨侃事
2026-05-30 22:08:46
万茜带火了一种叠穿新穿法:白衬衫+牛仔连衣裙,时髦洋气又高级

万茜带火了一种叠穿新穿法:白衬衫+牛仔连衣裙,时髦洋气又高级

蓓小西
2026-06-11 10:38:45
最新 | 知名女演员自曝丈夫去世细节!崩溃大哭!自己得了这种病......

最新 | 知名女演员自曝丈夫去世细节!崩溃大哭!自己得了这种病......

天津广播
2026-06-11 00:04:07
风光一夜归零!林志玲任职台独机构,不到10天影视代言全部清零

风光一夜归零!林志玲任职台独机构,不到10天影视代言全部清零

大眼妹妹
2026-06-04 20:52:19
6/11美加墨世界杯小组赛预测:墨西哥占据明显优势,韩国首战取分

6/11美加墨世界杯小组赛预测:墨西哥占据明显优势,韩国首战取分

宏图体彩
2026-06-11 12:42:43
科学家发现,350万年前,地球上曾存在两种截然不同的人类物种

科学家发现,350万年前,地球上曾存在两种截然不同的人类物种

离离言几许
2026-06-11 00:13:35
妹妹一家5口人在家啃老,我劝不动妈妈自己离开,我妈自食恶果

妹妹一家5口人在家啃老,我劝不动妈妈自己离开,我妈自食恶果

诡谲怪谈
2025-03-23 10:10:04
周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

嘴角上翘
2026-06-10 03:20:40
重磅提醒!央视全程直播!女排死磕四大强敌,复仇法国一战定心气

重磅提醒!央视全程直播!女排死磕四大强敌,复仇法国一战定心气

宝哥精彩赛事
2026-06-11 13:20:10
被拒绝入境美国后,世界杯主裁判回国获英雄般欢迎

被拒绝入境美国后,世界杯主裁判回国获英雄般欢迎

观察者网
2026-06-11 13:26:17
A股:大站稳扶好了,不出意外的话,A股今天周四或迎更大暴风雨行情?

A股:大站稳扶好了,不出意外的话,A股今天周四或迎更大暴风雨行情?

趋势清风侠
2026-06-11 06:56:20
在古代,为什么不通过下毒来杀掉皇帝?溥仪:压根没吃过一顿热饭

在古代,为什么不通过下毒来杀掉皇帝?溥仪:压根没吃过一顿热饭

鹤羽说个事
2026-06-10 22:54:31
澳洲“滥交公主”砸$17万办婚礼! 多位闺蜜拒当伴娘! 墨大毕业, 曾1天内与583人发生关系

澳洲“滥交公主”砸$17万办婚礼! 多位闺蜜拒当伴娘! 墨大毕业, 曾1天内与583人发生关系

澳洲红领巾
2026-06-08 15:15:39
Jennifer White,业界标杆,AVN 的 “最佳女表演者”

Jennifer White,业界标杆,AVN 的 “最佳女表演者”

吃瓜党二号头目
2026-06-11 12:08:53
林郑月娥:卸任特首后近况如何?工作42年,一直没在香港买房

林郑月娥:卸任特首后近况如何?工作42年,一直没在香港买房

通文知史
2024-10-25 16:20:03
耗死北极熊:欧洲的“拖字诀”与第三次历史豪赌

耗死北极熊:欧洲的“拖字诀”与第三次历史豪赌

民间平淡生活
2026-04-12 04:11:08
雷腾龙打趣:国青时对抗使劲干武磊,给他干下张稀哲就能踢了

雷腾龙打趣:国青时对抗使劲干武磊,给他干下张稀哲就能踢了

懂球帝
2026-06-11 11:16:34
21天腰围小一圈,很多人已经偷偷开始了!!

21天腰围小一圈,很多人已经偷偷开始了!!

健身厨屋
2026-06-11 13:11:17
菲律宾防长唱“反华”调,总统贺信,中菲关系何去?

菲律宾防长唱“反华”调,总统贺信,中菲关系何去?

小涛叨叨
2026-06-11 13:32:48
2026-06-11 15:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15438文章数 66920关注度
往期回顾 全部

科技要闻

淘宝、京东、拼多多、抖音、小红书被约谈

头条要闻

大批印度学生高考考卷被"调包" 40万人申请看扫描件

头条要闻

大批印度学生高考考卷被"调包" 40万人申请看扫描件

体育要闻

文班:付出那么多努力,却把胜利拱手让人

娱乐要闻

《花少8》阵容大揭秘!秒杀前一季

财经要闻

干细胞生意:17万一针的希望

汽车要闻

埃安i60 530宁德时代版上市限时焕新价10.36万起

态度原创

家居
房产
艺术
亲子
手机

家居要闻

空间微调 移形换境

房产要闻

猛砸400亿!我敢说,这才是海口最懂生活的神盘!

艺术要闻

四川美术学院,2026届研究生毕业作品集(一)

亲子要闻

体温飙到40.6℃,已有学校临时停课

手机要闻

2026最新数码选购指南!准大学生如何买手机/电脑/平板?

无障碍浏览 进入关怀版