网易首页 > 网易号 > 正文 申请入驻

幻觉减半,废话砍三成!被骂一年,OpenAI 终于把 ChatGPT 改对了

0
分享至

来源:市场资讯

(来源:AI信息Gap)

GPT-5.5 Instant,上线了。

替换掉了 GPT-5.3 Instant,成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它,包括免费用户。


最大的变化,一个数字。幻觉减少 52.5%。

我们之前聊过 GPT-5.5 的提示词变化,那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」,专门给 ChatGPT 用的。

在医学、法律、金融这些高风险领域的测试里,GPT-5.5 Instant 比上一代幻觉(编造事实)少了一半。用户以前标记过的「答错了」对话,拿出来重新测,不准确的回答减少了 37.3%。

OpenAI 官方博客放了一个数学例子,有点意思。

一道带根号的方程问题,用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」,后来把答案代回原方程,发现不对,直接宣布「无解」。

原地放弃。

GPT-5.5 Instant 第一次也没看出来。但它多走了一步,回头检查了代数式展开过程,找到具体哪一步算错了,然后用公式重新解出了正确答案。


一个发现错了会放弃,一个发现错了会往回查。

这就是「幻觉减半」背后的东西。很重要。

来看你们最关心的,「跑分」。

竞赛数学 AIME 2025 从 65.4% 涨到 81.2%,提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%,多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%,图表推理 CharXiv 从 75.0% 涨到 81.6%。

文档解析的错误率也从 14.6% 降到了 12.5%。


值得一提的是,选了 Instant 不代表只用 Instant。遇到复杂问题,ChatGPT 会自动切换到 GPT-5.5 Thinking 进行深度推理。

自动路由不占 Thinking 的周用量(虽然你也用不完,Plus 3000 条/周)。

Thinking 推理的时候,ChatGPT 会先显示一段「计划」告诉你它打算怎么做。你可以中途打断调整方向,不用等它全想完再重来。

GPT-5.5 Instant 废话更少了。

它的回复比上一代少用 30.2% 的词,行数减少 29.2%。同样的问题,同样的信息量,篇幅缩短将近三分之一。

OpenAI 提到了一个词,「gratuitous emojis」。

意思是,「别硬塞表情包了」。

以前 ChatGPT 回答问题总喜欢加几个 emoji 表情助兴。现在收敛了。

它也不再动不动追问你了。以前你问一个简单问题,它回答完还要加一句「你还想了解什么?」现在不问了,回答完就停。

这一点在 Claude Opus 4.7 的提示词里也有提及。

ChatGPT 记忆新加了一个功能,叫 「记忆来源」(Memory Sources)。

以前 ChatGPT 只是记住你的信息,但你不知道它在回答时引用了什么。现在回复旁边会显示一个「Sources」按钮,点开能看到这次回答引用了哪条记忆、哪段历史对话。

看到过时的或者有问题的记忆,直接删掉或修改。

小细节,分享对话的时候,记忆来源不会暴露给对方。


GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」(High Capability)的 Instant 级模型。

以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型,也到了需要同等安全防护的程度。

系统安全文档是这样描述的。

GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平,那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。

GPT-5.5 Instant 已经向所有 ChatGPT 用户推送,还没看到的耐心等待就行。

API 模型 ID gpt-5.5-chat-latest。


来看 ChatGPT 最新额度。

GPT-5.5 Instant,免费用户每 5 小时 10 条,超了自动降级到 mini 模型,上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条,上下文窗口 32K。ChatGPT Pro 不限量,上下文窗口 128K。

GPT-5.5 Thinking,付费可选。ChatGPT Plus 和 Business(老 Team 订阅)每周 3000 条爽用,几乎用不完,上下文窗口 256K。ChatGPT Pro 不限量,上下文窗口 400K。

GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。

记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放,手机端很快跟进。

GPT-5 系列从发布到现在,被骂了快一年。网上 5000 多人联名要求换回老模型,70% 和信任有关的讨论都是负面的。

骂得最多的就两件事。瞎编乱造、废话太多。

Sam Altman 这次虽然没有「感受到原子弹爆炸」,但看得出来他同样很激动。


5.5 Instant 全改了。已经搬到 Claude 的朋友们,可以考虑回来了。

我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终身不让吸,史上最严禁烟来了

终身不让吸,史上最严禁烟来了

南风窗
2026-05-06 15:24:30
黄仁勋:中国绝不能获得最先进芯片!

黄仁勋:中国绝不能获得最先进芯片!

中国半导体论坛
2026-05-06 12:43:35
吴宜泽夺冠后,广东小镇火出圈,斯诺克冠军摇篮的含金量还在上升

吴宜泽夺冠后,广东小镇火出圈,斯诺克冠军摇篮的含金量还在上升

洲洲影视娱评
2026-05-05 20:15:23
79岁李家鼎近况曝光,体重仅54公斤,长子不作为200万积蓄被榨干

79岁李家鼎近况曝光,体重仅54公斤,长子不作为200万积蓄被榨干

白面书誏
2026-05-06 17:12:39
对越反击战中爬回国的战士,未杀一敌,却被国家副主席亲授一等功

对越反击战中爬回国的战士,未杀一敌,却被国家副主席亲授一等功

兴趣知识
2026-04-24 15:09:50
全屏马赛克,央视披露的神秘武器,究竟有多先进?

全屏马赛克,央视披露的神秘武器,究竟有多先进?

兵国大事
2026-05-07 00:05:08
浑身都是雷达,中国100式坦克首次公开,混动和智能颠覆西方认知

浑身都是雷达,中国100式坦克首次公开,混动和智能颠覆西方认知

混沌录
2026-05-06 23:01:06
拉夫罗夫致电鲁比奥,希望美国施压乌克兰不要在5月9日袭击莫斯科

拉夫罗夫致电鲁比奥,希望美国施压乌克兰不要在5月9日袭击莫斯科

山河路口
2026-05-06 13:04:55
我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

千秋文化
2026-04-20 19:55:30
中方呼吁防止AI成为少数富国的游戏

中方呼吁防止AI成为少数富国的游戏

界面新闻
2026-05-06 13:59:39
王励勤陈若琳邱贻可获评国家级教练职称,多位现役奥运冠军同获评

王励勤陈若琳邱贻可获评国家级教练职称,多位现役奥运冠军同获评

米修体育
2026-05-06 16:41:38
吴宜泽夺冠,最开心的除了他的父母,可能就是敢扑进冠军怀里的她

吴宜泽夺冠,最开心的除了他的父母,可能就是敢扑进冠军怀里的她

揽星河的笔记
2026-05-05 20:20:47
缅甸政府为何不敢动,拥有4万军队,号称小中国的佤邦?

缅甸政府为何不敢动,拥有4万军队,号称小中国的佤邦?

鹤羽说个事
2026-05-06 22:54:55
1936年亲手活捉蒋介石的孙铭九:建国后,上级部门破例为他谋工作

1936年亲手活捉蒋介石的孙铭九:建国后,上级部门破例为他谋工作

磊子讲史
2026-01-22 10:13:17
网友匿名爆料自己身边的八卦,你永远也想不到,到底能有多炸裂!

网友匿名爆料自己身边的八卦,你永远也想不到,到底能有多炸裂!

夜深爱杂谈
2026-05-03 11:22:10
巨人网络发财了,这就是爆款的力量

巨人网络发财了,这就是爆款的力量

睿财经官方
2026-05-05 10:59:59
什么是985大学?什么是211大学?什么是双一流大学?这里一次说清

什么是985大学?什么是211大学?什么是双一流大学?这里一次说清

悦动教育屋
2026-05-03 07:50:49
余承东在华为权力排名

余承东在华为权力排名

生活新鲜市
2026-04-27 18:30:53
50岁查理兹·塞隆自曝不婚原因:睡小鲜肉太爽了!

50岁查理兹·塞隆自曝不婚原因:睡小鲜肉太爽了!

阿废冷眼观察所
2026-05-05 14:57:32
妈妈带3岁儿子送外卖不幸遭遇车祸,孩子满脸伤痕不哭不闹一直守在身旁,网友:这一刻他就是妈妈的“守护天使”

妈妈带3岁儿子送外卖不幸遭遇车祸,孩子满脸伤痕不哭不闹一直守在身旁,网友:这一刻他就是妈妈的“守护天使”

洪观新闻
2026-05-06 11:24:50
2026-05-07 01:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3119142文章数 7192关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

手机
游戏
房产
公开课
军事航空

手机要闻

“iPhone Ultra”或将成为业内最易维修的折叠屏手机

LPL第二赛段:滔搏排名迅速滑落!JDG三局战胜TES

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版