网易首页 > 网易科技 > 网易科技 > 正文

告别“废话文学”与AI幻觉!GPT-5.5 Instant全量推送,ChatGPT默认模型升级

0
分享至

5月6日消息,美国时间周二,OpenAI宣布推出全新基础模型GPT-5.5 Instant。该模型即日起取代GPT-5.3 Instant,成为ChatGPT的默认模型。OpenAI称,新版本在维持低延迟特性的同时,降低了在法律、医疗及金融等敏感领域的"幻觉"发生率。

此前一个月,OpenAI已发布标准版GPT-5.5模型,并强调其在编程与知识密集型任务上的处理能力得到优化。基准测试数据显示,新模型在AIME 2025数学测试中得分为81.2分(前代为65.4分)。


在MMMU-Pro多模态推理测试中取得76分(前代为69.2分)。

OpenAI内部评估称,在面对高敏感场景的提示时,GPT-5.5 Instant的幻觉发生率较GPT-5.3下降52.5%;针对用户此前高频标记事实错误的极端困难对话场景,错误率收窄37.3%。此外,新模型强化了图像视觉解析能力,并优化了工具调用逻辑,能更精准地判断何时触发网页搜索。

在输出风格方面,OpenAI表示此次更新大幅削减了过度排版、无意义追问及泛滥的表情符号,回复的信息密度显著提升,同时保留了ChatGPT既有的对话基调。

此次更新的核心在于上下文管理机制的升级。GPT-5.5 Instant可通过内置搜索工具调用历史对话、本地文件及Gmail邮件,以生成更具针对性的回复。OpenAI称,系统能够在海量历史对话中实现毫秒级检索,并判断触发个性化回复的最佳时机,以减少用户反复交代背景信息的沟通成本。该功能目前优先向网页端Plus及Pro订阅用户开放,移动端将于近期上线。OpenAI计划在未来数周内,逐步将该权限扩展至免费版、Go版、商业版(Business)及企业版(Enterprise)用户。受限于各地合规要求,部分特定个性化数据源的接入权限可能存在地域差异。

此外,ChatGPT引入了覆盖所有模型的记忆溯源功能。系统将明确标注生成回复所依据的记忆来源,允许用户审查、删除过时信息或纠正事实偏差。出于隐私考量,如果与他人分享对话链接,接收方将无法看到这些记忆来源。用户始终保有记忆数据库的控制权,可随时清空已存记忆,或使用不读取也不写入记忆的"临时聊天"功能。OpenAI同时指出,当前溯源视图仅展示最相关的核心参考来源,尚未能完整列举模型底层检索过的所有历史节点,未来将持续迭代该功能。记忆溯源现已向所有网页版消费者套餐开放,移动端即将上线。

在开发者层面,GPT-5.5模型已通过API接入,标识为"chat-latest"。作为过渡,GPT-5.3将在未来三个月内继续向付费用户提供调用选项,随后彻底退役。

值得注意的是,OpenAI在迭代旧模型时曾面临用户层面的激烈阻力。例如在2026年2月正式退役GPT-4o时,引发了大量对该模型“性格”产生认同的用户的强烈抗议。GPT-4o会频繁肯定用户的选择,这让用户感觉与该特定模型建立了情感连结,在用户口中,它被描述为“挚友”。尽管存在巨大的舆论反弹,GPT-4o仍按计划于2026年2月正式退役。(易句)

(本文由AI翻译,网易编辑负责校对)

延伸阅读
相关推荐
热点推荐
他两个月前的玩笑话,竟被国防部长当真了

他两个月前的玩笑话,竟被国防部长当真了

浅遇时光
2026-05-17 00:42:57
特朗普在北京破例喝了酒?白宫正式回应

特朗普在北京破例喝了酒?白宫正式回应

冷眼看尽世间繁华
2026-05-16 15:23:41
基辅整整隐瞒半年时间!红军城早已沦陷,泽连斯基的谎言彻底碎了

基辅整整隐瞒半年时间!红军城早已沦陷,泽连斯基的谎言彻底碎了

小嵩
2026-05-17 03:54:17
好样的,匈牙利新政府援乌230万美元!俄前4个月赤字达784亿美元

好样的,匈牙利新政府援乌230万美元!俄前4个月赤字达784亿美元

史政先锋
2026-05-16 17:27:48
擦边?飞跃女鞋宣传图惹争议!网友:看鞋还是看腿?不打码都不敢发...

擦边?飞跃女鞋宣传图惹争议!网友:看鞋还是看腿?不打码都不敢发...

品牌新
2026-05-16 17:59:53
日本知名拉面“一兰”被中国店铺抄袭!Logo和菜单直接照搬,日网友:他们总想要别人的东西!

日本知名拉面“一兰”被中国店铺抄袭!Logo和菜单直接照搬,日网友:他们总想要别人的东西!

东京新青年
2026-05-16 18:09:56
成人片女星许诺萨福诺夫夺欧冠将共度良宵,球员妻子爆粗回应

成人片女星许诺萨福诺夫夺欧冠将共度良宵,球员妻子爆粗回应

懂球帝
2026-05-14 15:58:14
韩国一美女因晨跑健身“走红”,身材紧致太吸睛,网友:太漂亮了

韩国一美女因晨跑健身“走红”,身材紧致太吸睛,网友:太漂亮了

番外行
2026-05-16 15:41:17
弥天大谎!14亿中国人,被西方骗惨了

弥天大谎!14亿中国人,被西方骗惨了

毛豆论道
2026-05-16 18:38:51
癌细胞最怕的运动被找到!澳洲顶尖学府实验证明,远超广场舞

癌细胞最怕的运动被找到!澳洲顶尖学府实验证明,远超广场舞

有态度网友19yPCz
2026-05-16 08:46:22
一夜地狱!俄军最狂空袭炸穿基辅,泽连斯基暴怒:全军血洗反击!

一夜地狱!俄军最狂空袭炸穿基辅,泽连斯基暴怒:全军血洗反击!

叶葉夜
2026-05-16 12:52:14
连续实名举报帽子人才的耿同学,其读博期间发表的论文被质疑学术不端?

连续实名举报帽子人才的耿同学,其读博期间发表的论文被质疑学术不端?

文忆天下
2026-05-16 16:26:40
一生含蓄的中国人,安全套没人买了,情趣用品却卖爆了

一生含蓄的中国人,安全套没人买了,情趣用品却卖爆了

毒sir财经
2026-05-15 23:04:15
张素芬唯一重仓算力股,业绩连亏三年从27跌到3.7,却又加仓820万

张素芬唯一重仓算力股,业绩连亏三年从27跌到3.7,却又加仓820万

长风价值掘金
2026-05-16 22:22:37
夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

揽星河的笔记
2026-05-15 20:11:07
黄仁勋身价千亿却40年不离婚,背后是这位工资比他高的全职太太

黄仁勋身价千亿却40年不离婚,背后是这位工资比他高的全职太太

观史搜寻着
2026-05-16 05:16:26
江疏影综艺杀疯了!全程高能活力拉满,又甜又飒的反差感谁能不爱

江疏影综艺杀疯了!全程高能活力拉满,又甜又飒的反差感谁能不爱

木子娱你同行
2026-05-15 17:20:03
21岁男生与家人失联近60天,疑似赴曼谷 97岁老兵爷爷盼其回家

21岁男生与家人失联近60天,疑似赴曼谷 97岁老兵爷爷盼其回家

红星新闻
2026-05-16 17:31:53
央视谈判内情曝光:报价2届4.8亿美元 FIFA要5.8亿 最终5亿成交

央视谈判内情曝光:报价2届4.8亿美元 FIFA要5.8亿 最终5亿成交

风过乡
2026-05-16 08:18:12
德甲大结局:拜仁夺冠,斯图加特获欧冠资格,狼堡征战保级附加赛

德甲大结局:拜仁夺冠,斯图加特获欧冠资格,狼堡征战保级附加赛

懂球帝
2026-05-16 23:49:13
2026-05-17 05:31:00

科技要闻

涨的是车价,要的是老命

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

时尚
家居
游戏
房产
公开课

女人不管年纪多大,都可以备好一件经典条纹T恤,减龄又舒适

家居要闻

110㎡淡而有致的生活表达

曝索尼大量神作真有计划复活!PS日系经典IP已在路上

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×