网易首页 > 网易号 > 正文 申请入驻

刚刚,ChatGPT默认模型升级:废话减少30%

0
分享至

AIPress.com.cn报道

还记得奥特曼曾说过马斯克也可以参加的party吗?



今天它来了!

5月6日,OpenAI正式发布了GPT-5.5 Instant,并将其设为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant。

新版本的目标很明确:更聪明、更准确、更简洁,同时更懂你。



准确性作为本次升级的核心。由于ChatGPT每天服务数亿用户,哪怕只是微小的改进,积累起来也意义重大。

在内部测试中,GPT-5.5 Instant在医疗、法律、金融等高风险领域的"幻觉"内容比上一版减少了52.5%。在用户标记过存在事实错误的高难度对话中,错误率也下降了37.3%。

一道代数题的对比,很能说明问题。

面对同一道方程题,GPT-5.3 Instant注意到了x=3代入后不成立,于是得出"无实数解"的结论,就此打住。问题在于,它没有回头检查代数步骤本身,错误出在展开过程中,x²-3x-6被错误写成了x²-x-6,导致两个解都变成了增根被排除。GPT-5.5 Instant则不同,它先是认可了解题过程,然后发现x=3代入不符,进一步追溯到展开步骤的具体错误,重新建立方程,用求根公式得出正确答案(3+√33)/2。能自我纠错,这是质的不同。



在多项标准测评中,新模型的提升也相当显著。

科学图表推理准确率从75%升至81.6%,专业多模态推理从69.2%升至76%,博士级科学题从78.5%升至85.6%,竞赛数学题的准确率更是从65.4%大幅跳升至81.2%,文档解析的错误率也从14.6%降至12.5%。



除了更准,新模型的表达方式也变了。

回复更简洁,不再动辄分五六条、语气更接近正常对话,也不会在不必要的地方塞满emoji。

同时,GPT-5.5 Instant使用的单词数减少了30.2%,行数减少了29.2%。它的回复更有力,语气非正式、实用且符合职场规范,避免了过度解释。它针对不同情况提供了可用的脚本。

GPT-5.3的功能虽然更全面,尤其是在“不该做什么”部分,但对于一个非正式的建议提示来说,它显得有些过于复杂,结构和润色可能超出了用户的实际需求。

这次更新还强化了个性化能力。

模型现在更善于调用过去对话的上下文、上传的文件,以及连接的Gmail内容,让回复更贴合用户的实际情况。系统会自动判断哪些回答值得做个性化处理,而不是每次都堆砌上下文。

在官方的实例中是如何给用户推荐茶馆,旧版给出了一份通用榜单,新版则基于用户之前提到的喜好直接给出三个定向推荐,并说明了每家适合哪种心情去。

与此同时,OpenAI还在所有ChatGPT模型中上线了"记忆来源"功能。

能看到回复个性化时具体调用了哪些信息,比如保存的记忆条目,或是历史对话。如果某条信息过时或不再准确,也可以直接删除或修改。分享对话时,记忆来源不会对他人可见。用户也可以使用"临时对话"模式,完全不调用、也不更新记忆。



OpenAI官方表示,记忆来源旨在让个性化设置更容易理解,但它可能无法显示影响答案的所有因素。例如,它可能只会显示来源中最相关的一些历史聊天记录,而不是它搜索和引用的所有历史聊天记录。

GPT-5.3 Instant将在三个月后退役。个性化功能目前首先面向Plus和Pro用户的网页端开放,移动端和其他付费计划将在未来几周内陆续跟进。记忆来源功能则面向所有消费者计划用户开放。部分功能的具体可用情况因地区而异。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
遗憾官宣!陈赫直播透露:李晨加盟《五哈》彻底受阻多次协调无果

遗憾官宣!陈赫直播透露:李晨加盟《五哈》彻底受阻多次协调无果

乐悠悠娱乐
2026-05-10 12:13:20
特朗普亲信现身北京,开口就要中国采购波音,中方6个字敲定全局

特朗普亲信现身北京,开口就要中国采购波音,中方6个字敲定全局

咸鱼金脑袋
2026-05-10 20:28:18
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2026-05-10 08:23:18
4000万镑稳了!曼联首签引爆夏窗,巴西铁腰空降藏大动作

4000万镑稳了!曼联首签引爆夏窗,巴西铁腰空降藏大动作

姜来不加盐
2026-05-10 13:37:27
CPR急救课上,老师突然真的心脏病突发骤停! 终于,学生们用刚学的技能救活了他!

CPR急救课上,老师突然真的心脏病突发骤停! 终于,学生们用刚学的技能救活了他!

英国那些事儿
2026-05-07 23:30:16
2000万买断加盟广东队?王少杰打成大腿,朱芳雨或给出顶薪!

2000万买断加盟广东队?王少杰打成大腿,朱芳雨或给出顶薪!

绯雨儿
2026-05-10 15:02:59
英超球队欧冠奖金排名:阿森纳1.22亿镑领跑,利物浦第二

英超球队欧冠奖金排名:阿森纳1.22亿镑领跑,利物浦第二

懂球帝
2026-05-10 18:09:21
21 岁徐悲鸿画的 “天价仙女”,被网友骂 “生无可恋”

21 岁徐悲鸿画的 “天价仙女”,被网友骂 “生无可恋”

中国艺术家
2026-05-08 05:26:53
绝杀后立刻尿检?一球洗白整个赛季?张皓嘉背后,藏太多无奈

绝杀后立刻尿检?一球洗白整个赛季?张皓嘉背后,藏太多无奈

凡知
2026-05-10 18:58:43
别傻笑美国卡不住海峡,你的钱包三个月后就要遭殃

别傻笑美国卡不住海峡,你的钱包三个月后就要遭殃

纪史行者
2026-05-10 09:33:56
一张谈判桌,三种死法——板门店朝鲜谈判代表的命运暗河

一张谈判桌,三种死法——板门店朝鲜谈判代表的命运暗河

八桂知事
2026-05-08 15:33:08
人民日报证实莫言的警告:人真的会被气死!70%的重病跟情绪有关,这3个致命伤害往往来自3种身边人!

人民日报证实莫言的警告:人真的会被气死!70%的重病跟情绪有关,这3个致命伤害往往来自3种身边人!

职场火锅
2026-05-06 21:52:40
历史不会重演,但以史为签:中国房地产很有可能重走日本旧路?

历史不会重演,但以史为签:中国房地产很有可能重走日本旧路?

坠入二次元的海洋
2026-05-10 19:22:42
易梦玲性感图片

易梦玲性感图片

手工制作阿歼
2026-05-10 20:02:58
拒绝再被消费!梅西首次公开评价C罗,真相让无数老球迷泪目了

拒绝再被消费!梅西首次公开评价C罗,真相让无数老球迷泪目了

无人倾听无人倾听
2026-05-09 16:28:35
陈羽凡现状:50岁一身腱子肉,还在泰国演出,儿子跟着妈过的很好

陈羽凡现状:50岁一身腱子肉,还在泰国演出,儿子跟着妈过的很好

冷紫葉
2026-04-25 14:26:16
“运动”和“不运动”的中年男人,看他的体态就知道了,差别太大

“运动”和“不运动”的中年男人,看他的体态就知道了,差别太大

马拉松跑步健身
2026-04-28 21:14:16
无公司、无投资、无AI,两个女性创作者的《吉时已到》

无公司、无投资、无AI,两个女性创作者的《吉时已到》

新京报
2026-05-09 19:03:26
肯豆好瘦好美,没有一丝赘肉

肯豆好瘦好美,没有一丝赘肉

白宸侃片
2026-05-08 07:50:30
2026-05-10 21:11:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
107210文章数 61757关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

头条要闻

罕见一幕 韩国总统、国会议长、执政党党首同日飙泪

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

旅游
本地
时尚
艺术
公开课

旅游要闻

新疆旅游新动向丨从“凑人气”到“留人心” 新疆县域旅游玩出新高度

本地新闻

用苏绣的方式,打开江西婺源

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

艺术要闻

19位艺术家的母亲

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版