网易首页 > 网易号 > 正文 申请入驻

不是GPT-5.4,OpenAI深夜发新模型!幻觉率暴降27%

0
分享至


智东西
作者|王涵
编辑|李水青

智东西3月4日报道,今天,OpenAI正式发布GPT‑5.3 Instant,该模型在回答的语气倾向、回复相关度以及对话的顺畅度均有相应的提升。

OpenAI团队称其收到用户反馈,GPT‑5.2 Instant有时会拒绝回答本可以安全响应的问题。在涉及敏感话题时,模型的表现偶尔显得过于保守或带有说教感。

GPT‑5.3 Instant的回答将直击重点,不再夹杂冗长的限制性说明,显著减少了不必要的拒答行为,并削减了回答前那些过度防卫或带有说教色彩的开场白。


此外,GPT‑5.3 Instant还优化了联网搜索结果的整合质量,模型现在能更有效地平衡搜索结果与自身知识储备及逻辑推理。例如,它能够利用既有的认知图谱为近期资讯提供深度背景解析,不再是简单地罗列并汇总搜索信息。

从更广泛的层面来看,GPT‑5.3 Instant降低了对联网搜索结果的过度依赖,解决了此前偶尔出现的“链接堆砌”或信息松散的问题。它现在能更精准地洞察问题的潜台词,并在回答开头即优先呈现核心信息。


此前,GPT‑5.2 Instant的语气偶尔会让人感到“尴尬、违和”,表现为言语过于强势,或者在未获确认的情况下,就对用户的意向和情绪进行过度解读或妄加揣测。

本次更新大幅削减了不必要的冗余宣告,以及类似“停一下,深呼吸”等口吻。用户可以在设置中调整模型的回复语调,例如其亲和力与热情度。

相比GPT‑5.2 Instant ,GPT‑5.3 Instant提供的回答更具事实性,在广泛的话题领域内均显著降低了幻觉率。

为了衡量准确度,OpenAI团队采用了两项内部评估指标:其一侧重于医疗、法律及金融等高风险领域;其二则专门针对“幻觉”高发场景进行测试,样本取自经过脱敏处理、被用户标记为事实错误的真实对话记录。

对比前代模型,GPT‑5.3 Instant在“高风险领域”评估中,联网模式下的幻觉率降低了26.8%,仅依靠模型自身知识库时,幻觉率降低了19.7%。

而在基于用户真实反馈的评估中,该模型在联网模式下的幻觉率下降了22.5%,非联网模式下则下降了9.6%。

在故事写作方面,GPT‑5.3 Instant在处理实用任务与表达性写作之间切换得更加顺畅,且不会牺牲逻辑的清晰度与连贯性。


OpenAI团队补充到,GPT‑5.3 Instant仍存在一些改进空间。例如ChatGPT在某些语言,如日语和韩语,中的回复风格可能稍显生硬,或带有刻板的直译感。并且,OpenAI团队仍在持续监控反馈并进行功能优化,同时也在不断扩展自定义选项。

GPT‑5.3 Instant自即日起面向所有ChatGPT用户开放,开发者也可通过API使用名为gpt-5.3-chat-latest的模型。Thinking和Pro版本的更新也将于近期推出。

GPT‑5.2 Instant将在“Legacy Models”下拉菜单中为付费用户保留三个月,并计划于2026年6月3日正式退役。

结语:OpenAI用对话挽留用户

GPT‑5.2 Instant在回答中的“油腻”“冗杂”的套路句式一直被广大用户所诟病,此次GPT‑5.3 Instant的升级更新,将视角重新放回“聊天”上,回应了用户长期以来对聊天机器人 “好用、实在、不绕弯” 的核心诉求。

在3月初,OpenAI因与美国军方签订合作协议,大批用户开始发起“抵制ChatGPT”等活动,Anthropic更是直接推出了一键转移上下文内容的服务,ChatGPT的用户或正在流失。

OpenAI在此时优化对话风格或许也是其试图留住用户的举措。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西方专家惊呼:中国正在回到明朝,可怕的“朝贡体系”正在归来!

西方专家惊呼:中国正在回到明朝,可怕的“朝贡体系”正在归来!

牛马搞笑
2026-04-23 11:06:00
黄岩岛激烈对峙,中方做好最坏打算,美媒:轰6和055已部署

黄岩岛激烈对峙,中方做好最坏打算,美媒:轰6和055已部署

启迪你的思维
2026-04-24 02:35:20
两名外籍乘客在网约车上对着部队大门连续拍照,接下来又要去训练场方向,司机觉得可疑,直接开车把他们交给了部队

两名外籍乘客在网约车上对着部队大门连续拍照,接下来又要去训练场方向,司机觉得可疑,直接开车把他们交给了部队

极目新闻
2026-04-16 08:59:25
超级外援耍大牌!消极比赛,总经理和主教练却不敢裁

超级外援耍大牌!消极比赛,总经理和主教练却不敢裁

篮球大陆
2026-04-24 13:45:42
霍汶希力挺张敬轩仅6天后续:英皇全艺人遭集体抵制 态度一边倒

霍汶希力挺张敬轩仅6天后续:英皇全艺人遭集体抵制 态度一边倒

观察鉴娱
2026-04-23 12:01:07
翟晓川为娇妻庆生,场均5分拿600万薪水,娇妻绝美,生俩娃很幸福

翟晓川为娇妻庆生,场均5分拿600万薪水,娇妻绝美,生俩娃很幸福

大西体育
2026-04-23 16:09:16
汉文帝刘恒本是无人问津的藩王,为什么继位后,就变得非常厉害?

汉文帝刘恒本是无人问津的藩王,为什么继位后,就变得非常厉害?

铭记历史呀
2026-04-24 11:35:37
美国11名顶尖科学家连续离奇失踪或死亡,特朗普:相当严重

美国11名顶尖科学家连续离奇失踪或死亡,特朗普:相当严重

新民周刊
2026-04-23 18:56:16
张朝阳最后的倔强:每年都要搞一次搜狐时尚盛典

张朝阳最后的倔强:每年都要搞一次搜狐时尚盛典

TVB的四小花
2026-04-24 05:59:47
商务部部长:近期欧盟出台一系列经贸限制措施,中方已表达严正关切

商务部部长:近期欧盟出台一系列经贸限制措施,中方已表达严正关切

新京报
2026-04-24 09:40:20
就差1秒!特朗普欲发射核武器,军方强行拦截,拒绝为总统扣扳机

就差1秒!特朗普欲发射核武器,军方强行拦截,拒绝为总统扣扳机

通鉴史智
2026-04-24 11:41:29
个人微信建了600多个工作群,离职时账号归谁

个人微信建了600多个工作群,离职时账号归谁

现代快报
2026-04-23 13:49:11
八十岁后,老人能活到以下状态,就是人生赢家,便是圆满!

八十岁后,老人能活到以下状态,就是人生赢家,便是圆满!

小谈食刻美食
2026-04-22 07:33:20
核风险升高!3艘俄舰被击沉,局势触碰普京底线,美官员集体发声

核风险升高!3艘俄舰被击沉,局势触碰普京底线,美官员集体发声

云上乌托邦
2026-04-22 20:08:41
谁懂啊!年轻时的迟重瑞,才是真正的人间绝色玉面公子

谁懂啊!年轻时的迟重瑞,才是真正的人间绝色玉面公子

乡野小珥
2026-04-23 21:22:22
2-0!西甲乱套了:塞维利亚5轮4败+只领先降级区1分,11队要保级

2-0!西甲乱套了:塞维利亚5轮4败+只领先降级区1分,11队要保级

体育知多少
2026-04-24 09:08:48
故事:湖南一爷爷照顾小孙女,父亲发现女儿越来越圆润,误会弑父

故事:湖南一爷爷照顾小孙女,父亲发现女儿越来越圆润,误会弑父

卡西莫多的故事
2025-02-26 22:18:16
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
那个连登14次春晚的歌坛巨星,现在家产被拍卖“住进”养老院?

那个连登14次春晚的歌坛巨星,现在家产被拍卖“住进”养老院?

天马幸福的人生
2026-04-24 13:19:55
笑不活了!当你觉得在工作中捅了很大的篓子的时候,不妨看看他

笑不活了!当你觉得在工作中捅了很大的篓子的时候,不妨看看他

兰妮搞笑分享
2026-04-24 12:59:31
2026-04-24 14:12:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11680文章数 117037关注度
往期回顾 全部

科技要闻

刚刚,DeepSeek-V4 预览版发布 百万上下文

头条要闻

华谊兄弟被申请破产:曾坐拥百位明星 如今还不起千万

头条要闻

华谊兄弟被申请破产:曾坐拥百位明星 如今还不起千万

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

王思聪被绿!恋爱期间女友被金主包养

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

全景iDrive 续航近800km 新款宝马7系/i7亮相

态度原创

时尚
家居
数码
旅游
公开课

衬衫+半裙,比别人好看不止一点点

家居要闻

自然肌理 温润美学

数码要闻

专访巴可王红波:显示行业竞争下半场,深耕八大垂直行业与构建共赢生态

旅游要闻

“经典IP+特色文化”擦亮文旅金字招牌 特色品牌旅游专列圈粉国内外游客

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版