网易首页 > 网易号 > 正文 申请入驻

不是GPT-5.4,OpenAI深夜发新模型!幻觉率暴降27%

0
分享至


智东西
作者|王涵
编辑|李水青

智东西3月4日报道,今天,OpenAI正式发布GPT‑5.3 Instant,该模型在回答的语气倾向、回复相关度以及对话的顺畅度均有相应的提升。

OpenAI团队称其收到用户反馈,GPT‑5.2 Instant有时会拒绝回答本可以安全响应的问题。在涉及敏感话题时,模型的表现偶尔显得过于保守或带有说教感。

GPT‑5.3 Instant的回答将直击重点,不再夹杂冗长的限制性说明,显著减少了不必要的拒答行为,并削减了回答前那些过度防卫或带有说教色彩的开场白。


此外,GPT‑5.3 Instant还优化了联网搜索结果的整合质量,模型现在能更有效地平衡搜索结果与自身知识储备及逻辑推理。例如,它能够利用既有的认知图谱为近期资讯提供深度背景解析,不再是简单地罗列并汇总搜索信息。

从更广泛的层面来看,GPT‑5.3 Instant降低了对联网搜索结果的过度依赖,解决了此前偶尔出现的“链接堆砌”或信息松散的问题。它现在能更精准地洞察问题的潜台词,并在回答开头即优先呈现核心信息。


此前,GPT‑5.2 Instant的语气偶尔会让人感到“尴尬、违和”,表现为言语过于强势,或者在未获确认的情况下,就对用户的意向和情绪进行过度解读或妄加揣测。

本次更新大幅削减了不必要的冗余宣告,以及类似“停一下,深呼吸”等口吻。用户可以在设置中调整模型的回复语调,例如其亲和力与热情度。

相比GPT‑5.2 Instant ,GPT‑5.3 Instant提供的回答更具事实性,在广泛的话题领域内均显著降低了幻觉率。

为了衡量准确度,OpenAI团队采用了两项内部评估指标:其一侧重于医疗、法律及金融等高风险领域;其二则专门针对“幻觉”高发场景进行测试,样本取自经过脱敏处理、被用户标记为事实错误的真实对话记录。

对比前代模型,GPT‑5.3 Instant在“高风险领域”评估中,联网模式下的幻觉率降低了26.8%,仅依靠模型自身知识库时,幻觉率降低了19.7%。

而在基于用户真实反馈的评估中,该模型在联网模式下的幻觉率下降了22.5%,非联网模式下则下降了9.6%。

在故事写作方面,GPT‑5.3 Instant在处理实用任务与表达性写作之间切换得更加顺畅,且不会牺牲逻辑的清晰度与连贯性。


OpenAI团队补充到,GPT‑5.3 Instant仍存在一些改进空间。例如ChatGPT在某些语言,如日语和韩语,中的回复风格可能稍显生硬,或带有刻板的直译感。并且,OpenAI团队仍在持续监控反馈并进行功能优化,同时也在不断扩展自定义选项。

GPT‑5.3 Instant自即日起面向所有ChatGPT用户开放,开发者也可通过API使用名为gpt-5.3-chat-latest的模型。Thinking和Pro版本的更新也将于近期推出。

GPT‑5.2 Instant将在“Legacy Models”下拉菜单中为付费用户保留三个月,并计划于2026年6月3日正式退役。

结语:OpenAI用对话挽留用户

GPT‑5.2 Instant在回答中的“油腻”“冗杂”的套路句式一直被广大用户所诟病,此次GPT‑5.3 Instant的升级更新,将视角重新放回“聊天”上,回应了用户长期以来对聊天机器人 “好用、实在、不绕弯” 的核心诉求。

在3月初,OpenAI因与美国军方签订合作协议,大批用户开始发起“抵制ChatGPT”等活动,Anthropic更是直接推出了一键转移上下文内容的服务,ChatGPT的用户或正在流失。

OpenAI在此时优化对话风格或许也是其试图留住用户的举措。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Shams:大合同是安抚布朗唯一方法 但绿军从未打算提前续约

Shams:大合同是安抚布朗唯一方法 但绿军从未打算提前续约

北青网-北京青年报
2026-07-03 08:30:08
8天跌没4430亿美元,人类首个“万亿富翁”宝座,还没坐热就塌了

8天跌没4430亿美元,人类首个“万亿富翁”宝座,还没坐热就塌了

南方健哥
2026-07-03 03:31:04
超越姆巴佩,亚马尔是国家队大赛收获10胜最年轻的欧洲球员

超越姆巴佩,亚马尔是国家队大赛收获10胜最年轻的欧洲球员

懂球帝
2026-07-03 05:46:04
6-9落后擦边绝杀!19岁松岛辉空终于觉醒 双项折戟后打崩世界第九

6-9落后擦边绝杀!19岁松岛辉空终于觉醒 双项折戟后打崩世界第九

颜小白的篮球梦
2026-07-03 06:25:49
曼联周5官宣150万出租奥纳纳!拒绝让他当替补,预计最终免费走人

曼联周5官宣150万出租奥纳纳!拒绝让他当替补,预计最终免费走人

罗米的曼联博客
2026-07-03 09:55:39
毕业即失业!这10个理工类烂专业,分数再高也别乱报

毕业即失业!这10个理工类烂专业,分数再高也别乱报

户外阿毽
2026-06-30 00:25:16
深夜,全球资产拉升!美联储,加息突变!

深夜,全球资产拉升!美联储,加息突变!

证券时报
2026-07-02 23:05:18
一旦开战,中国3000架飞机根本上不了场?俄专家揭露真相

一旦开战,中国3000架飞机根本上不了场?俄专家揭露真相

青山夜谈
2026-06-16 17:16:03
凌晨暴雨!冷黄梅结束热黄梅来了

凌晨暴雨!冷黄梅结束热黄梅来了

脊梁in上海
2026-07-03 07:09:38
FSD清白了 特斯拉致命车祸司机人为超速、被控过失杀人

FSD清白了 特斯拉致命车祸司机人为超速、被控过失杀人

凤凰网科技
2026-07-03 07:16:28
中央巡查组明查暗访发现:南宁邕江水上运动已形成重大安全隐患,再不治理迟早出大事

中央巡查组明查暗访发现:南宁邕江水上运动已形成重大安全隐患,再不治理迟早出大事

上观新闻
2026-07-02 16:14:42
11球+14球,C罗是首位世界杯+欧洲杯打入25球的球员

11球+14球,C罗是首位世界杯+欧洲杯打入25球的球员

懂球帝
2026-07-03 09:03:12
球迷穿日本球衣都要管?足协先解释为什么国足几十年进不了世界杯!

球迷穿日本球衣都要管?足协先解释为什么国足几十年进不了世界杯!

人间运行手册
2026-07-03 08:05:49
如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

灯锦年
2026-07-01 17:38:16
四个城市,人口跌破千万了

四个城市,人口跌破千万了

城市财经
2026-07-02 12:27:49
被称“全球最美女孩”的她,结婚了!

被称“全球最美女孩”的她,结婚了!

自愈小日子
2026-07-02 01:24:54
世界杯巨星魔咒,这次被梅西姆巴佩砸碎了

世界杯巨星魔咒,这次被梅西姆巴佩砸碎了

竞技风云录
2026-07-03 01:35:28
丰田销冠换人,凯美瑞力压RAV4

丰田销冠换人,凯美瑞力压RAV4

字节漫游指南
2026-07-03 03:22:46
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
别笑梅威瑟破产,他的死局,90%的有钱人都逃不掉!

别笑梅威瑟破产,他的死局,90%的有钱人都逃不掉!

格斗时代
2026-06-30 20:34:39
2026-07-03 11:00:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12169文章数 117113关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

克罗地亚绝平球无效 官方放赛事用球内置芯片检测画面

头条要闻

克罗地亚绝平球无效 官方放赛事用球内置芯片检测画面

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

黄晓明深夜约会美女,分手原因曝光

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

数码
手机
健康
房产
公开课

数码要闻

专业无线麦克风也卡颜了?DJI Mic Mini 2S体验

手机要闻

iPhone 18 Pro系列混用闪存 大存储版本降配

这4类消化病患者 吃粘食管住嘴

房产要闻

独家猛料!融创海南大变天,项目重启,大量招人!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版