网易首页 > 网易号 > 正文 申请入驻

实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了

0
分享至

  

  新智元报道

  

  【新智元导读】GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?

  ChatGPT又被爆「降智」了!

  就在这两天,上率先炸锅。

  网友Lisan al Gaib发现,GPT-5.5用了一两个小时后突然变傻,每个请求都是秒回,质量断崖式下跌。

  但界面上显示的,依然还是「GPT-5.5 Extended Thinking」。

  也就是说,思考的标签还挂着,但思考本身已经消失了。

  

  

  200美元/月,买了个「薛定谔的模型」

  OpenAI开发者论坛上,一篇投诉帖同步爆了。

  Agentify.sh表示,GPT-5.5用着用着会突然丧失遵循指令的能力。

  眼瞧着它兴冲冲地宣布「修好了」,结果代码质量差到引发大面积回退。

  之前5.5-med就能轻松搞定的UI任务,现在连最简单的改动都搞不定。

  升到5.5-high,没用。再升到xhigh,还是不行。

  而且xhigh以前能跑好几个小时,现在明显缩短了。

  

  帖子一出,回复区瞬间炸了。

  有人直接退回了5.4。

  有人用的是xhigh最高档,但「跟上周比明显拉胯,长任务频繁出错,完全不遵循工作流」。

  有人反映更离谱的情况,「简单查询也要转很久,你打断它纠正方向,它直接无视你,继续按之前错误的计划走」。

  没错,所有人都在描述同一个现象——GPT的脑子,不知道什么时候被偷偷换掉了。

  GPT-5.5目前的表现跟5.3差不多,毫不夸张。头几天还惊艳得不行,现在完全找不到当初那个模型的影子了。

  

  不是错觉,OpenAI自己白纸黑字写着

  为了验证,Lisan al Gaib专门做了一个对比测试。

  同一个账号,ChatGPT端用Extended Thinking跑出来的全是垃圾,转头到Codex端用xhigh,立刻恢复正常。

  用他的原话说就是,Codex「简直比这玩意儿聪明40亿倍」。

  

  开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么?」

  模型回答,August 2025。

  问题是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!

  也就是说,他选的是Thinking,系统实际给他跑的是Instant

  界面上模型标签一个字都没变,但背后的模型已经被偷偷换掉了……

  

  搞笑的是,这次OpenAI竟然在自己的帮助文档里替用户做了实锤。

  根据OpenAI Help Center的官方说明,Plus用户每3小时最多发送160条GPT-5.5消息。

  用完之后,系统会静默切换到mini模型,直到额度重置

  

  注意「静默」两个字。

  没有弹窗提示,没有模型标签变化,没有任何视觉反馈。

  你还以为自己在用旗舰模型,对面已经悄悄换成了mini。

  Pro用户也别高兴太早。

  Heavy思考模式,那个Pro独享的最高推理档位,在服务器负载高的时候,同样会被容量限流。同样没有预警。

  换句话说,200美元/月的Pro订阅,买到的是一个随时可能被「偷梁换柱」的服务。

  

  而这种「标签没变,脑子换了」的操作,在Codex端更早就被人抓包了。

  今年2月,GitHub上出现了一个issue,一个Pro用户用trace命令抓到,自己请求的是GPT-5.3 Codex,实际返回的模型是GPT-5.2。

  连5.2 Codex都不是,是更低的基础版5.2。

  

  他贴出了复现命令:

  RUST_LOG='codex_api::sse::responses=trace'codexexec--skip-git-repo-check -s read-only -m'gpt-5.3-codex''hi'2>&1 >/dev/null | rg -o --replace'$1''"model":"([^"]+)"'|head-n1

  预期:gpt-5.3-codex

  多个Pro用户在同一个issue下确认了同样的降级。

  而且这种降级是「粘性的」,不会自己恢复,也没有任何解释。

  

  甚至,在4月GPT-5.5发布当天,还有用户报告Fast模式的速度跟Standard差不多,但计费还是按Fast来的。

  简单任务跑了7分49秒,正常应该5-6分钟。

  

  

  OpenAI承认了,然后就没有然后了

  5月15日,OpenAI的status页面出现了一条记录。

  GPT5.5 Performance Degradation,我们正在调查部分用户反映的GPT-5.5性能下降问题。

  5月17日,状态更新为「已解决」。

  但从论坛帖子的时间线来看,5月24-26日的降智投诉比5月15日那波更猛。

  要么「解决」了的问题又回来了,要么压根就没真正解决。

  

  每次升级都是一次「降智争议」

  虽然各家都会遇到「模型变蠢」的吐槽,但OpenAI从GPT-5到GPT-5.5的每个更新,一次都没缺席。

  每一次OpenAI都说在调查,每一次都说已解决,然后下一个版本继续。

  2025年8月,GPT-5首发Reddit的热帖标题直接就是「GPT-5太烂了」。用户投诉短回复、更多拒绝、更少人格感。

  OpenAI被迫紧急恢复GPT-4o选项。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。

  

  2025年12月,GPT-5.2翻译质量倒退,编造不存在的API,拒绝执行5.1能轻松完成的风格指令。

  2026年2月,GPT-5.3-CodexPro用户被静默降级到5.2,trace命令实锤。

  2026年3月,GPT-5.4OpenAI社区论坛出现「GPT-5.4在Codex里明显退化了」帖子,网友回复全部确认。

  2026年5月初,GPT-5.5 Instant上线回复长度缩短30%,emoji几乎消失。网友总结:精度提升了,但温度消失了。

  

  2026年5月下旬,也就是现在。Thinking模式的降智投诉再次爆发。

  Lisan al Gaib透露,自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后,「每周都会收到这样的私信」。

  最新一条是有人求他帮忙把xhigh/heavy thinking要回来。

  

  跑分最强的那天,是发布日

  chatgptdisaster.com整理了1087条经过验证的用户投诉,其中一类被反复提到的场景叫「路由层失灵」,UI显示GPT-5.5 Pro,输出完全是另一个档次的东西。

  用户描述了一个可复现的模式,长会话后模型开始「完全无视你说的话」,但模型选择器上还挂着顶配标签。

  

  最荒诞的注脚是,Plus用户160条/3小时用完后自动切换mini的机制,在OpenAI官方文档里被描述为一项「功能」

  为什么会这样?Lisan al Gaib分析认为,答案就两个字,省钱。

  算力与盈利能力的紧缩正影响着每一个人。处处精打细算,不放过任何省钱的机会。

  

  然而,就在GPT-5.5用户集体投诉的同一周,GPT-5.6的身影已经出现在了Codex后台日志里。

  内部代号iris-alpha,150万Token上下文,Polymarket给出的6月发布概率超过85%。

  一边是5.5用户连基础体验都保不住,一边是5.6已经在后台悄悄跑真实流量。

  这就是2026年的ASI竞赛。

  造新模型的速度越来越快,但让旧模型好好跑完一个会话却越来越难。

  跑分最强的那一天永远是发布日,之后每一天都是薛定谔的GPT。

  

  参考资料:

  https://x.com/scaling01/status/2058643470357590058?s=20

  编辑:摩西

  

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
妻子是「元AV女优」 ,部下甩来一张十年前的AV封面,日本科长的五年婚姻一夜崩塌?

妻子是「元AV女优」 ,部下甩来一张十年前的AV封面,日本科长的五年婚姻一夜崩塌?

日本物语
2026-05-31 20:33:14
苹果第二波降价来了,iPhone 16 Pro 突然杀回来了

苹果第二波降价来了,iPhone 16 Pro 突然杀回来了

搞机小帝
2026-06-01 00:04:05
马尼大战!谁能夺冠?19w球迷投票一针见血,原因有3!

马尼大战!谁能夺冠?19w球迷投票一针见血,原因有3!

运筹帷幄的篮球
2026-05-31 16:58:10
小仙女“战败”!见面3次索要六一节礼物,610元嫌少,被男方怒斥

小仙女“战败”!见面3次索要六一节礼物,610元嫌少,被男方怒斥

火山詩话
2026-05-31 14:54:31
总决赛15连胜!卢伟狂赞张镇麟:今年引进他是一个非常正确的决定

总决赛15连胜!卢伟狂赞张镇麟:今年引进他是一个非常正确的决定

狼叔评论
2026-05-31 22:50:17
震惊!河南麦收“割分按亩”,网友调侃:不地道啊,坏了江湖规矩

震惊!河南麦收“割分按亩”,网友调侃:不地道啊,坏了江湖规矩

火山詩话
2026-06-01 06:43:31
NBA最大锦鲤诞生!总决赛未打却已夺冠,索汉诠释何为真正玄学!

NBA最大锦鲤诞生!总决赛未打却已夺冠,索汉诠释何为真正玄学!

田先生篮球
2026-05-31 11:53:57
国内油价6月4日再调整,油价或大跌,已预计下调“油价570元/吨”

国内油价6月4日再调整,油价或大跌,已预计下调“油价570元/吨”

油价早知道
2026-06-01 09:16:10
金靴+1!姆巴佩11场15球力压凯恩 获得本赛季欧冠金靴

金靴+1!姆巴佩11场15球力压凯恩 获得本赛季欧冠金靴

新英体育
2026-05-31 12:34:55
日本正式加入北约援乌PURL计划,俄罗斯被联大纳入冲突暴力黑名单

日本正式加入北约援乌PURL计划,俄罗斯被联大纳入冲突暴力黑名单

史政先锋
2026-05-30 20:55:28
莱奥渴望加盟曼联,自曝红魔梦!曼联未出手担心他是拉什福德第二

莱奥渴望加盟曼联,自曝红魔梦!曼联未出手担心他是拉什福德第二

罗米的曼联博客
2026-06-01 09:59:10
“割四赔五”事件终于尘埃落定,当事人父亲发声,令人动容

“割四赔五”事件终于尘埃落定,当事人父亲发声,令人动容

芳姐侃社会
2026-05-31 20:51:10
德比斯:天气一热张雪机车就出问题!回应网友:我不可能每场都赢

德比斯:天气一热张雪机车就出问题!回应网友:我不可能每场都赢

念洲
2026-06-01 09:39:16
降价2万!上汽大众官宣:全新SUV,价格下调

降价2万!上汽大众官宣:全新SUV,价格下调

科技堡垒
2026-05-31 09:34:47
余秋雨在印考察很沮丧,印前部长安慰:中国再过25年就能赶上我们

余秋雨在印考察很沮丧,印前部长安慰:中国再过25年就能赶上我们

抽象派大师
2026-05-30 04:21:16
三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

医客
2026-05-30 12:14:19
中超半程积分榜:成都蓉城冠军,倒数7队均被扣分,2队积分未上双

中超半程积分榜:成都蓉城冠军,倒数7队均被扣分,2队积分未上双

中超伪球迷
2026-05-31 21:41:30
男子在野外水潭溺水沉底,广东大哥手拿绳子两次潜入深潭,从水下4米把人拖上岸

男子在野外水潭溺水沉底,广东大哥手拿绳子两次潜入深潭,从水下4米把人拖上岸

环球网资讯
2026-06-01 09:14:22
筱梅晒家庭照!小菲抱小儿子满脸宠溺!兰姐和亲家约饭,关系融洽

筱梅晒家庭照!小菲抱小儿子满脸宠溺!兰姐和亲家约饭,关系融洽

阿銍武器装备科普
2026-06-01 09:22:26
破大防!荷兰大臣曾向全球承认误判:没想到中国真敢叫停芯片出口

破大防!荷兰大臣曾向全球承认误判:没想到中国真敢叫停芯片出口

老鹈爱说事
2026-06-01 02:53:38
2026-06-01 11:44:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15355文章数 66894关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

时尚
亲子
房产
艺术
公开课

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

亲子要闻

世界牛奶日遇上儿童节:这三种“奶制品”别给孩子当牛奶喝

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

艺术要闻

吴镇写竹,清清爽爽

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版