网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

退钱！Claude 4.8连夜大降智，GPT-5.6算力遭「腰斩」

2026-06-30 19:19:27　来源: 新智元

北京举报

0

分享至

新智元报道

【新智元导读】最近，AI社区遭遇集体降智潮！OpenAI疑似暗中开启GPT-5.6灰度测试，神秘「Juice」测试引爆全网查成分；另一边，Anthropic的Claude Opus 4.8被曝断崖式降智，疑似被切脑。我们花钱买到的AI，究竟是什么版本？

两大AI巨头——OpenAI和Anthropic，几乎在同一时间陷入了「降智门」？

过去48小时，AI圈掀起了一场由一段神秘提示词引发的全民自测狂欢。

OpenAI被曝出利用Codex平台悄悄进行GPT-5.6的灰度测试，暗中克扣用户的思考预算。

另一边，则是Opus 4.8遭遇史诗级削弱，曾经惊艳全场的模型，如今连最基础的逻辑推理都频频翻车，甚至开始对用户进行PUA。

Opus 4.8 Max被用户痛斥「被切掉了大脑」，性能从惊艳跌入谷底，甚至不如旧版Haiku模型。

莫非，我们正经历一场巨头们精心设计的实验？

神秘的Juice值，

你被灰度到GPT-5.6了吗？

最近，AI社区发现，OpenAI可能正在小范围灰度测试GPT-5.6-sol。

X上一位AI大V发现，在Codex应用中，某些本该运行GPT-5.5 xhigh的会话，被悄悄路由到了名为「gpt-5.6-sol」的未知模型。

要验证自己是否中签，你只需要运行一段「Juice测试」代码即可。

request>

你可以通过Codex App或CLI进行一次快速自查。只需选择 gpt-5.5，将推理设置拉到 xhigh，然后输入上面这段XML代码即可。

这段提示词的本质，是检测模型的隐藏推理算力配额——「Juice」即是模型思考预算的代名词。

实测数据显示，正常的、满血版的 gpt-5.5 xhigh ，在面对特定测试指令时，返回的Juice结果应该是 768。

然而，那些被路由到 gpt-5.6-sol 灰度测试池中的用户，得到的返回值却断崖式下跌到了 128。

-正常GPT-5.5 xhigh：返回 768

-被灰度到GPT-5.6-sol：返回 128

768到128，整整缩水了6倍！

这到底是什么意思？

可以说，这要么意味着GPT-5.6的推理效率实现了史诗级飞跃，要么指向了更令人担忧的可能：所谓的新版本，实际上是通过阉割推理深度换来的「低成本缩水版」。

结合最近Anthropic频繁封号的背景，OpenAI此举显得意味深长。他们似乎试图通过这种隐蔽的灰度测试，摸索算力成本与生成质量之间的极限平衡点。

网友们纷纷晒出截图，有人欢呼自己「提前解锁了下个版本」，更多人则忧虑：「如果5.6的思考预算只有5.5的六分之一，这到底是升级还是降级？」

当然，有时模型也会拒绝回答。

这不由让人怀疑，是不是OpenAI在通过路由机制，把一部分用户当小白鼠，测试极度简化版的模型，以节省算力成本？

毕竟，普通人可能感知不到推理深度的细微差异。

Claude的物理切脑：

从神坛跌落的Opus 4.8

如果说OpenAI的灰度测试还只是引发好奇与猜测，那么Anthropic对Claude模型的削弱，则是一场明目张胆的「物理切脑」。

现在，Reddit上的 r/Anthropic 版块已经被愤怒的用户抗议所淹没。

很多人发现：所有Claude模型都被严重削弱了，尤其是原本被寄予厚望的Opus 4.8 Max。

在发布初期，Opus 4.8以其深邃的推理能力、极低的幻觉率和「追求真理」的坚定立场惊艳了全场。

然而最近，它似乎遭遇了史诗级降智。

有人说：它被削弱到了荒谬的程度。现在使用Opus 4.8 Max的感觉，通常比使用老款的Haiku模型还要糟糕得多。

它根本不花时间去思考，不做适当的背景研究，甚至一直在对用户进行煤气灯式的精神操控！

在reddit社区中，不断有人吐槽使用降智模型的失望。

拥有1000亿token的高级用户吐槽说，Claude最近一周的行为简直愚蠢至极。

有人说，Opus 4.8仿佛进入了老年痴呆模式。

它忽然失去了长期上下文的记忆能力。用户不得不将所有内容塞进同一个巨大的上下文窗口，一旦开启新会话，模型就会彻底迷失方向。

还有人，自己遇到了杠精附体的Opus 4.8，它会为了唱反调而唱反调。

无论用户输入什么，模型都会扮演反方角色，哪怕是配置服务器集群这种纯粹客观的工作，模型也会强行中断，跳出来说「我得实话实说」，然后用200字的废话去解释一个20字就能说清的概念。

另外，它还会拒绝思考。

在高思考模式下，面对极其低级的错误，模型甚至懒得多运算一秒，直接秒回错误答案。当被指出错误时，还会装傻充愣。

一场精心设计的实验？

有人做出这个令人细思极恐的推测：我们之前看到的那个「神级」Opus 4.8，可能根本就是一个假象。

因为AI市场被未来预期高度驱动，公司必须不断向市场兜售「技术正在飞速进步」的宏大叙事。

为了维持这种叙事，厂商极有可能在产品发布初期，不计成本地给予模型临时的算力增强，制造出重大技术飞跃的幻觉。

一旦热度过去，或者当巨额的推理成本开始反噬财报时，他们就会在黑箱中悄悄拨回参数。

用静默降级老模型的做法，掩盖全盘降智的真相。然而用户的信任，也被透支了。

资本寒冬下的断臂求生——SpaceX抽干的流动性

有人猜测，如此多模型集体降智的直接原因，或许是上市节奏被打乱。

而根本原因，就是未来拿钱的难度呈指数级上升。

原本在今年的美股剧本中，是OpenAI、Anthropic等预留了充足的资金，准备迎接几场史诗级的IPO。

然而就在本月，SpaceX敲钟上市，以1.77万亿美元的史诗级估值，犹如一个巨大的黑洞，瞬间抽干了美股市场上本就不多的流动性。

再加上一些其他原因，留给AI巨头们的池子已经见底了。

本来按照Anthropic的规划，最晚上市时间点是今年的第四季度。

如果上市计划推迟，在公司净利润勉强维持、但研发投入仍在剧烈烧钱的当下，Anthropic能做的，就只有降本增效。

真要说起来，其实让人无法接受的，是信息的不对称。

你每个月花几十美元订阅一个服务，这个服务却可以随时、悄悄地改变产品，而完全不需要告知你。

你发现了问题，却无法确认问题的来源。你提出投诉，却可能被模型PUA。

「Juice测试」之所以引发这么大的共鸣，是因为它象征着一种久违的东西——

让我看看我买到的究竟是什么。

参考资料：

https://www.reddit.com/r/Anthropic/comments/1uh7jcr/all_claude_models_got_nerfed_badly/

https://x.com/hqmank/status/2071474791870243091

编辑：Aeneas

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

美国科技企业悄然转向中国AI模型，Coinbase带头用上GLM与Kimi

华尔街见闻官方 2026-06-28 15:52:48
0 跟贴 0
担心蒸馏问题，Meta限用Claude Code、Codex

机器之心Pro 2026-06-30 12:43:06
0 跟贴 0

FusionRoute：从专家路由到自我修正，一种新的多LLM协作范式

机器之心Pro 2026-06-07 17:07:16
0 跟贴 0

你天天用的Claude和Codex，Meta内部不让随便用了

新智元 2026-06-30 19:17:26
0 跟贴 0
AI当老板，快给10家公司干破产了

量子位 2026-06-29 16:27:33
8 跟贴 8

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

智东西 2026-06-30 22:36:12
0 跟贴 0

Transformer的八个爹妈，如今都在哪？

机器之心Pro 2026-06-29 10:27:31
19 跟贴 19
Claude Code之父版「职场MBTI」：AI洗牌后只剩5类人，你选哪种？

量子位 2026-06-30 17:34:59
0 跟贴 0

Claude Code之父最新判断：AI时代团队分工重写，这五种人最吃香

机器之心Pro 2026-06-30 11:24:27
5 跟贴 5
Nature Medicine：戳破“AI大模型超越人类医生”的神话，取得高分靠的是刷题背答案+瞎猜？

生物世界 2026-06-30 08:20:01
0 跟贴 0
AI圈刚开始谈Loop Engineering,两位95后博士盯上了人类闭环数据

机器之心Pro 2026-06-30 12:40:20
0 跟贴 0
GLM-5.3你来定！智谱唐杰全球征集意见，评论区清一色：视觉

量子位 2026-06-30 16:38:33
7 跟贴 7
视频生成模型会「推理」吗？303道题全面揭示世界模型的推理短板

机器之心Pro 2026-06-28 18:29:07
0 跟贴 0
微信做Agent，AI创业者为什么反而不慌？

虎嗅APP 2026-06-30 20:30:05
0 跟贴 0
首发 AIOS+AIUI！乐奇 Rokid 关上了 AI 眼镜最大的路线之争

雷科技 2026-06-30 22:22:34
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
MoE路由拥有「记忆」：RMS-MoE用检索记忆协同实现更高效专家调度

机器之心Pro 2026-05-09 09:37:42
0 跟贴 0
十天，是混凝土凝固的时间，不是他们的极限！

白仙儿动画 2026-06-27 11:00:00
62 跟贴 62
媒体：欧洲热浪下中国空调撕开的不只是市场缺口

澎湃新闻 2026-06-30 07:12:58
11664 跟贴 11664
巴西队胜利"属于"安切洛蒂其赛前精准预测比赛进程

上观新闻 2026-06-30 03:28:50
6494 跟贴 6494
赵骚康总结“算力就是国力”，唐湘龙有点懵：重点都被你说了？

新鲜热点 2026-06-30 20:19:01
0 跟贴 0
上海老夫妻无后代临走前捐出500万:我们活不了多久了

澎湃新闻 2026-06-30 07:00:31
5817 跟贴 5817
一天两场点球大战荷兰点球大战3-4摩洛哥无缘16强

央视新闻客户端 2026-06-30 11:56:09
4664 跟贴 4664
金灿灿的大航母，这一套模型摆件太漂亮，谁看了能拒绝它！

搞笑派大星 2026-06-29 11:43:27
1 跟贴 1
韩红即日起将退出公益行业？韩红基金会回应传闻：目前没有收到任何消息

北京青年报 2026-06-30 13:43:20
12248 跟贴 12248
论证思路题总答成“总分总”？四步拆出精准逻辑链

语文亦国学 2026-06-28 11:29:37
0 跟贴 0
布局太空算力！中国移动首次公布核心路线图

通信世界 2026-06-30 19:56:55
0 跟贴 0
开了一次就“头晕”？看到机器上的英文单词，他觉得自己被骂了

北青网-北京青年报 2026-06-28 14:48:24
1826 跟贴 1826
当地华人讲述法国高温：中国空调一机难求，有人为抢购空调打起来，安装已排到9月

潇湘晨报 2026-06-29 21:36:19
5409 跟贴 5409
直流充电桩坏了，元件参数炸没了怎么办？画图分析一下

fire1tech 2026-06-30 19:58:43
4 跟贴 4
听他们聊怪游戏，我愣住了

奶凶的小霸王 2026-06-30 13:45:59
0 跟贴 0
崂山区妇联举办“崂”想遇见你——推理主题单身青年联谊活动

鲁网青岛频道 2026-06-30 16:50:56
0 跟贴 0
江苏将新建一座超大型机场，明年正式开工

江苏新闻 2026-06-30 13:32:00
138 跟贴 138
避开参数陷阱，10个真实用车痛点验证比亚迪大唐的实用价值

车叫兽 2026-06-30 15:09:01
0 跟贴 0
“卡牌大师”名不虚传，作为第四官员的马宁多次提醒主裁，让德国和巴拉圭两队替补席吃黄牌；网友：就算手里没牌，照样能管住赛场秩序

厦门晚报 2026-06-30 11:41:58
873 跟贴 873
媒体:德国连续3届世界杯无缘16强从战车变成宝宝巴士

中国新闻周刊 2026-06-30 13:02:57
565 跟贴 565
父女玩水被吸入漩涡多人协力帮忙“抢命” 两人全吓哭

星视频 2026-06-30 17:51:53
45 跟贴 45
贵阳一小区160户居民出行仅剩一部电梯，多数业主还拒绝动用基金维修损坏电梯，出行困境如何破解？

大风新闻 2026-06-30 10:12:02
223 跟贴 223
“博士生邀餐馆老板合拍毕业照”最新合影来了！老板娘：奔赴真诚的相遇，让我感受到人间真实的美好

极目新闻 2026-06-30 18:29:52
103 跟贴 103

1977年陈长江去769地下室，搬运毛主席遗体，汪东兴：我有个要求

1977年陈长江去769地下室，搬运毛主席遗体，汪东兴：我有个要求

纪实文录

2025-05-08 16:52:33

中央5台直播世界杯时间表：明天7月1日，CCTV5直播，法国PK瑞典

中央5台直播世界杯时间表：明天7月1日，CCTV5直播，法国PK瑞典

薇说体育

2026-06-30 16:19:00

500亿交了昂贵学费！京东的外卖败局，给所有企业敲了警钟？

500亿交了昂贵学费！京东的外卖败局，给所有企业敲了警钟？

新浪财经

2026-06-30 13:36:58

字节跳动CEO梁汝波发全员信：杜绝空转、冗余、形式化管理

字节跳动CEO梁汝波发全员信：杜绝空转、冗余、形式化管理

PChome电脑之家

2026-06-30 10:13:57

正常男人吃一颗伟哥是什么体验？网友们的分享让人脸红心跳加快！

正常男人吃一颗伟哥是什么体验？网友们的分享让人脸红心跳加快！

黯泉

2026-06-25 12:10:30

美众议院集体表决通告全球：不再承认"一中"原则？这次不能再忍

美众议院集体表决通告全球：不再承认"一中"原则？这次不能再忍

史行途

2026-06-29 21:15:02

双色球第2026074期:中出一等奖4注，奖池累计3.08亿元

双色球第2026074期:中出一等奖4注，奖池累计3.08亿元

新浪财经

2026-06-30 22:18:01

咖啡加糖，不如不喝！浙江大学最新：无糖咖啡和茶保护心血管健康，加了糖益处全无，甚至有害

咖啡加糖，不如不喝！浙江大学最新：无糖咖啡和茶保护心血管健康，加了糖益处全无，甚至有害

医诺维

2026-06-30 17:33:35

33块劳力士+22块欧米茄！25岁哈兰德凭什么比41岁C罗更懂足球？

33块劳力士+22块欧米茄！25岁哈兰德凭什么比41岁C罗更懂足球？

念洲

2026-06-30 20:35:06

真“死亡”之组？荷兰日本同天出局+无缘16强！瑞典将战15亿法国

真“死亡”之组？荷兰日本同天出局+无缘16强！瑞典将战15亿法国

我爱英超

2026-06-30 12:25:52

为什么往死里扫黄？网友分享太真实了，一次说透

为什么往死里扫黄？网友分享太真实了，一次说透

另子维爱读史

2026-05-27 20:16:03

迎来第一波“失业潮”的不是教师，不是医生，而是这四个行业！

迎来第一波“失业潮”的不是教师，不是医生，而是这四个行业！

职场资深秘书

2026-06-28 14:27:05

李玟离世满3年！主诊医生、救护员被正式起诉，致命真相被揭开

李玟离世满3年！主诊医生、救护员被正式起诉，致命真相被揭开

一盅情怀

2026-06-30 08:10:15

2026年最强反腐来了！中纪委：害群之马将清除到底！

2026年最强反腐来了！中纪委：害群之马将清除到底！

职场资深秘书

2026-06-30 11:24:20

女子看车20分钟定下130万元迈巴赫，提车第二天傻眼了：这不对劲，要求换车；4S店：这是正常的，3个月以后再看

女子看车20分钟定下130万元迈巴赫，提车第二天傻眼了：这不对劲，要求换车；4S店：这是正常的，3个月以后再看

鲁中晨报

2026-06-29 15:35:06

马丁内利：在阿森纳我不踢中路，教练一直在教我居中如何踢球

马丁内利：在阿森纳我不踢中路，教练一直在教我居中如何踢球

懂球帝

2026-06-30 14:01:06

CBA重磅转会即将达成！曝顶级前锋加盟山西男篮，曾单场狂砍26+7

CBA重磅转会即将达成！曝顶级前锋加盟山西男篮，曾单场狂砍26+7

老叶评球

2026-06-30 18:56:34

刘尚进任重庆市副市长

中国经济网

2026-06-30 10:16:07

打死也不能放冰箱10种食物，回家立刻拿出来，别拿家人健康开玩笑

打死也不能放冰箱10种食物，回家立刻拿出来，别拿家人健康开玩笑

小柱解说游戏

2026-06-16 07:38:45

日媒：利物浦有意日本国脚佐野海舟，当前德转身价4000万欧

日媒：利物浦有意日本国脚佐野海舟，当前德转身价4000万欧

懂球帝

2026-06-30 23:05:17

AI产业主平台领航智能+时代

15572文章数 66944关注度

往期回顾全部

科技要闻

iPhone18 Pro遭泄密！印度代工商惹祸

头条要闻

坎贝尔承认：中国是最成功渡过难关的国家

头条要闻

坎贝尔承认：中国是最成功渡过难关的国家

体育要闻

大热倒灶压力给到法国王楚揭法国队隐患

娱乐要闻

广电总局发布2026年“微短剧+”行动计划推荐剧目

财经要闻

万亿“寒王”，历史时刻

汽车要闻

奇瑞风云A9探店五个理由一定来看看

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

教育

时尚

数码

房产

亲子要闻

✨闪闪小葵花成长正当时✨ 「寻找闪亮小主角」才艺展示活动表演现场高光集锦，见证萌娃的舞台魅力～

教育要闻

中高考志愿填报防诈提醒 #中高考志愿填报 #阳光高考网 #志愿填报 #市场监管（记者苏艺）

Meiinpsn的穿衣风格，清新又叛逆

数码要闻

AMD自适应SoC首次集成封装上内存！32GB LPDDR5X、15年生命周期

房产要闻

等了三年！改善顶流实景交付，海口标杆的的答卷来了！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版