网易首页 > 网易号 > 正文 申请入驻

Anthropic承认模型降智后放任其偷懒?Claude Code用户信任崩塌中

0
分享至

来源:市场资讯

(来源:机器之心Pro)


机器之心报道

编辑:冷猫

还记不记得每一次 OpenAI 发布新功能或新模型的时候,总会有一些评论声称现有模型能力下降,怀疑大模型「降智」现象的声音不绝于耳。

排除掉一些有关 OpenAI 对部分地区账户的用户分级机制导致的显著降级情况,普通用户也会感觉到大模型时不时的出现问题。

机器之心编辑部在测试 GPT-5 的时候,感觉模型能力不及预期,也会怀疑是否有「降智」现象的存在。


但无论如何,此前大模型供应商似乎从来没有正面承认过模型「降智」的问题,用户的感知也朦朦胧胧的。

OpenAI 的研究科学家 Aidan McLaughlin 前两天发推聊到了这个现象。


他的意思是,大家(包括他自己)经常会错误地认为某个 AI 模型被实验室「削弱」了,而这种错误认知的发生率远高于他的预期。他甚至觉得,这是一种普遍的心理错觉,应该被定义成一种新的心理学现象。

但他很快就被库库打脸了。

几天前,Anthropic 发布了旗下模型 Claude Opus 4.1 和 Opus 4 的质量降级事件报告。很罕见地,大模型厂商公开承认模型「降智」的现象。


从 8 月 25 日 17:30 UTC 到 8 月 28 日 02:00 UTC,Claude Opus 4.1 在部分请求中出现了质量下降的问题。用户可能会遇到智能水平降低、回答格式错误或 Claude Code 工具调用异常等情况。

这一问题的原因是 Anthropic 在推理(inference)堆栈中进行了一次更新,但目前已经对 Claude Opus 4.1 回滚了该更新。虽然 Anthropic 经常会进行一些更改来提升模型的效率和吞吐量,但目标始终是保持模型响应质量不变。此外还发现Claude Opus 4.0 也受到了同样问题的影响,目前正在对其进行回滚。

并且,Anthropic 在报告中声称该事件已经被妥善解决。但 Anthropic 很快被用户们打脸,直到 9 月 1 日,用户对于 Claude Code 的负反馈不减反增。

Claude 这波自废武功的现象正持续性消耗用户过去的习惯和信任,很多用户正一点点地转向 GPT-5。

研究者 Thomas Ricouard 认为:


在他的推文下面,许许多多的 Claude 用户有着相同的抱怨,似乎 Anthropic 根本没有好好修正这个问题,Claude 依然不停地在「偷懒」。


还有人称,「实际运行起来更加糟糕。」


更有人直接开喷,「以前,Sonnet 4 能够直接构建一个项目,而现在 Opus 4.1 却连一个简单的脚本都生成不了,简直变成了无用的垃圾。」


Claude Code 表现为什么如此差劲?使用时间或许是一大影响因素,「它在凌晨两点用起来顺畅无比,白天高峰期被限流之后就非常糟糕。」


还有人猜测,是不是 Anthropic 正在研发一个新的或更好的模型。


众多拉踩之下,Claude Code 似乎就要跌落神坛了。当一个模型开始了「偷懒」,用户会做出他们的选择。根据我们此前的报道,在 GPT-5 发布后,相比于 Claude Code,开发者私下更喜欢用 GPT-5 写代码。


下面这位小哥表示,「我这几天一直在 Codex+GPT-5-high,完全不想念 Claude Code。每月 20 美元,性价比简直离谱。」


你在 Claude 的实际使用中遇到过哪些降智行为呢,欢迎评论区留言。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

铭记历史呀
2026-01-31 23:08:25
戴琳回应改名:我本姓张,退役了自然要改回本姓

戴琳回应改名:我本姓张,退役了自然要改回本姓

手工制作阿歼
2026-02-03 17:29:42
比亚迪的“斩杀线”

比亚迪的“斩杀线”

财经早餐
2026-02-03 07:01:06
不要再随意猜测杨兰兰的身份了,释放的信号很明显了

不要再随意猜测杨兰兰的身份了,释放的信号很明显了

李昕言温度空间
2025-08-20 15:01:53
西贝回应深圳海雅缤纷城店闭店:已与商场达成方案,顾客储值余额可在全国任意西贝门店使用

西贝回应深圳海雅缤纷城店闭店:已与商场达成方案,顾客储值余额可在全国任意西贝门店使用

财经网
2026-02-03 15:02:03
和中国断绝关系,她死活不松口,美方下了死命令,大军可要动真格

和中国断绝关系,她死活不松口,美方下了死命令,大军可要动真格

议纪史
2026-02-02 12:15:09
大清名将海兰察:生吃动物,只喜胖妇,行军中直接用水牛解压

大清名将海兰察:生吃动物,只喜胖妇,行军中直接用水牛解压

铭记历史呀
2026-01-26 19:56:20
俄媒文章:欧洲国家正积极调整对华立场

俄媒文章:欧洲国家正积极调整对华立场

参考消息
2026-02-02 21:13:42
75岁有八个男朋友?凌晨在北京去世?刘晓庆身上的谣言太离谱

75岁有八个男朋友?凌晨在北京去世?刘晓庆身上的谣言太离谱

林雁飞
2026-02-03 13:27:48
世界杯官方账号发布了一张C罗的背影照,并配文:灯熄灭了!!

世界杯官方账号发布了一张C罗的背影照,并配文:灯熄灭了!!

足球大叔1986
2026-02-03 01:32:59
三观稀碎!萝莉岛案开源,真吃人吃真人的资本主义

三观稀碎!萝莉岛案开源,真吃人吃真人的资本主义

超级学爸蛋总
2026-02-02 23:48:52
5死!江苏响水月港大桥突然坍塌,河面主跨95米,工程造价2亿多元

5死!江苏响水月港大桥突然坍塌,河面主跨95米,工程造价2亿多元

火山诗话
2026-02-03 13:49:07
荒诞喜剧!papi酱吐槽春晚视频下架,“太好笑了毙掉”竟成神预言

荒诞喜剧!papi酱吐槽春晚视频下架,“太好笑了毙掉”竟成神预言

露珠聊影视
2026-02-02 17:51:52
沪银主力合约再度触及跌停

沪银主力合约再度触及跌停

每日经济新闻
2026-02-03 10:54:07
遵义市市长黄伟任上被查 16岁考上大学 几天前在参会

遵义市市长黄伟任上被查 16岁考上大学 几天前在参会

红星新闻
2026-02-03 10:47:26
美国贸易代表:印度同意降低对美关税

美国贸易代表:印度同意降低对美关税

界面新闻
2026-02-03 22:25:53
一天8次!43岁男子确诊肾衰竭,妻子痛哭:劝了多次都不听

一天8次!43岁男子确诊肾衰竭,妻子痛哭:劝了多次都不听

蜉蝣说
2026-02-01 20:34:25
蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

素衣读史
2026-01-24 17:12:53
开通4天,望京西换乘遭疯狂吐槽!

开通4天,望京西换乘遭疯狂吐槽!

望京网
2026-02-03 17:26:38
第四代住宅卖不动了?住进去才知道的“七宗罪”

第四代住宅卖不动了?住进去才知道的“七宗罪”

室内设计师有料儿
2026-01-20 11:23:56
2026-02-03 22:52:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2091439文章数 5346关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

挪威王储妃给爱泼斯坦发暧昧邮件:你让我兴奋

头条要闻

挪威王储妃给爱泼斯坦发暧昧邮件:你让我兴奋

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

大S逝世一周年 S家没通知大S子女惹争议

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

本地
亲子
房产
教育
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

儿童含氟牙膏哪个牌子好?2026年口腔医师认证含氟防龋牙膏推荐榜

房产要闻

大盘最低杀到8000+/㎡!海口59盘,最新房价曝光!

教育要闻

什么是好的“教育生态”? 培养学生坚韧与勇气的品质比任何标准答案都宝贵

军事要闻

特朗普:庞大兵力将很快抵达伊朗

无障碍浏览 进入关怀版