网易首页 > 网易号 > 正文 申请入驻

Anthropic实锤Claude Code「降智」:就是这三个Bug造成的

0
分享至



机器之心编辑部

今天 AI 圈好不热闹,先是 OpenAI 声势浩大发布 GPT5.5,接着是盼了又盼的 DeepSeek v4 终于发布。

而就在这狂欢的夹缝中,Anthropic 也在「搞事情」,不过不是发布新模型,而是发了一份郑重其事的声明:没错,你们说 Claude Code「降智」是真的,不过这都是有原因的……

「在过去一个月里,一些用户反馈 Claude Code 的质量有所下降。我们对此进行了调查,并发布了一份事后复盘报告,总结了发现的三个问题。」



具体的故事情节要从今年 3 月开始说起,那时候就有网友陆续在 Hacker News、Reddit 等社区吐槽 Claude Code 正变得越来越慢、越来越笨,直言「Claude Code 甚至已经退化到无法用于复杂工程任务的地步」。



随着网友讨论声量的变大,Anthropic 的 Claude Code 工程负责人 Boris Cherny 直接在 GitHub 上回答了网友的疑问,说是做了一些调整,但主要是一些 UI 层面的改动,不应该影响思考本身,也不影响思考预算或扩展推理的底层运作方式啊?

可大家并不买账,主要原因就在于,你说了等于什么都没说。模型「降智」是真的不好用是真的,不管什么原因,一直没给个说法也是真的……

之后,这种讨论和吐槽一直还是在继续,直到今日,官方终于下场了。

Anthropic 表示,其实这些问题源自 Claude Code 和 Agent SDK 的运行框架(Harness),而由于 Cowork 也是基于该 SDK 运行,因此同样受到了影响。「模型本身并没有出现能力退化,Claude API 也未受到影响。」



至于「发现的三个问题」,具体是这样的:

  • 一是「推理努力度调整」未果,反倒让用户觉得模型「变笨」

3 月 4 日,Anthropic 将 Claude Code 的默认推理强度从「high」调整为「medium」,以减少部分用户在高强度模式下遇到的超长延迟(严重时甚至会让界面看起来像「卡死」)。但事实证明这是一个错误的权衡。

于是,等到 4 月 7 日,在用户反馈更希望默认获得更高智能、仅在简单任务中再选择低强度后,Anthropic 撤回了这一改动。但没想到,此次调整影响了 Sonnet 4.6 和 Opus 4.6 版本。



  • 二是缓存机制出现了 Bug

3 月 26 日,Anthropic 上线了一项改动,出于优化会话闲置时的清理逻辑,对超过一小时未使用的会话,在用户重新进入时清理旧的「思考」内容,以降低恢复会话时的延迟。

但意外的是,出现了一个 Bug,导致这个清理操作在后续每一轮对话中都会持续触发,而不是「只执行一次」,从而让 Claude 看起来「持续失忆、健忘且重复」。

Anthropic 察觉到之后,已于 4 月 10 日修复了该问题,但同样,又直接影响了 Sonnet 4.6 和 Opus 4.6。



  • 三是系统提示词变更

4 月 16 日,Anthropic 在系统提示词中加入了一条「降低冗长度」的指令:

「长度限制:在工具调用之间的文本应控制在不超过 25 个词。除非任务需要更多细节,最终回复应控制在不超过 100 个词。」

可在与其他提示词改动叠加后,这一调整反而损害了代码任务的表现,限制了模型在处理复杂任务时的思考深度,导致 coding 质量的下降。

于是,Anthropic 在 4 月 20 日撤回这了一变更,但再一次,该问题又影响了 Sonnet 4.6、Opus 4.6 以及 Opus 4.7。

另外,Anthropic 也在「反省」,因为这些改动分别在不同时间、作用于不同用户流量切片,叠加起来的整体效果表现为「广泛且不一致」的性能下降。

因此,尽管 Anthropic 从 3 月初就开始调查相关反馈,但最初这些问题很难与正常的用户反馈波动区分开来,而且内部使用情况和评测也未能第一时间复现这些问题,所以带给用户这些困扰。

为了表示歉意,截至 4 月 23 日,Anthropic 将重置所有订阅用户的使用限额。

另外,为了以后能够避免类似问题的再次发生,Anthropic 宣布后续将采取多项改进措施:

  • 确保更大比例的内部员工直接使用与用户一致的 Claude Code 公共版本,而非用于测试新功能的内部版本,避免内部与外部环境脱节;同时,改进内部使用的代码审查工具,并将升级后的版本提供给用户。
  • 强化「系统提示词」的评估流程,对其变更施加更严格的控制,每一次修改前,将进行更广泛的「消融实验」,即逐行测试提示词的影响;此外,在 CLAUDE.md 中新增了指导,确保模型特定的改动只作用于对应模型。
  • 对于可能影响模型智能水平的变更,将引入更长的观察期和更细致的灰度发布,以便更早发现问题。

不得不说,难得看到「高傲」的 Anthropic 如此正视自己的问题,看来大家的「吐槽」还是有效果的。

那么你呢,觉得此次 Anthropic 的态度如何,给出的理由是否有说服力?欢迎大家留言、交流!

https://x.com/bcherny/status/2047375800945783056

https://news.ycombinator.com/item?id=47878905

https://www.anthropic.com/engineering/april-23-postmortem

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美司令已有预感,中美一旦开战,摆在美军面前只有两个选择

美司令已有预感,中美一旦开战,摆在美军面前只有两个选择

混沌录
2026-03-12 19:40:12
以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

凡知
2026-04-24 17:49:57
张柏芝大儿子终于“长开”了!穿西装比谢霆锋还帅,网友:像爷爷

张柏芝大儿子终于“长开”了!穿西装比谢霆锋还帅,网友:像爷爷

木子爱娱乐大号
2026-01-07 21:47:13
天生领袖!东契奇受伤后,詹姆斯在队内说:跟着我,我们能赢球!

天生领袖!东契奇受伤后,詹姆斯在队内说:跟着我,我们能赢球!

爱体育
2026-04-23 22:37:50
厦门一乘客酒后打车,支付了77276元车费,司机懵了,追着乘客退钱:不是自己的钱,一分也不能要

厦门一乘客酒后打车,支付了77276元车费,司机懵了,追着乘客退钱:不是自己的钱,一分也不能要

环球网资讯
2026-04-24 17:23:08
92年,钱学森向国家建议:汽车工业跳过汽油柴油,直接进入新能源

92年,钱学森向国家建议:汽车工业跳过汽油柴油,直接进入新能源

文史达观
2024-07-25 17:55:10
一场96-113的惨败,让掘金肠子悔青,雷霆也失算了,马刺看到希望

一场96-113的惨败,让掘金肠子悔青,雷霆也失算了,马刺看到希望

毒舌NBA
2026-04-24 12:47:04
杨毅季后赛前曝猛料:北京外援集体罢吃早餐 麦基带头引众怒?

杨毅季后赛前曝猛料:北京外援集体罢吃早餐 麦基带头引众怒?

你看球呢
2026-04-24 10:45:24
扮猪吃虎?忍耐四个月,委代总统撕破伪装,率几十万大军硬刚美国

扮猪吃虎?忍耐四个月,委代总统撕破伪装,率几十万大军硬刚美国

白色得季节
2026-04-24 20:28:20
CBA宣布离谱决定

CBA宣布离谱决定

宗介说体育
2026-04-24 09:57:42
实测DeepSeek V4,为国产化而生。

实测DeepSeek V4,为国产化而生。

数字生命卡兹克
2026-04-24 15:00:19
3艘俄军舰被炸沉!局势触及核红线,美方:俄罗斯或动用核武器!

3艘俄军舰被炸沉!局势触及核红线,美方:俄罗斯或动用核武器!

健身狂人
2026-04-23 15:46:53
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
为什么脑梗逐年增多?提醒:与肥肉无关,有一样东西要少碰

为什么脑梗逐年增多?提醒:与肥肉无关,有一样东西要少碰

芹姐说生活
2026-04-19 08:33:41
五一前后,贵人主动伸出援手,事业迎来转机的三个星座

五一前后,贵人主动伸出援手,事业迎来转机的三个星座

小晴星座说
2026-04-24 19:08:23
DeepSeek V4 Pro杀回开源榜第3,闭源模型优势窗口正在崩塌

DeepSeek V4 Pro杀回开源榜第3,闭源模型优势窗口正在崩塌

六子吃凉粉
2026-04-24 14:19:00
墨菲13-3横扫肖国栋:一场提前终结的比赛

墨菲13-3横扫肖国栋:一场提前终结的比赛

赛场速报局
2026-04-24 20:46:00
拜合拉木谈安东尼奥:没有他选我进国青,可能我还在内蒙踢

拜合拉木谈安东尼奥:没有他选我进国青,可能我还在内蒙踢

懂球帝
2026-04-23 23:24:51
汤姆斯杯小组赛:中国队仅输1局,5-0碾压澳大利亚,迎开门红

汤姆斯杯小组赛:中国队仅输1局,5-0碾压澳大利亚,迎开门红

侧身凌空斩
2026-04-24 19:15:54
火箭0-2湖人,还能逆转吗?苏群8个字回应,杨毅:詹姆斯可能放水

火箭0-2湖人,还能逆转吗?苏群8个字回应,杨毅:詹姆斯可能放水

八斗小先生
2026-04-24 18:34:08
2026-04-24 21:20:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12851文章数 142635关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

男子抚养14年儿子非亲生 妻子结婚摆酒前跟别人在一起

头条要闻

男子抚养14年儿子非亲生 妻子结婚摆酒前跟别人在一起

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

时尚
艺术
家居
旅游
本地

水晶专场 || 一眼就沦陷的绝美水晶,百元级的快乐

艺术要闻

2025最绘画--第四届中国青年油画作品展 | 油画选刊(三)

家居要闻

自然肌理 温润美学

旅游要闻

视点|泡泡玛特城市乐园焕新升级,新地图解锁更多欢乐!

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

无障碍浏览 进入关怀版