网易首页 > 网易号 > 正文 申请入驻

Anthropic 服软了!长文复盘 Claude Code 三大 bug,全员额度重置!

0
分享至

来源:市场资讯

(来源:AI信息Gap)

Anthropic 服软了。

过去一个多月,关于 Claude Code「降智」的吐槽就没听过。

刚刚,Anthropic 官方发布了一篇长文,承认确实出了问题。三个 bug,一路从 3 月 4 日到 4 月 20 日。

重点来了,「作为补偿,所有 Claude 订阅用户的额度重置。」

事情要从 4 月初说起。

AMD 的 AI 负责人 Stella Laurenzo,在 GitHub 上创建了一个 issue。

她上传了一份量化分析报告,基于自己团队 6852 个 Claude Code 会话日志。结论是,Claude Opus 4.6 在 Claude Code 里的思考深度,从 2 月下旬起跌了 67%。

Claude Code 负责人 Boris Cherny 当时亲自下场回应,但没把话说死。提出了几个改动,没有承认模型真的变差。

接下来两周,GitHub 和 AI 社区的吐槽越来越多。甚至有团队直接把 Claude 用量从 80% 砍到了 20%。

眼看这泼天的流量就要飞走,Anthropic 官方坐不住了。长文的开头是这么写的。

「过去一个月,我们一直在调查 Claude 智商降低这件事。目前来看,这是由三个独立的改动造成的。」

影响了 Claude Code、Agent SDK 和 Cowork。API 不受影响。

三个 bug,一个一个来说。

01|把默认思考等级偷偷调成了 medium

3 月 4 日,Anthropic 把 Claude Code 的默认思考等级从 high 调成了 medium。

Claude Code 允许调节思考强度。等级越高,模型想得越深,答案越全面,延迟也越高。

Anthropic 说,「当时的担心是,high 模式下 Claude 会想太久,UI 看起来像卡死了。换成 medium,大部分任务延迟都能短不少。」

上线那天,Claude Code 还弹了个提示。「我们建议你用 medium。」

大部分用户看到提示后,就把 medium 当默认等级了。


然后问题来了。

开发者要的不是更快的 medium,是会认真思考、能真正解决问题的 high。抱怨越来越多,4 月 7 日 Anthropic 把默认甚至改了回来。

Opus 4.7 现在默认 xhigh。其他所有模型默认 high。

这是 Anthropic 自己放出来的对比图。Opus 4.7 的 xhigh 准确率有 71%,Opus 4.6 的 medium 只有 48%。


默认等级一砍,分数差了 20 多个百分点。

02|一个缓存优化,让 Claude 边干边忘

3 月 26 日,Anthropic 上线了一个缓存优化。

Claude Code 靠提示缓存(Prompt Caching)技术给连续对话加速。如果一个会话空闲一段时间没人用,缓存会被清理。下次再打开,就得重新发送一次完整提示词,又贵又慢。

Anthropic 当时想的是,「既然缓存已经没了,干脆顺手把老的思考内容也砍掉。反正这些内容在会话恢复时也用不上,扔了还能省 token。」

目标是,空闲超过 1 小时的会话在恢复时,清一次之前的思考记录。注意,一次就够。

实际上线的 bug 是这样。每一次 API 请求都在清。

来看这张官方对比图。右边是 bug 版本。本该保留的思考内容,每一轮都在被丢掉。


结果 Claude 干着干着就忘了自己之前为什么要干这个。用户感受到的就是,它会重复、会忘事、会选奇怪的工具。

边干边忘还有一个副作用。思考内容被扔掉之后,提示缓存也跟着失效。这就是为什么有用户抱怨「额度消耗比预期快」。

这个 bug 4 月 10 日在 v2.1.101 版本被修复了。

还有一个细节。Anthropic 后来用代码审查(Code Review)工具回头测试这个 bug。

用 Opus 4.7,bug 成功找出来了。

用 Opus 4.6,找不出来。

正好说明 Opus 4.6 被降智了。

03|系统提示词多加了一句「别啰嗦」

4 月 16 日,Opus 4.7 发布。

这个模型有个特点,话痨。一个问题能回答很长,tokens 烧得很快。

Anthropic 在 Claude Code 的系统提示词里加了这么一条。

「Length limits: keep text between tool calls to ≤25 words. Keep final responses to ≤100 words unless the task requires more detail.」

工具调用之间的话别超过 25 个词。最终回答不超过 100 个词,除非任务真的需要。

目标是让 Claude 回复短一点,省 token。

然后意外出现了。

就这一句话,让 Opus 4.6 和 Opus 4.7 的编程能力同时下降了 3 个百分点。

编程这事,思考本身就是解题重要的一部分。强行让模型「少写点」,等于逼它少想点。

4 月 20 日的 v2.1.116,直接把这一条系统提示词干掉了。

Claude Code 负责人 Boris Cherny 补充说道。

「这可能是我遇到的最复杂的一次排查。根本原因藏得很深,还有一堆干扰项。」

三个 bug 各自影响不同用户、在不同时间段、用不同方式触发。叠加起来看就是一种「广泛但不一致的降智」。

Anthropic 内部自己没检查出来。直到用户在 /feedback 里贴了具体可复现的例子,他们才锁定到这三个 bug。

顺带说一嘴,Opus 4.7 本身在 Claude Code 里还有其他吐槽,Boris 说「团队还在修。」


Anthropic 承诺的改进里有这么几条。

内部员工以后用和外部用户一模一样的 Claude Code 版本,不再用内部特供版。

系统提示词的改动,要做更大范围的评估,逐行做消融实验。

任何可能牺牲模型智商的改动,都要先小范围灰度,再全量推送。

作为补偿,从今天起,所有 Claude Code 订阅用户的使用额度重置。

重置额度,OpenAI 的 Codex 最有经验了。

光这周,没记错的话,Codex 就重置了 2 次 额度。

这次,Anthropic 终于也跟进了。

我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一觉醒来,特朗普闹出6个国际笑话,伊朗让美国颜面扫地

一觉醒来,特朗普闹出6个国际笑话,伊朗让美国颜面扫地

混沌录
2026-04-24 21:02:23
国产大型运输机运-20批量列装

国产大型运输机运-20批量列装

环球网资讯
2026-04-25 08:51:04
全球外交地震!美俄竟同月访华,世界终于认清:中国才是最稳码头

全球外交地震!美俄竟同月访华,世界终于认清:中国才是最稳码头

深析古今
2026-04-24 13:47:13
北京车展冒出一堆路虎风味国产电车

北京车展冒出一堆路虎风味国产电车

源Auto
2026-04-24 20:19:02
女篮抽到下下签,宫导迎挑战!放弃3人、启用李梦、刘禹彤是良策

女篮抽到下下签,宫导迎挑战!放弃3人、启用李梦、刘禹彤是良策

米果说识
2026-04-25 08:55:28
老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

魔都姐姐杂谈
2026-04-24 11:56:08
76岁的万科创始人王石,最近彻底成了全网焦点。

76岁的万科创始人王石,最近彻底成了全网焦点。

梦录的西方史话
2026-04-23 14:36:39
詹姆斯29+13+6创3大历史第1神迹,湖人夺赛点!斯马特创两大纪录

詹姆斯29+13+6创3大历史第1神迹,湖人夺赛点!斯马特创两大纪录

一将篮球
2026-04-25 11:57:29
大学“倒闭潮”倒计时?7年后你的文凭,或许还不如一张电工证

大学“倒闭潮”倒计时?7年后你的文凭,或许还不如一张电工证

小谈食刻美食
2026-04-25 09:37:54
多国反对,中国专机抵美,G20峰会出现变故,80岁总统硬刚特朗普

多国反对,中国专机抵美,G20峰会出现变故,80岁总统硬刚特朗普

离离言几许
2026-04-24 21:37:44
乌专家:中国“榨干”苏联遗产,我们图纸都没看懂,他们造出2.0

乌专家:中国“榨干”苏联遗产,我们图纸都没看懂,他们造出2.0

马蹄烫嘴说美食
2026-04-24 18:45:06
丢G3乌度卡仍甩锅!多次不满关键时刻,批谢泼德传球,谈G4未放弃

丢G3乌度卡仍甩锅!多次不满关键时刻,批谢泼德传球,谈G4未放弃

篮球资讯达人
2026-04-25 12:28:10
昆明长水国际机场内多处漏水,机场客服:正在抢修

昆明长水国际机场内多处漏水,机场客服:正在抢修

极目新闻
2026-04-25 11:40:00
王传福夫妇坐地铁参加北京车展被偶遇,网友:绿色出行

王传福夫妇坐地铁参加北京车展被偶遇,网友:绿色出行

新浪财经
2026-04-25 09:00:05
扇人耳光的保安社会性死亡!“底裤”被扒,正脸流出,还有黑历史

扇人耳光的保安社会性死亡!“底裤”被扒,正脸流出,还有黑历史

君笙的拂兮
2026-04-24 08:13:27
女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

李晚书
2026-04-24 10:39:33
伊朗国防部:伊朗仍留存了大部分导弹能力

伊朗国防部:伊朗仍留存了大部分导弹能力

国际在线
2026-04-25 07:37:09
31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

极目新闻
2026-04-24 17:49:19
保时捷也没流量了,2026年,是谁的最后一届北京车展?

保时捷也没流量了,2026年,是谁的最后一届北京车展?

路咖汽车
2026-04-24 13:50:58
渣土车闯红灯后侧翻埋压小汽车致3死,江西宜春公布事故调查报告

渣土车闯红灯后侧翻埋压小汽车致3死,江西宜春公布事故调查报告

澎湃新闻
2026-04-24 22:52:29
2026-04-25 13:04:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3008983文章数 6918关注度
往期回顾 全部

科技要闻

Anthropic刚拿亚马逊250亿美元,又拿谷歌400亿

头条要闻

媒体:三航母准备围逼伊朗 结果美国海军后院先"炸"了

头条要闻

媒体:三航母准备围逼伊朗 结果美国海军后院先"炸"了

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

本地
旅游
房产
艺术
公开课

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

旅游要闻

活化千年文脉 擘画大河新篇

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

艺术要闻

厦门新地标奠基!美图立方视觉艺术中心,OPEN设计

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版