2026年2月Claude Opus 4.6更新后,开发者圈子一片哀嚎:复杂工程任务从"Senior Expert"级协作,迅速退化成"需要反复监督的实习生"。AMD高级AI总监Stella Laurenzo甩出的6852次日志实锤把一切量化:中位思考长度从2200字符暴跌至600字符(降73%),代码阅读/修改比例从6.6:1崩到2:1,模型"上来就瞎写"而不看上下文;错误导致API重试暴增80倍,用户实际支出上升却质量下滑。
![]()
GitHub Issue、Reddit r/ClaudeAI、HN讨论和独立分析(6800+会话数据)进一步确认:这波"shrinkflation"(缩水通胀)从2月下旬开始,3月思考内容隐藏功能上线后更难察觉。Anthropic官方回应称是"自适应思考(adaptive thinking)+默认effort=85(中等努力)"的优化结果,目的是提升延迟和token效率,并非恶意降智。但用户数据表明,复杂工程场景下模型严重低估任务复杂度,导致浅层推理。
下面,我们不纠结"动机"(成本控制 vs 新模型Mythos铺路),而是纯技术推测:Anthropic到底通过哪些服务器端/推理时操作,就能让一个已经训练好的旗舰模型(Opus 4.6)在不重新训练、不改变定价的情况下,系统性地"降智"?
![]()
1. 最核心推测:推理预算(Thinking Budget)从固定高配切换到动态自适应限流
Anthropic早在Claude Code文档中就支持MAX_THINKING_TOKENS和/effort参数。Opus 4.6引入"adaptive thinking"后,服务器端默认把effort从"high/max"下调至"medium(85)"。模型内部有一个meta-decider(元决策器),根据prompt复杂度估算需要多少思考token,然后动态截断。
推测细节:后端配置文件中,adaptive_thinking_threshold被调低,或引入负载感知的budget_scaler(例如高峰期自动乘以0.3-0.5系数)。日志显示思考长度"时段性"波动,正好匹配AWS/Google Cloud的动态负载均衡API。
效果:简单任务不受影响,复杂多文件工程直接"浅思考",Read:Edit比率崩盘。用户付的output token(思考也按output计费)反而更多,因为重试循环。
2. 努力等级(Effort Levels)映射到底层算力配额
Anthropic把effort拆成离散等级(low/medium/high/max),每个等级对应不同的内部compute allocation。Medium effort限制总推理步数(steps)或并行CoT链数量,强制模型早停(early stopping)。更狠的可能是:服务器端路由部分请求到量化/蒸馏子模型(quantized Opus-lite),对外仍标"Opus 4.6",用户无感知。日志中"阅读上下文不足"正是低比特量化后注意力机制退化的典型症状。
3. 负载感知动态配额 + 时段性throttling
后端部署了global rate limiter + per-region budget allocator,根据GPU/TPU实时利用率自动缩减单查询的max_tokens_for_thinking。峰值时段(5-7pm,美西/全球用户重叠)触发throttle_factor=0.4,深夜恢复1.0——这解释了AMD总监日志的"智商按时段分配"。
4. 辅助优化手段:上下文压缩 + 采样策略微调
Context Compaction自动压缩历史对话/代码库,丢失关键细节,导致模型"读不懂"长上下文。Decoding tweaks方面,默认temperature下调、top_p收紧、top_k限制,减少探索性,输出更"保守"但也更浅薄、易翻车。
![]()
结论与用户建议
Opus 4.6的"降智"本质是商业成本优化在技术上的完美落地——通过自适应预算、努力映射、负载throttling三板斧,把高阶推理的GPU小时从用户身上抠出来,转嫁到重试费用和用户挫败感上。
开发者应对建议:强制/effort max + CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING;拆解任务(先规划再执行);监控自己的thinking长度(用第三方proxy);或切换到Sonnet 4.6(有时反而更稳)。
AI时代,模型能力不再是"训练出来"的固定属性,而是服务器端可实时调节的旋钮。Anthropic这次把旋钮往"省钱"方向猛拧了一把,用户用数据和钱买了教训。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.