一个被反复验证的诡异现象:同一个AI模型,用着用着就"变懒"了。不是幻觉,是数万用户同步感受到的协同失效。
从"同事变脸"到集体控诉
![]()
事情最初只是零星吐槽。Claude Opus用户发现,这位曾经的"得力助手"开始漏读代码、跳过推理步骤、长任务里提前收工。像配合多年的同事忽然换了个人,搁谁都得愣一下。
第一反应永远是自我怀疑:prompt写砸了?任务描述不清?但很快,Reddit的Claude社区出现了高度一致的反馈矩阵——不同用户、不同场景,重复同一类症状。
有人量化得更狠。一位用户在Claude Code的历史日志里做对比,发现自2月更新以来,复杂任务的推理深度下降了67%。「read:edit」比例从6.6骤降至2.0;3月8日后,被stop hook捕捉的违规行为173次,此前为0。
数字来源有 caveat:67%是基于签名长度与思考内容的相关估计,一月的基线日志已被删除。但行为层面的变化确凿——模型确实在"少做事"。
社区造了新词:「AI shrinkflation」(AI缩水式通胀)。商品缩水,价格不变;模型缩水,名字不变。
正方:系统优化,不是模型变弱
Anthropic没有承认"削能力"。Claude Code开发负责人Boris把变化归因于系统层:工具调用方式、推理策略、资源分配机制的调整。
核心变化是「自适应推理」(adaptive thinking)。模型现在自己判断任务复杂度,动态决定投入多少算力。简单任务少想,复杂任务多想,整体效率提升。
从工程视角,这无可挑剔。算力是硬成本,响应速度是用户体验,让模型学会"偷懒"本是理性设计。
Boris还提到另一层:高负载场景下,系统必须对token、算力、请求进行控制。这不是模型能力问题,是基础设施的调度策略。
换句话说,用户感受到的"敷衍",可能是系统在压力下的自我保护机制。
反方:优化与削弱的体验边界已模糊
但工程合理性不等于用户可接受。效率优化和能力削弱,在体验层完全同质:都是更少读上下文、更快给答案、更频繁提前结束。
自适应推理的感性代价更隐蔽。模型在替用户做"重要性判断"——你的任务值不值得我认真?这种单向决策权,天然触发信任危机。
真正点燃情绪的是时间线巧合。Anthropic同期发布了Claude Mythos Preview,自称"能力跃迁的一代",代码与安全任务远超以往,却限制供给少数机构"加固全球最关键的软件系统"。
旧模型体感下滑,新模型高悬头顶。社区里一个无法证伪的猜测开始疯传:削旧抬新,一捧一踩,制造升级幻觉。
这不是Anthropic独有的阴谋论。2023年就有研究追踪GPT-4的行为漂移,同一模型数月内推理方式明显变化。后来被解释为安全策略收紧、成本优化、推理策略调整的综合结果。
行业常态是:新模型优先吃资源,旧模型边缘化。算力即生产力,投入新一代是理性选择。但"理解"和"接受"之间,隔着知情权。
我的判断:不稳定比"变蠢"更致命
这场争论的真正焦点,不是模型有没有变弱,而是模型作为工具的契约正在瓦解。
传统软件有版本号、有changelog、有功能边界。用户知道自己在用什么,能预期它做什么。但AI产品的核心悖论是:模型即服务,服务即黑箱。
Anthropic可以辩称"系统调整≠能力降级",但用户无法区分。更糟的是,调整发生在无提示、无说明、无边界的情况下。你不知道它何时变、变什么、会不会搞砸你的任务。
这种不确定性正在重塑用户决策。旧模型的不稳定,把用户推向新模型——不是主动升级,是被迫逃离。而用户心知肚明:新模型终将成为下一个旧模型,同样可能在某天"优化"成难受的版本。
「AI shrinkflation」的流行,本质是用户对控制感丧失的命名。当模型能力成为可动态调配的变量,产品承诺就从"我能做什么"滑向"我今天愿意做什么"。
对科技从业者而言,这是更深层的产品警示。自适应推理、动态资源分配、系统层优化——这些工程上聪明的方案,正在制造体验上的信任债务。效率提升的账容易算,用户流失的账难追回。
如果你正在做AI产品,建议做三件事:一、把模型行为的可预期性写进PRD,和准确率同等优先级;二、任何影响输出的系统调整,给用户显式通知或开关;三、假设用户会横向对比你的新旧模型,主动管理预期,别等社区替你"发现"。
Claude的这次风波会平息,但问题不会消失。当所有大模型公司都在赛跑式迭代,"稳定"本身正在成为稀缺品。谁先解决这个悖论,谁就能在下一代用户心智中占位。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.