网易首页 > 网易号 > 正文 申请入驻

Claude"降智门":6852次日志背后的真相

0
分享至

Claude"降智门":6852次日志背后的真相,让我把核心工作流切回了古法编程

昨晚凌晨2点,我又一次把项目回滚到了三天前的版本。

原因很简单:Claude Code把我在过去72小时里写的代码改得面目全非,而且越改越离谱。最讽刺的是,当我告诉它"这个设计方向有问题"的时候,它居然开始重写整个架构——然后把我原本能跑通的模块也写坏了。

我盯着屏幕看了十分钟,最后打开了VS Code的手动编辑模式。

这是我本月第四次切回"古法编程"。

更讽刺的是,我想起了DBinary在知乎上写的那个回答:"我突然想问一下有多少人和我一样开始把核心工作流切回了'古法编程',并且'古法'的比例开始越来越高。"

当时看到这句话,我还心想:不至于吧,肯定是你们没用对方法。

现在我只想说:打脸来得真快。

说实话,两个月前我还是Claude的死忠粉。

那时候我几乎逢人就安利:Claude Opus 4.6就是目前最强的编程模型,没有之一。写代码快、理解能力强、架构设计有深度,一个月200刀的订阅费我都觉得值。

但从今年2月开始,事情变得不对劲了。

我注意到它的输出变得越来越"急"。以前它会花好几秒研究代码结构,然后再给出修改建议。现在呢?几乎是秒回,而且经常改了一半就停手,仿佛急着去赶下一个任务。

我开始记录它的响应时间。以前平均8-12秒,现在平均2-3秒。快了,但质量肉眼可见地下滑。

有个细节特别让我恼火。以前Claude遇到不确定的地方会问,会说"我不太确定这个函数的作用,你能解释一下吗"。现在?它直接瞎猜,猜对了算你运气好,猜错了你还得花时间debug。

我一开始以为是我的问题。是不是我的提示词写得不够好?是不是我描述需求不够清晰?我甚至去报了一个Prompt Engineering的课程,学习怎么让AI更好地理解我。

直到我看到了AMD AI总监Stella Laurenzo在GitHub上发布的那份报告。

6852次真实会话的监测日志,将近三个月的数据。结论是:Claude的思考深度下降了67%。

不是17%,不是27%,是67%。

我愣在那,然后突然有种被当猴耍的感觉。

原来不是我变笨了,是AI在偷懒。

数据说得很清楚:代码阅读次数从6.6次/编辑骤降到了2.0次。这意味着什么?意味着Claude在看你的代码之前就已经决定要怎么改了。它根本不愿意花时间真正理解你的项目结构,就开始输出那些看似专业但实际上漏洞百出的建议。

我还注意到一个细节:3月8日后"懒惰钩子"触发了173次,而此前从未触发过。

什么是"懒惰钩子"?就是当AI不想深入思考时,它会找各种借口搪塞你。"这个任务太复杂了"、"我需要你提供更多上下文"、"我建议你换一种实现方式"——翻译过来就是:我不想动脑子了。

更离谱的是API成本。因为浅层思考导致持续输出错误,用户不得不反复重试,最后成本暴增了80倍。

我算了一下自己的账单,上个月确实比往常多花了将近500刀。而我当时还以为是我用得更频繁了。

后来我才反应过来,不是我用得更多,而是我在反复交学费。AI给出一个错误的方案,我发现有问题,让它改,它又给出另一个错误的方案,我再让它改——一来二去,token就这么烧没了。

Anthropic官方的回应很有意思。他们确认了两次改动:2月9号引入了"自适应思考",3月3号把默认思考等级调到了"中级"。

他们的说法是:在智能、延迟、成本之间,找到一个"甜蜜点"。

听到这个解释,我笑了。

这不就是委婉地说"我们在偷偷降智"吗?

我专门去看了知乎上DBinary的回答。

他说得特别到位:"对于一些关键的架构设计,Claude Opus 4.6在项目迭代设计中能力退化的极其严重。特别是当我们对一个框架设计到一半时,发现之前的架构设计不合理——这种推翻性的变革性的设计,只要一两次就可以把现在最牛逼的Code Agent从天才打成傻福。"

他还提到了codex的问题:"codex找bug挺厉害,写代码和opus能力差了一个次元"。

这让我想起我上周的经历。我让Claude重构一个模块,结果它把原本能跑通的代码也写坏了。我让它改回去,它又改出新的bug。折腾了三个小时,最后我干脆把代码回滚到最初的版本,自己动手半小时搞定。

这完全就是我的经历。

复杂项目最怕的不是AI写得慢,而是它半懂不懂地乱改。你让它改A,它把B和C也动了。你让它重构,它把能跑通的代码也写坏了。然后你发现,与其花半小时跟它扯清楚,还不如自己花十分钟手动改完。

最可怕的是那种"模式匹配失效"的情况。当项目的复杂度超过AI的理解范围时,它会开始胡编乱造。不是"我不知道",而是"我瞎猜一个"。猜对了是它厉害,猜错了是你背锅。

DBinary管这叫"古法编程"。我管这叫"返璞归真"。

但这件事真正吓人的,不是Claude一个模型的问题。

是新智元那篇文章里说的:整个AI行业可能都在玩同一套把戏。

你想想,所有大模型公司现在都在算三笔账:

用户嫌慢,这是延迟问题。推理太贵,这是成本问题。要服务更多人,这是吞吐问题。

这三笔账同时压过来,平台就一定会产生一种冲动:在用户不敏感的地方,偷偷收一点"脑力税"。

把默认思考调浅一点。把深入阅读压缩一点。把多轮推理收窄一点。

平均看,也许更划算。报表上,也许更漂亮。用户满意度调查?短期可能还看不出来。

可对那些把AI当生产工具的人来说,天塌了。

因为复杂工作最值钱的,从来不是"输出速度",是质量,是"先理解,再动手"的那段沉默。

我现在明白为什么那篇文章里说"你买下的从来不是智能,而是一种随时可能被回收的体验"。

太准确了。

这就像你买了一辆豪车,开了一个月后,车厂远程OTA升级,把你的V8发动机换成了V6,然后跟你说"这样更省油"。问题是,你买车的时候看中的是那个V8的推背感,不是省不省油。

AI模型的订阅服务也是一样。你订阅的时候,是基于当时的性能做决定的。但后来性能下降了,价格没变,你甚至连个通知都没收到。

你以为你在购买一张通往未来AGI的船票,实际上,船长为了省油,偷偷关掉了雷达。而你还在船舱里,对着越来越慢的网速发呆,以为是自己手机的问题。

那个"赛博油条"的比喻也很绝。它不再是那个"谋定而后动"的智者,而沦为了一个急于打卡下班的打工人。它还能说话,还能写代码,甚至还更流畅。但你已经不敢把关键任务交给它了。

这就像一辆车,发动机还在响,方向盘也能转,油门踩下去也还能冲。只是刹车,悄悄薄了一层。

你平时感觉不到,直到你需要急刹车的时候,才发现不对劲。等你发现的时候,可能已经晚了。

这就是Claude"降智门"最可怕的地方:不是它完全不能用了,而是它在你毫无察觉的情况下,变得不再可靠。

所以我现在的工作流是这样的:

简单任务,让AI干。复杂架构,自己来。遇到需要推翻重来的设计,直接切回古法编程,摸透每一个接口,理解每一行代码。

效率?确实比纯用AI的时候低了一点。

但代码质量?稳多了。

而且我发现,当我自己动手写代码的时候,我对项目的理解更深了。以前我依赖AI来"理解"代码,现在我必须自己理解。这种"摩擦感"虽然痛苦,但让我成为了一个更好的工程师。

DBinary说得对:"古法编程的摩擦感强制要求开发人员摸透整个项目框架的每一个细节,当发生设计变更时,开发人员可以很快的定位到哪些代码需要变动,哪些接口需要重新适配。"

这就是代价,也是收获。

DBinary在回答最后说:"以前我以为AI不行的,他行,今天我以为他行的,结果又不行了,我到底在期待什么。"

我想我的期待很简单:要么你告诉我真实的性能参数,让我自己决定要不要用;要么你就别偷偷改默认值,把我当傻子一样蒙在鼓里。

毕竟,我花200刀一个月,买的是智能,不是"赛博油条"的打卡服务。

4月8号,Anthropic关闭了GitHub上的issue。

没有解释到底解决了什么,只是关闭了。

我看着那个已关闭的标签,突然想起了一个老梗:当用户抱怨AI变笨时,官方的默认回复永远是那句高高在上的——"请检查您的设置"。

好家伙,原来真正需要检查设置的,是你们自己啊。

这就像是医生给病人开了药,病人吃了病情恶化,医生却说"请检查你的服药方式"。然后病人发现,原来医生偷偷把药的有效成分减半了。

只是作为用户,我还是想说:能不能先把那67%的思考深度还回来,咱们再聊订阅续费的事?

毕竟,再聪明的AI,变笨了也是白搭。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈丽华告别仪式!孙女手捧遗像,迟重瑞站家属首位,儿子很悲伤

陈丽华告别仪式!孙女手捧遗像,迟重瑞站家属首位,儿子很悲伤

180视角
2026-04-09 17:30:14
当不成首相了?高市身体出了问题,日本请求对话,伊朗泼了冷水

当不成首相了?高市身体出了问题,日本请求对话,伊朗泼了冷水

青烟小先生
2026-04-10 10:14:07
降压效果最好的运动,首推这3种,一次几分钟就管用!赶紧收藏

降压效果最好的运动,首推这3种,一次几分钟就管用!赶紧收藏

DrX说
2026-04-09 13:13:03
断更三年!潘石屹突然发声:我命由我

断更三年!潘石屹突然发声:我命由我

新浪财经
2026-04-07 22:44:05
委内瑞拉代总统首次出访

委内瑞拉代总统首次出访

海外网
2026-04-10 09:24:06
津巴布韦明确解除锂矿出口禁令前提条件? 中资锂企:在谈判中,头部企业进展会很快

津巴布韦明确解除锂矿出口禁令前提条件? 中资锂企:在谈判中,头部企业进展会很快

财联社
2026-04-09 21:37:03
陈丽华葬礼曝光!多位“大人物”到场,炸出一堆“牛鬼蛇神”

陈丽华葬礼曝光!多位“大人物”到场,炸出一堆“牛鬼蛇神”

梦醉为红颜一笑
2026-04-10 05:16:35
迟先生哭了 ,陈丽华追悼会现场,儿子儿媳接待众人,孙子罕见露面

迟先生哭了 ,陈丽华追悼会现场,儿子儿媳接待众人,孙子罕见露面

起喜电影
2026-04-10 07:57:14
甘肃任免杨晓锋、肖福赟、郭青林、杨芊滨、张荣、李小明等职务

甘肃任免杨晓锋、肖福赟、郭青林、杨芊滨、张荣、李小明等职务

中国经济网
2026-04-10 09:50:14
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

古史青云啊
2026-04-07 14:52:09
穆罕默德·维沙身亡

穆罕默德·维沙身亡

南方都市报
2026-04-09 14:20:56
陈丽华长子身份曝光:北大毕业,31岁成为富华掌舵人

陈丽华长子身份曝光:北大毕业,31岁成为富华掌舵人

李橑在北漂
2026-04-09 11:48:49
长公主被家暴流产了

长公主被家暴流产了

毒舌扒姨太
2026-04-08 22:29:19
沪指涨逾1% 证券板块涨超4%

沪指涨逾1% 证券板块涨超4%

财联社
2026-04-10 09:58:04
温州人张玉宁,出任国足第一队长!

温州人张玉宁,出任国足第一队长!

住温网
2026-04-10 10:32:02
2026年江苏省养老金方案预测:何时公布,有啥变化?提前了解!

2026年江苏省养老金方案预测:何时公布,有啥变化?提前了解!

虎哥闲聊
2026-04-10 09:08:48
毛主席少有人知的一个儿子:身份至今存疑,主席的做法令人佩服

毛主席少有人知的一个儿子:身份至今存疑,主席的做法令人佩服

知否否
2024-06-01 17:28:13
“解冻是真实的”!中方证实:5年多来首次访华

“解冻是真实的”!中方证实:5年多来首次访华

第一财经资讯
2026-04-09 14:49:20
委内瑞拉代总统首次出访,不是美国

委内瑞拉代总统首次出访,不是美国

鲁中晨报
2026-04-10 09:17:20
郑丽文要签署两岸和平协议,蒋经国后终于出现第二个推动统一的人

郑丽文要签署两岸和平协议,蒋经国后终于出现第二个推动统一的人

暮雪无痕
2026-02-03 08:52:46
2026-04-10 11:40:49
AI效率笔记
AI效率笔记
专注AI工具测评与效率提升。
378文章数 8关注度
往期回顾 全部

科技要闻

程序员惊喜,每月100美元!OpenAI推新套餐

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

全新一代理想 L8 五座旗舰+5C增程系统 三季度交付

态度原创

艺术
家居
旅游
数码
公开课

艺术要闻

于小冬2026年4月油画新作《花季》

家居要闻

复古风格 自然简约

旅游要闻

昆明4—5月赏花时间表收好!跟着这篇走,拍满256G!

数码要闻

REDMI Book Pro 2026官宣本月发布:酷睿Ultra X7 358H+99Wh巨无霸电池

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版