AI颠覆传统编码，80%代码交给智能！|编程|程序员|工作流|agent|深度思考按钮

分享至

编译 | Tina

今天，Andrej Karpathy 又发了一条很长的推文。

他分享了使用 Claude 进行数周高强度编程后的心得体会，并且表示自己过去 20 年形成的编程工作方式，在短短几周内发生了明显变化：从 11 月还以手写和自动补全为主，到 12 月迅速切换成大约 80% 交给 agent、自己做 20% 的修改润色。

与此同时，他提到 Claude 和 Codex 在 2025 年 12 月左右跨过了某种“一致性 / 连贯性门槛”，让这种以 agent 为主的写法突然变得可行，并且很难再回到完全手写的状态。

“2026 年将是充满活力的一年，因为整个行业都在消化吸收这项新技术。”

1 一个月前，顶级工程师说“我落后了”

而就在一个月前，这位提出“vibe coding”一词的人，还在 X 上写过另一段让人印象深刻的话。

“我从没像现在这样，作为一名程序员感到如此落后。”

在那条 X 动态中，Karpathy 写道，这个职业正在被“剧烈地重构”，个人程序员贡献的代码行数正在变得越来越少。

“我有一种强烈的感觉：如果我能把过去大约一年里已经出现的这些工具真正串联、用好，我的能力可能会提升 10 倍，”他写道，“没能把这种增益拿到手，感觉明显就是技能问题。”

“现在需要掌握的是一层全新的、可编程的抽象层（叠加在以往那些熟悉的抽象层之上）：涉及 agent、子 agent，它们的提示词、上下文、记忆、运行模式、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE 集成等。同时，还必须在脑中建立一个覆盖全局的心智模型，用来理解这些本质上随机、会出错、难以解释、而且不断变化的实体的优势与陷阱——而它们如今被突然掺进了原本那套‘老派而扎实’的软件工程体系之中。”

这一切更像是“一个强大的外星工具被直接发下来，却没有配套说明书”。“每个人都得自己摸索该怎么握住它、怎么操作它，而与此同时，一场 9 级地震正在撼动整个职业，”他写道。

有人说：“如果连他都觉得自己作为程序员已经大幅落后，那就很能说明我们现在处在什么阶段。”是因为说这话的人是 Karpathy——长期被视为“走在最前面”的那类人：2015 年加入 OpenAI 成为创始成员之一，之后又很早投身自动驾驶，担任特斯拉 Autopilot 的 AI 负责人。

在评论区里，另一位重量级人物也表达了强烈共鸣。Claude Code 的核心作者、Anthropic 工程师 Boris Cherny 坦言，自己“几乎每周”都会有类似的感受。

他提到，有时会下意识按老办法去做，做着做着才突然反应过来：“等等，Claude 可能可以直接搞定这个。”

最近一次是在排查 Claude Code 的一个内存泄漏。他一开始走的是传统路径：连上 profiler、跑应用、暂停采样、再手动翻 heap 分配记录，一步步排查。但与此同时，他的一位同事处理同一个问题时，直接让 Claude 生成 heap dump，再让模型去读 dump，找出那些“本不该还被保留着”的对象。Claude 一次就命中问题点，顺手提了个 PR，把问题修掉了。“这种事几乎每周都会发生。”他写道。

Cherny 还补充了一个很有意思的观察：某种意义上，那些新入职的同事，甚至刚毕业的新人，反而更容易把模型用到位。

因为他们不会被“模型做不到什么”的旧印象束缚——那些印象大多是早期模型时代形成的“历史记忆”。而对已经形成使用习惯的工程师来说，每隔一两个月，就得花不小的心理力气去重新校准：模型现在究竟能做到什么——而且这个边界还在持续外扩。

他认为软件工程正在发生根本性变化，而即便是他们这些最早的实践者，最难的部分依然是不断调整自己的预期——而这还只是开始。

Karpathy 则在评论里加了一个比喻：就像你拿着“激光枪”到处指，有时只打出一堆小弹丸，有时甚至会哑火；但偶尔，当你握对了姿势，一束强力激光会突然喷涌而出，直接把你的问题“熔掉”。

2 工具用顺手了后：“这是 20 年最大变化”

到了今天，Karpathy 状态已经明显不一样：不再是“我跟不上”了，而是“我已经换了一种编程方式”。

他用一种几乎夸张的方式描述了这种变化：过去 20 年形成的编程习惯，在短短几周内被打断；11 月还主要靠手写和自动补全，到了 12 月，已经变成大约 80% 的代码交给 agent，自己只做 20% 的修改和收尾。与此同时，他也给出了一个时间点上的判断：在他看来，Claude 和 Codex 大约是在 2025 年 12 月左右跨过了某种“一致性 / 连贯性门槛”，让 agent 编程从“偶尔好用”变成了“可以稳定纳入日常工作流”。

这条推文的评论区也一贯的热闹。

很快就有人表示，这样的转变并不只是 Karpathy 一个人的感受。一位工程负责人在回复中写道，这和他的体验完全一致：真正让人意外的并不是速度提升，而是写代码这件事反而变得更有趣了。那些重复、机械的脏活累活被拿掉之后，剩下的更多是创造性的、值得投入精力的问题；而那些真正拥抱 AI 辅助开发的工程师，不只是变得更快，还开始尝试以前根本不会去尝试的事情。

他引用 Karpathy 的一句话总结这种变化：“不要告诉它怎么做，给它成功标准，然后看它自己跑。”

还有不少人盯住的是这组 80/20 的数字变化。

“未来这个比例只会继续上升，直到有一天我们几乎不再‘写’代码，而只是负责阅读和审查它。”还有人认为以后的瓶颈不再是打字速度，而是我们审查速度有多快，尤其是去识别那些“agent 幻觉出来却被推进生产分支”的东西。

这也势必会积累起“理解债”：因为审查 AI 写出来的代码太费劲，人会越来越倾向于“能跑就先过”，时间久了反而会对自己的代码库理解得越来越少。Karpathy 在评论中表示，他很喜欢“理解债务”这个词，虽然之前没见过，但觉得非常贴切；而且他也承认，这种诱惑确实存在——当 LLM 一次就把问题解决、而且看起来运行得还不错时，人真的很容易就想直接往下走。

也有人把这种变化说成一种“角色对调”：我们花了很多年学会写代码，现在更像是在当一个永不睡觉的实习生的项目经理——分派任务、验收结果、兜底风险。

总之，工具在变强，角色在重排，瓶颈也在迁移：从“写得快”，变成“看得懂、审得住”。而这一轮变化，显然还没到终点。

下面是他今天发布在 X 上的完整长文（按字面翻译，略作通顺处理）：

过去几周我大量用 Claude 写代码，随手记几条零散想法。

编程工作流

随着最近一轮 LLM 编码能力的明显提升，和很多人一样，我的工作方式在很短时间内发生了变化：11 月大概还是 80% 手写 + 自动补全 / 20% agent；到 12 月就变成 80% agent 编码 / 20% 人工改改、收尾润色。也就是说，我现在基本是在用英语“编程”——有点不好意思地用自然语言告诉 LLM 该写什么代码。自尊心多少会疼一下，但能用大粒度的“代码动作”去操控软件这件事，净收益实在太大了，尤其是当你适应它、把它配置好、学会怎么用，并真正想清楚它能做什么、不能做什么之后。

这是我近二十年编程生涯里，对基础工作流影响最大的一次变化，而且它是在短短几周内发生的。我猜现在已经有两位数百分比的工程师也在经历类似的转变；但在更广泛的人群中，对这件事的认知可能仍只有个位数低位百分比。

IDE / agent 群 / 出错风险

在我看来，现在不管是“IDE 不再需要”的热炒，还是“agent swarm”的热炒，都有点过头了。模型当然还会犯错——如果是你真正关心的代码，我会建议你像鹰一样盯着它们：旁边开一个足够大的 IDE，用来随时检查。

而且错误的形态也变了：不再是简单的语法错，而是更隐蔽的概念性错误，有点像一个略显草率、匆忙的初级工程师会犯的那种。最常见的一类是：模型会替你做出一些错误假设，然后不核实就沿着假设一路跑下去。它们也不太会管理自己的困惑：不主动澄清、不揭示不一致、不提供权衡取舍、该反对时也不反对，而且还有点过度讨好。Plan mode 会好一些，但我感觉仍需要一种轻量的、内联的 plan mode。

它们也很容易把代码和 API 过度复杂化：抽象膨胀、架构臃肿、自己制造一堆 dead code 却不清理。它们能写出一个低效、臃肿、脆弱的 1000 行实现，然后就等你提醒一句：“呃……是不是其实可以更简单？”它们就会说“当然可以！”并立刻把它砍到 100 行。

此外，它们偶尔会作为副作用去改 / 删一些自己不喜欢、或没完全理解的注释和代码——哪怕这些内容和当前任务是正交的。即使我在 CLAUDE.md 里做了几次简单的指令尝试，这些问题仍会发生。

尽管有这些毛病，它依然带来巨大的净提升，而且很难想象再回到纯手工写代码的时代。TL;DR：每个人都有自己的新工作流；我现在的配置是：左边开少量几个 Claude Code 会话（Ghostty 的窗口 / 标签页里），右边开 IDE 负责看代码和手动改动。

韧性。看一个 agent 不知疲倦地死磕某件事真的很有意思。它们不会累，不会灰心，就是持续尝试——很多时候如果换成人，早就放弃、改天再战了。看它为一个问题挣扎很久，30 分钟后又突然赢了，那种“feel the AGI”的感觉很强。你会意识到：耐力本身就是工作的核心瓶颈之一，而 LLM 把这条上限显著抬高了。

加速。LLM 辅助带来的“加速”其实不太好衡量。我当然感觉自己做原本要做的事更快了，但更大的变化是：我做了更多，原因主要是两点：

1）我可以写很多以前根本不值得写的东西；

2）我可以去碰以前因为知识 / 技能门槛而不敢碰的代码。

所以这当然是 speedup，但可能更像是一种“扩张”。

杠杆。LLM 特别擅长反复循环，直到达到明确目标——大部分“feel the AGI”的魔法就在这里。与其告诉它怎么做，不如给它成功标准，然后看它自己跑。让它先写测试再通过；把它放进带浏览器 MCP 的闭环；先写一个很可能正确的朴素算法，再让它在保持正确性的前提下做优化。把你的指令从 imperative 转成 declarative，会让 agent 循环更久，从而获得更大的杠杆。

乐趣。我原本没预料到：用 agent 编程反而更有趣了，因为大量“填空式苦力活”被拿掉，剩下的更多是创造性部分。我也更少卡住（卡住真的不快乐），同时更有勇气——几乎总能找到一种方式与它并肩作战，推动事情向前。我也见过相反的观点：LLM 编程会把工程师分成两类——主要喜欢“写代码”的人 vs 主要喜欢“造东西”的人。

退化。我已经注意到，自己手写代码的能力正在慢慢退化。“生成代码”和“判别代码（阅读 / 审查）”在大脑里是两种不同能力。因为编程里有大量偏语法的细碎细节，即便你写起来费劲，审代码通常仍能审得很好。

Slopacolypse（垃圾内容末日）。我已经在为 2026 做心理建设：那很可能是 GitHub、Substack、arXiv、X/Instagram，乃至整个数字媒体的“slopacolypse”（垃圾内容大爆发）之年。我们还会看到更多 AI 炒作式的生产力表演（这居然还能更夸张吗？），与此同时，也会出现真实而确凿的改进。

一些问题。我脑子里的一些问题：“10X 工程师”会怎样？平均工程师与顶尖工程师的生产力差距，可能会被拉大很多。

有了 LLM 之后，通才会越来越超过专才吗？LLM 更擅长“填空”（微观）而不是“大战略”（宏观）。

未来的 LLM 编程体验会像什么？像玩《星际争霸》？《Factorio》？还是演奏音乐？

社会中有多少领域，本质上被数字化知识工作所瓶颈住了？

TL;DR：我们现在处在哪？

到 2025 年 12 月左右，LLM agent 能力（尤其是 Claude 和 Codex）似乎跨过了某种连贯性阈值，并在软件工程及相关领域引发了一次“相变”。现在，“智能”这部分突然显得明显领先于其他所有东西——工具与知识的集成、组织层面的新工作流与流程、以及更广泛的扩散机制。

2026 将是高能量的一年：整个行业都在消化、吸收这股新能力。

https://x.com/karpathy/status/2004607146781278521

https://x.com/karpathy/status/2015883857489522876

声明：本文为 InfoQ 翻译整理，不代表平台观点，未经许可禁止转载。

会议推荐

InfoQ 2026 全年会议规划已上线！从 AI Infra 到 Agentic AI，从 AI 工程化到产业落地，从技术前沿到行业应用，全面覆盖 AI 与软件开发核心赛道！集结全球技术先锋，拆解真实生产案例、深挖技术与产业落地痛点，探索前沿领域、聚焦产业赋能，获取实战落地方案与前瞻产业洞察，高效实现技术价值转化。把握行业变革关键节点，抢占 2026 智能升级发展先机！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.