网易首页 > 网易号 > 正文 申请入驻

AI颠覆传统编码,80%代码交给智能!

0
分享至

编译 | Tina

今天,Andrej Karpathy 又发了一条很长的推文。

他分享了使用 Claude 进行数周高强度编程后的心得体会,并且表示自己过去 20 年形成的编程工作方式,在短短几周内发生了明显变化:从 11 月还以手写和自动补全为主,到 12 月迅速切换成大约 80% 交给 agent、自己做 20% 的修改润色。

与此同时,他提到 Claude 和 Codex 在 2025 年 12 月左右跨过了某种“一致性 / 连贯性门槛”,让这种以 agent 为主的写法突然变得可行,并且很难再回到完全手写的状态。

“2026 年将是充满活力的一年,因为整个行业都在消化吸收这项新技术。”


1 一个月前,顶级工程师说“我落后了”

而就在一个月前,这位提出“vibe coding”一词的人,还在 X 上写过另一段让人印象深刻的话。

“我从没像现在这样,作为一名程序员感到如此落后。”



在那条 X 动态中,Karpathy 写道,这个职业正在被“剧烈地重构”,个人程序员贡献的代码行数正在变得越来越少。

“我有一种强烈的感觉:如果我能把过去大约一年里已经出现的这些工具真正串联、用好,我的能力可能会提升 10 倍,”他写道,“没能把这种增益拿到手,感觉明显就是技能问题。”

“现在需要掌握的是一层全新的、可编程的抽象层(叠加在以往那些熟悉的抽象层之上):涉及 agent、子 agent,它们的提示词、上下文、记忆、运行模式、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE 集成等。同时,还必须在脑中建立一个覆盖全局的心智模型,用来理解这些本质上随机、会出错、难以解释、而且不断变化的实体的优势与陷阱——而它们如今被突然掺进了原本那套‘老派而扎实’的软件工程体系之中。”

这一切更像是“一个强大的外星工具被直接发下来,却没有配套说明书”。“每个人都得自己摸索该怎么握住它、怎么操作它,而与此同时,一场 9 级地震正在撼动整个职业,”他写道。

有人说:“如果连他都觉得自己作为程序员已经大幅落后,那就很能说明我们现在处在什么阶段。”是因为说这话的人是 Karpathy——长期被视为“走在最前面”的那类人:2015 年加入 OpenAI 成为创始成员之一,之后又很早投身自动驾驶,担任特斯拉 Autopilot 的 AI 负责人。


在评论区里,另一位重量级人物也表达了强烈共鸣。Claude Code 的核心作者、Anthropic 工程师 Boris Cherny 坦言,自己“几乎每周”都会有类似的感受。

他提到,有时会下意识按老办法去做,做着做着才突然反应过来:“等等,Claude 可能可以直接搞定这个。”

最近一次是在排查 Claude Code 的一个内存泄漏。他一开始走的是传统路径:连上 profiler、跑应用、暂停采样、再手动翻 heap 分配记录,一步步排查。但与此同时,他的一位同事处理同一个问题时,直接让 Claude 生成 heap dump,再让模型去读 dump,找出那些“本不该还被保留着”的对象。Claude 一次就命中问题点,顺手提了个 PR,把问题修掉了。“这种事几乎每周都会发生。”他写道。

Cherny 还补充了一个很有意思的观察:某种意义上,那些新入职的同事,甚至刚毕业的新人,反而更容易把模型用到位。

因为他们不会被“模型做不到什么”的旧印象束缚——那些印象大多是早期模型时代形成的“历史记忆”。而对已经形成使用习惯的工程师来说,每隔一两个月,就得花不小的心理力气去重新校准:模型现在究竟能做到什么——而且这个边界还在持续外扩。

他认为软件工程正在发生根本性变化,而即便是他们这些最早的实践者,最难的部分依然是不断调整自己的预期——而这还只是开始。

Karpathy 则在评论里加了一个比喻:就像你拿着“激光枪”到处指,有时只打出一堆小弹丸,有时甚至会哑火;但偶尔,当你握对了姿势,一束强力激光会突然喷涌而出,直接把你的问题“熔掉”。

2 工具用顺手了后:“这是 20 年最大变化”

到了今天,Karpathy 状态已经明显不一样:不再是“我跟不上”了,而是“我已经换了一种编程方式”。

他用一种几乎夸张的方式描述了这种变化:过去 20 年形成的编程习惯,在短短几周内被打断;11 月还主要靠手写和自动补全,到了 12 月,已经变成大约 80% 的代码交给 agent,自己只做 20% 的修改和收尾。与此同时,他也给出了一个时间点上的判断:在他看来,Claude 和 Codex 大约是在 2025 年 12 月左右跨过了某种“一致性 / 连贯性门槛”,让 agent 编程从“偶尔好用”变成了“可以稳定纳入日常工作流”。

这条推文的评论区也一贯的热闹。

很快就有人表示,这样的转变并不只是 Karpathy 一个人的感受。一位工程负责人在回复中写道,这和他的体验完全一致:真正让人意外的并不是速度提升,而是写代码这件事反而变得更有趣了。那些重复、机械的脏活累活被拿掉之后,剩下的更多是创造性的、值得投入精力的问题;而那些真正拥抱 AI 辅助开发的工程师,不只是变得更快,还开始尝试以前根本不会去尝试的事情。

他引用 Karpathy 的一句话总结这种变化:“不要告诉它怎么做,给它成功标准,然后看它自己跑。”


还有不少人盯住的是这组 80/20 的数字变化。

“未来这个比例只会继续上升,直到有一天我们几乎不再‘写’代码,而只是负责阅读和审查它。”还有人认为以后的瓶颈不再是打字速度,而是我们审查速度有多快,尤其是去识别那些“agent 幻觉出来却被推进生产分支”的东西。

这也势必会积累起“理解债”:因为审查 AI 写出来的代码太费劲,人会越来越倾向于“能跑就先过”,时间久了反而会对自己的代码库理解得越来越少。Karpathy 在评论中表示,他很喜欢“理解债务”这个词,虽然之前没见过,但觉得非常贴切;而且他也承认,这种诱惑确实存在——当 LLM 一次就把问题解决、而且看起来运行得还不错时,人真的很容易就想直接往下走。

也有人把这种变化说成一种“角色对调”:我们花了很多年学会写代码,现在更像是在当一个永不睡觉的实习生的项目经理——分派任务、验收结果、兜底风险。

总之,工具在变强,角色在重排,瓶颈也在迁移:从“写得快”,变成“看得懂、审得住”。而这一轮变化,显然还没到终点。


下面是他今天发布在 X 上的完整长文(按字面翻译,略作通顺处理):

过去几周我大量用 Claude 写代码,随手记几条零散想法。

编程工作流

随着最近一轮 LLM 编码能力的明显提升,和很多人一样,我的工作方式在很短时间内发生了变化:11 月大概还是 80% 手写 + 自动补全 / 20% agent;到 12 月就变成 80% agent 编码 / 20% 人工改改、收尾润色。也就是说,我现在基本是在用英语“编程”——有点不好意思地用自然语言告诉 LLM 该写什么代码。自尊心多少会疼一下,但能用大粒度的“代码动作”去操控软件这件事,净收益实在太大了,尤其是当你适应它、把它配置好、学会怎么用,并真正想清楚它能做什么、不能做什么之后。

这是我近二十年编程生涯里,对基础工作流影响最大的一次变化,而且它是在短短几周内发生的。我猜现在已经有两位数百分比的工程师也在经历类似的转变;但在更广泛的人群中,对这件事的认知可能仍只有个位数低位百分比。

IDE / agent 群 / 出错风险

在我看来,现在不管是“IDE 不再需要”的热炒,还是“agent swarm”的热炒,都有点过头了。模型当然还会犯错——如果是你真正关心的代码,我会建议你像鹰一样盯着它们:旁边开一个足够大的 IDE,用来随时检查。

而且错误的形态也变了:不再是简单的语法错,而是更隐蔽的概念性错误,有点像一个略显草率、匆忙的初级工程师会犯的那种。最常见的一类是:模型会替你做出一些错误假设,然后不核实就沿着假设一路跑下去。它们也不太会管理自己的困惑:不主动澄清、不揭示不一致、不提供权衡取舍、该反对时也不反对,而且还有点过度讨好。Plan mode 会好一些,但我感觉仍需要一种轻量的、内联的 plan mode。

它们也很容易把代码和 API 过度复杂化:抽象膨胀、架构臃肿、自己制造一堆 dead code 却不清理。它们能写出一个低效、臃肿、脆弱的 1000 行实现,然后就等你提醒一句:“呃……是不是其实可以更简单?”它们就会说“当然可以!”并立刻把它砍到 100 行。

此外,它们偶尔会作为副作用去改 / 删一些自己不喜欢、或没完全理解的注释和代码——哪怕这些内容和当前任务是正交的。即使我在 CLAUDE.md 里做了几次简单的指令尝试,这些问题仍会发生。

尽管有这些毛病,它依然带来巨大的净提升,而且很难想象再回到纯手工写代码的时代。TL;DR:每个人都有自己的新工作流;我现在的配置是:左边开少量几个 Claude Code 会话(Ghostty 的窗口 / 标签页里),右边开 IDE 负责看代码和手动改动。

韧性。看一个 agent 不知疲倦地死磕某件事真的很有意思。它们不会累,不会灰心,就是持续尝试——很多时候如果换成人,早就放弃、改天再战了。看它为一个问题挣扎很久,30 分钟后又突然赢了,那种“feel the AGI”的感觉很强。你会意识到:耐力本身就是工作的核心瓶颈之一,而 LLM 把这条上限显著抬高了。

加速。LLM 辅助带来的“加速”其实不太好衡量。我当然感觉自己做原本要做的事更快了,但更大的变化是:我做了更多,原因主要是两点:

1)我可以写很多以前根本不值得写的东西;

2)我可以去碰以前因为知识 / 技能门槛而不敢碰的代码。

所以这当然是 speedup,但可能更像是一种“扩张”。

杠杆。LLM 特别擅长反复循环,直到达到明确目标——大部分“feel the AGI”的魔法就在这里。与其告诉它怎么做,不如给它成功标准,然后看它自己跑。让它先写测试再通过;把它放进带浏览器 MCP 的闭环;先写一个很可能正确的朴素算法,再让它在保持正确性的前提下做优化。把你的指令从 imperative 转成 declarative,会让 agent 循环更久,从而获得更大的杠杆。

乐趣。我原本没预料到:用 agent 编程反而更有趣了,因为大量“填空式苦力活”被拿掉,剩下的更多是创造性部分。我也更少卡住(卡住真的不快乐),同时更有勇气——几乎总能找到一种方式与它并肩作战,推动事情向前。我也见过相反的观点:LLM 编程会把工程师分成两类——主要喜欢“写代码”的人 vs 主要喜欢“造东西”的人。

退化。我已经注意到,自己手写代码的能力正在慢慢退化。“生成代码”和“判别代码(阅读 / 审查)”在大脑里是两种不同能力。因为编程里有大量偏语法的细碎细节,即便你写起来费劲,审代码通常仍能审得很好。

Slopacolypse(垃圾内容末日)。我已经在为 2026 做心理建设:那很可能是 GitHub、Substack、arXiv、X/Instagram,乃至整个数字媒体的“slopacolypse”(垃圾内容大爆发)之年。我们还会看到更多 AI 炒作式的生产力表演(这居然还能更夸张吗?),与此同时,也会出现真实而确凿的改进。

一些问题。我脑子里的一些问题:“10X 工程师”会怎样?平均工程师与顶尖工程师的生产力差距,可能会被拉大很多。

有了 LLM 之后,通才会越来越超过专才吗?LLM 更擅长“填空”(微观)而不是“大战略”(宏观)。

未来的 LLM 编程体验会像什么?像玩《星际争霸》?《Factorio》?还是演奏音乐?

社会中有多少领域,本质上被数字化知识工作所瓶颈住了?

TL;DR:我们现在处在哪?

到 2025 年 12 月左右,LLM agent 能力(尤其是 Claude 和 Codex)似乎跨过了某种连贯性阈值,并在软件工程及相关领域引发了一次“相变”。现在,“智能”这部分突然显得明显领先于其他所有东西——工具与知识的集成、组织层面的新工作流与流程、以及更广泛的扩散机制。

2026 将是高能量的一年:整个行业都在消化、吸收这股新能力。

https://x.com/karpathy/status/2004607146781278521

https://x.com/karpathy/status/2015883857489522876

声明:本文为 InfoQ 翻译整理,不代表平台观点,未经许可禁止转载。

会议推荐

InfoQ 2026 全年会议规划已上线!从 AI Infra 到 Agentic AI,从 AI 工程化到产业落地,从技术前沿到行业应用,全面覆盖 AI 与软件开发核心赛道!集结全球技术先锋,拆解真实生产案例、深挖技术与产业落地痛点,探索前沿领域、聚焦产业赋能,获取实战落地方案与前瞻产业洞察,高效实现技术价值转化。把握行业变革关键节点,抢占 2026 智能升级发展先机!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
21岁白血病女生寻亲新进展:已转运至苏州治疗,有人主动认亲核对时间后表示年份不符

21岁白血病女生寻亲新进展:已转运至苏州治疗,有人主动认亲核对时间后表示年份不符

潇湘晨报
2026-01-27 11:47:28
阿姨这身职业装把正式感和时尚感完美拿捏了

阿姨这身职业装把正式感和时尚感完美拿捏了

牛弹琴123456
2026-01-26 11:16:56
两性关系:70岁后想多活20年,牢记这5句话,健康长寿少烦恼

两性关系:70岁后想多活20年,牢记这5句话,健康长寿少烦恼

匹夫来搞笑
2026-01-22 12:05:40
银行最怕的不是你欠钱不还,最怕的是你突然知道这7件事!

银行最怕的不是你欠钱不还,最怕的是你突然知道这7件事!

流苏晚晴
2026-01-22 18:29:58
委内瑞拉再生变!特朗普也没想到,当初留下这条命,会有这么一天

委内瑞拉再生变!特朗普也没想到,当初留下这条命,会有这么一天

透视到底
2026-01-27 16:18:42
00后新晋女神——神村彩月!天赋异禀,未来可期!

00后新晋女神——神村彩月!天赋异禀,未来可期!

碧波万览
2026-01-10 00:24:45
伤肾名列前茅,有些人天天在做!

伤肾名列前茅,有些人天天在做!

掌上肾医
2026-01-27 18:08:43
马筱梅亲妈来北京帮带孩子,马妈妈称:暖气太热,晚上都把暖气关

马筱梅亲妈来北京帮带孩子,马妈妈称:暖气太热,晚上都把暖气关

天启大世界
2026-01-28 03:52:52
神舟二十三号已就位,开始待命,一名乘组将在轨一年:有何任务?

神舟二十三号已就位,开始待命,一名乘组将在轨一年:有何任务?

科学黑洞v
2026-01-27 19:21:06
罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

来科点谱
2026-01-23 11:08:02
中纪委打虎!原副部级包惠落马,去年已卸任

中纪委打虎!原副部级包惠落马,去年已卸任

上观新闻
2026-01-27 19:19:03
贝克汉姆14岁女儿家庭风波中首次发声,大布被曝,只想跟妹妹联系

贝克汉姆14岁女儿家庭风波中首次发声,大布被曝,只想跟妹妹联系

译言
2026-01-25 06:53:17
江苏男篮惊魂夜:新秀逆天改命,老将掉链子险酿败局

江苏男篮惊魂夜:新秀逆天改命,老将掉链子险酿败局

小鬼头体育
2026-01-28 01:29:42
卖掉5年油车换电车,开2年后坦言:这些网上说法都是真的

卖掉5年油车换电车,开2年后坦言:这些网上说法都是真的

复转这些年
2026-01-24 22:57:39
美论坛:为什么中国明知道很容易被摧毁,却还要在南海建造基地?

美论坛:为什么中国明知道很容易被摧毁,却还要在南海建造基地?

墨兰史书
2026-01-28 05:45:03
她爱上郎昆挤走原配,上位仅1个月终身瘫痪,是意外还是报应?

她爱上郎昆挤走原配,上位仅1个月终身瘫痪,是意外还是报应?

璀璨幻行者
2026-01-25 08:00:28
特朗普暴跳如雷!英国专家:一种情况下,美国对中国将发起核打击

特朗普暴跳如雷!英国专家:一种情况下,美国对中国将发起核打击

米师傅安装
2026-01-28 05:03:48
广东民警周福东案引关注 涉非法取证枉法裁判 当事人申诉求公道

广东民警周福东案引关注 涉非法取证枉法裁判 当事人申诉求公道

正义前线
2026-01-27 16:17:33
香港“最乖富二代”邓兆尊,27年不动本金,利息滚到17亿,太清醒

香港“最乖富二代”邓兆尊,27年不动本金,利息滚到17亿,太清醒

娱说瑜悦
2026-01-23 19:23:09
听劝!深圳地铁全网呼唤的“谨防袈裟”回来了!

听劝!深圳地铁全网呼唤的“谨防袈裟”回来了!

南方都市报
2026-01-27 12:32:58
2026-01-28 06:43:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
245文章数 7494关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

美报告称中国是其面对最强大国家

头条要闻

美报告称中国是其面对最强大国家

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

房产
时尚
数码
家居
艺术

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

数码要闻

这事你怎么看 索尼与TCL签署意向备忘录 网友:Sony变Tony了

家居要闻

现代古典 中性又显韵味

艺术要闻

14位西方著名画家的女性肖像画!

无障碍浏览 进入关怀版