Claude Code创始人摊牌：写代码被AI干掉了，但有三件事它干不了|翻译|编程|code|token|agent

Claude Code创始人摊牌：写代码被AI干掉了，但有三件事它干不了

分享至

一年没写一行代码，这个男人的工作方式让整个程序员圈子慌了

Claude Code创建者Boris Cherny摊牌了：2026年到现在，没手写过一行代码。上一次敲代码是2025年11月。

日常每天合并几十个PR，最高纪录一天150个。全是AI干的。他同时跑着多个Claude Code session，每个session并行多个agent，每晚几千个sub-agent在后台执行任务。

这话一出，开发者圈子炸了。

但别急着慌。我翻遍了SWE-bench、Terminal-Bench、SWE-rebench的评测数据，结论是：写代码确实快被AI干掉了，但编程没有。你的工作安不安全，取决于你到底属于"写代码的人"还是"解决问题的人"。

五个主流工具，一张图说清楚

来源：Unsplash，免费商用，无需署名。

先看数据。不同基准测的是不同能力，分数不能跨着比。

模型

SWE-bench Verified

SWE-bench Pro

Terminal-Bench 2.0

GPT-5.5

82.6%

58.6%

82.7%

Claude Opus 4.7

82.0%

64.3%

69.4%

DeepSeek V4 Pro

77.4%

55.7%

规律很明确：简单任务GPT-5.5略强，复杂跨文件任务Claude更强，终端操作GPT-5.5碾压。没有一个模型全面领先。

Claude Code：工程代码和系统理解最均衡。扔十万行代码库进去，能搞清楚模块关系、数据流向、改了哪里会炸。但会翻车——幻觉API、编造不存在的库函数，Reddit上一堆案例。价格不便宜，输出端每百万token收25美元。

GPT-5.5 / Codex：终端操作碾压级领先。Terminal-Bench上82.7%，甩开Claude整整13个百分点。还有个Pro版，输出端每百万token收180美元，是Claude的7.2倍，只适合架构决策和复杂bug修复，日常CRUD别碰。

DeepSeek V4 Pro：性价比之王。75%折扣永久化后，输出端每百万token只要0.87美元，不到Claude的三十分之一。竞赛编程领先Claude，Codeforces约3200分。短板是系统级理解不行，跨模块重构容易出错。

Cursor：编辑器体验最好。但核心能力依赖第三方模型。最大变量是SpaceX——签了600亿美元收购选择权，计划IPO后30天内完成收购。收购完成后接入Colossus超算集群，但接入超算不等于模型变强。

GitHub Copilot：生态最大。2025年9月Coding Agent正式GA，能做自主规划、修改文件、执行终端命令。但Agent化起步比Claude Code晚，还在追。

别只看单价，算每任务实际成本

来源：Unsplash，免费商用，无需署名。

输出端标价：Claude 25美元，GPT-5.5 30美元，GPT-5.5 Pro 180美元，DeepSeek 0.87美元。

但实际成本不是这么算的。

Claude换了新tokenizer，技术文档场景实测token消耗增加45%-47%。GPT-5.5虽然单价贵，但token消耗比Claude少72%，每任务实际成本可能更低。DeepSeek开Think Max模式后token烧得飞快，跑一次Coding Index消耗约1.9亿output tokens，中位数才4700万。

别跟风选工具。算清楚你的场景分布——架构级任务、日常CRUD、终端密集型各占多少——再匹配工具。中小企业从两个工具起步，跑通再扩展。调试时间、工具链兼容这些隐性成本都得算进去。

五类开发者，五种活法

来源：Unsplash，免费商用，无需署名。

初级开发者：AI能干掉你80%的工作。接需求、写代码、提PR，AI比你快比你规范还不出错。出路只有一条——别练怎么写，练怎么判断。AI写的代码在复杂业务逻辑、边界条件、安全漏洞上照样翻车，能发现这些问题的人需要的是看懂代码的能力。窗口期在缩短，尽快是真的要快。

中级开发者：你最大的本钱是把模糊需求翻译成AI能听懂的指令。Boris原话："AI能写出任何你想要的代码，但不知道你想要什么。"但这个能力也在被AI侵蚀，委托差距在快速缩小。窗口期内身价翻倍，窗口期过了没往深处走一样危险。三个方向：系统架构设计、AI工作流编排、跨团队技术决策。

高级/架构师：架构决策AI替代不了。微服务还是单体、技术债还不还、第三方要不要自研——这些需要经验、直觉和对业务的理解。新任务是设计AI原生开发流程，Agent分工、审查流程、质量标准、回滚机制，这个活只有你能干。但别拿Boris的案例套自己，他是Claude Code创建者，幸存者偏差拉满。

企业技术负责人：先量化团队任务分布，再匹配工具组合。多工具意味着多套API、多种prompt、多份账单、多个排查路径。比选工具更重要的——选谁能用好工具。人的差距比工具的差距大得多。

独立开发者：决策快、试错成本低，但没人帮你审查AI生成的代码。小项目用DeepSeek快速验证，核心模块用Claude兜底。别在工具选择上花太多时间，你最大的成本是时间。

来源：Unsplash，免费商用，无需署名。

Boris的原话是"coding is largely solved for the code he writes"——写代码这个动作，对他写的代码来说，基本被解决了。

但写代码和编程是两件事。

写代码是把想法翻译成计算机语言，AI快干完了。编程是定义问题、设计方案、权衡取舍、理解用户——从用户反馈提炼技术需求、在多方案中做数据支撑的选择、识别需求逻辑矛盾、说清楚功能解决谁的什么问题。这四项能力，AI目前一个都做不了。

过去二十年行业把写代码等同于编程，面试考算法、晋升看代码量、绩效评交付速度。这套评价体系正在失效。

管自己叫"写代码的"，出局。管自己叫"解决问题的"，AI是你的杠杆。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.