一年没写一行代码,这个男人的工作方式让整个程序员圈子慌了
Claude Code创建者Boris Cherny摊牌了:2026年到现在,没手写过一行代码。上一次敲代码是2025年11月。
日常每天合并几十个PR,最高纪录一天150个。全是AI干的。他同时跑着多个Claude Code session,每个session并行多个agent,每晚几千个sub-agent在后台执行任务。
这话一出,开发者圈子炸了。
但别急着慌。我翻遍了SWE-bench、Terminal-Bench、SWE-rebench的评测数据,结论是:写代码确实快被AI干掉了,但编程没有。你的工作安不安全,取决于你到底属于"写代码的人"还是"解决问题的人"。
五个主流工具,一张图说清楚
![]()
来源:Unsplash,免费商用,无需署名。
先看数据。不同基准测的是不同能力,分数不能跨着比。
模型
SWE-bench Verified
SWE-bench Pro
Terminal-Bench 2.0
GPT-5.5
82.6%
58.6%
82.7%
Claude Opus 4.7
82.0%
64.3%
69.4%
DeepSeek V4 Pro
77.4%
55.7%
规律很明确:简单任务GPT-5.5略强,复杂跨文件任务Claude更强,终端操作GPT-5.5碾压。没有一个模型全面领先。
Claude Code:工程代码和系统理解最均衡。扔十万行代码库进去,能搞清楚模块关系、数据流向、改了哪里会炸。但会翻车——幻觉API、编造不存在的库函数,Reddit上一堆案例。价格不便宜,输出端每百万token收25美元。
GPT-5.5 / Codex:终端操作碾压级领先。Terminal-Bench上82.7%,甩开Claude整整13个百分点。还有个Pro版,输出端每百万token收180美元,是Claude的7.2倍,只适合架构决策和复杂bug修复,日常CRUD别碰。
DeepSeek V4 Pro:性价比之王。75%折扣永久化后,输出端每百万token只要0.87美元,不到Claude的三十分之一。竞赛编程领先Claude,Codeforces约3200分。短板是系统级理解不行,跨模块重构容易出错。
Cursor:编辑器体验最好。但核心能力依赖第三方模型。最大变量是SpaceX——签了600亿美元收购选择权,计划IPO后30天内完成收购。收购完成后接入Colossus超算集群,但接入超算不等于模型变强。
GitHub Copilot:生态最大。2025年9月Coding Agent正式GA,能做自主规划、修改文件、执行终端命令。但Agent化起步比Claude Code晚,还在追。
别只看单价,算每任务实际成本
![]()
来源:Unsplash,免费商用,无需署名。
输出端标价:Claude 25美元,GPT-5.5 30美元,GPT-5.5 Pro 180美元,DeepSeek 0.87美元。
但实际成本不是这么算的。
Claude换了新tokenizer,技术文档场景实测token消耗增加45%-47%。GPT-5.5虽然单价贵,但token消耗比Claude少72%,每任务实际成本可能更低。DeepSeek开Think Max模式后token烧得飞快,跑一次Coding Index消耗约1.9亿output tokens,中位数才4700万。
别跟风选工具。算清楚你的场景分布——架构级任务、日常CRUD、终端密集型各占多少——再匹配工具。中小企业从两个工具起步,跑通再扩展。调试时间、工具链兼容这些隐性成本都得算进去。
五类开发者,五种活法
![]()
来源:Unsplash,免费商用,无需署名。
初级开发者:AI能干掉你80%的工作。接需求、写代码、提PR,AI比你快比你规范还不出错。出路只有一条——别练怎么写,练怎么判断。AI写的代码在复杂业务逻辑、边界条件、安全漏洞上照样翻车,能发现这些问题的人需要的是看懂代码的能力。窗口期在缩短,尽快是真的要快。
中级开发者:你最大的本钱是把模糊需求翻译成AI能听懂的指令。Boris原话:"AI能写出任何你想要的代码,但不知道你想要什么。"但这个能力也在被AI侵蚀,委托差距在快速缩小。窗口期内身价翻倍,窗口期过了没往深处走一样危险。三个方向:系统架构设计、AI工作流编排、跨团队技术决策。
高级/架构师:架构决策AI替代不了。微服务还是单体、技术债还不还、第三方要不要自研——这些需要经验、直觉和对业务的理解。新任务是设计AI原生开发流程,Agent分工、审查流程、质量标准、回滚机制,这个活只有你能干。但别拿Boris的案例套自己,他是Claude Code创建者,幸存者偏差拉满。
企业技术负责人:先量化团队任务分布,再匹配工具组合。多工具意味着多套API、多种prompt、多份账单、多个排查路径。比选工具更重要的——选谁能用好工具。人的差距比工具的差距大得多。
独立开发者:决策快、试错成本低,但没人帮你审查AI生成的代码。小项目用DeepSeek快速验证,核心模块用Claude兜底。别在工具选择上花太多时间,你最大的成本是时间。
![]()
来源:Unsplash,免费商用,无需署名。
Boris的原话是"coding is largely solved for the code he writes"——写代码这个动作,对他写的代码来说,基本被解决了。
但写代码和编程是两件事。
写代码是把想法翻译成计算机语言,AI快干完了。编程是定义问题、设计方案、权衡取舍、理解用户——从用户反馈提炼技术需求、在多方案中做数据支撑的选择、识别需求逻辑矛盾、说清楚功能解决谁的什么问题。这四项能力,AI目前一个都做不了。
过去二十年行业把写代码等同于编程,面试考算法、晋升看代码量、绩效评交付速度。这套评价体系正在失效。
管自己叫"写代码的",出局。管自己叫"解决问题的",AI是你的杠杆。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.