Claude Code上线一年,多数人还在用它写单行代码。有个开发者做了件反直觉的事:关掉所有高级功能,裸机测试。
结果Plan Mode(规划模式)的表现,和网上传的完全不一样。
裸机测试:一个极简CLI的诞生
测试者选了Typer框架,目标很简单——做一个带3个命令的Python CLI工具。没有CLAUDE.md文档,没有MCP(模型上下文协议)扩展,没有自定义钩子。
这种"裸奔"配置,恰恰是理解Claude Code出厂能力的唯一方式。
Typer被选中的理由很产品经理:用终端命令造终端工具,有种递归的爽感。测试者原话:「There’s something inherently satisfying about using a terminal-based command to build more terminal tools」——翻译过来就是,用命令行写命令行,套娃快乐。
Plan Mode的隐藏逻辑
裸机状态下,Claude Code的Plan Mode暴露了一个设计细节:它会在执行前生成结构化步骤,而非直接蹦代码。
这和AutoGPT时代的"想一步做一步"有本质区别。Plan Mode先把需求拆成可验证的子任务,每个子任务带明确的完成标准。测试者发现,这种预规划让3命令CLI的代码生成零返工。
零返工的前提是:需求边界足够清晰。
当测试者尝试模糊描述时,Plan Mode会主动追问——不是猜,是确认。这种"保守型交互"在AI工具里很少见,多数产品选择先给答案再让用户擦屁股。
为什么裸机测试有意义
开发者社区有个惯性:拿到新工具先堆配置。CLAUDE.md写500行,MCP接7个服务,钩子调得飞起。
测试者的反套路在于:先测下限,再堆上限。裸机表现决定了工具的容错空间——当网络断了、MCP挂了、文档丢了,Claude Code还能不能干活?
答案是能,但有个条件。Plan Mode依赖的上下文窗口(context window)必须够大,才能把完整规划塞进一次对话。测试者没提具体数字,但暗示了"长规划"和"短执行"的拆分策略。
这种策略的代价是:用户得习惯"先等它想,再看它做"。急性子的人可能会直接切回普通模式。
下一步的悬念
测试者预告了续篇:同一项目,叠满CLAUDE.md + MCP + 自定义技能后的对比。
裸机已经能零返工,加完配置会飞成什么样?或者反过来——当高级功能互相打架时,裸机的稳定性会不会反而更香?
你平时用AI写代码,是先堆配置还是先裸机试错?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.