AI编程圈有个固定仪式:启动Claude Code,创建CLAUDE.md,开始罗列——用什么框架、代码怎么组织、回复什么语气。听说给模型更多上下文效果更好,于是越写越长。
这套流程看起来很专业,初期似乎也有用。但真相是:它很可能让你的AI助手越来越蠢,而且绝对在浪费你的钱。
![]()
没人告诉你的Token账
CLAUDE.md的完整内容会在每一次对话轮次开头注入上下文窗口。不是一次,是每一轮。1000行文件约7000-10000个token。一个20-30轮的长会话下来,你烧掉大量上下文额度,重复投喂AI已经知道的指令。
关键就在这里:AI已经知道的指令。
你在CLAUDE.md里写"This project uses React",但模型看一眼package.json就能推断。你写"use TypeScript",可项目里全是.ts文件。模型能读代码库,它在上下文里。
95%的场景根本不需要CLAUDE.md。例外只有真正专有的信息:公司内部方法论、无法从代码推导的特定领域规范——这是5%的情况。
其余一切,有更好的替代方案:skills(技能文件)。
技能文件与渐进式披露
技能文件表面和CLAUDE.md很像:markdown格式,有名称、描述、详细指令体。区别在于加载方式。
CLAUDE.md全量常驻;技能文件只注入名称和描述,主体留在磁盘,等AI判断需要时才读取。
结果:不是每轮烧7000 token,而是50 token——两句话告诉AI"这个技能存在,大概用途是什么"。任务匹配描述时,AI才读取剩余内容。否则,不读。
这叫渐进式披露。AI按需取用,而非全程负重。
实际示例:
# Sponsor Research Skill
**Description**: Use when evaluating a new sponsor email. Researches the company across multiple signals and classifies the opportunity.
## Research Steps
1. Search for the company on LinkedIn, Crunchbase, Twitter/X, and YouTube
2. Check Trustpilot for reviews (if fewer than 50 reviews or rating below 3.5, flag as risk)
3. Verify any funding claims on Crunchbase
4. If two or more signals are missing or below threshold...
描述常驻上下文,四步详细指令只在处理赞助邮件时触发。长会话省下的token,够多塞几轮代码审查或调试对话。
核心逻辑
CLAUDE.md的问题是过度供给:把可能用得上的信息全塞给AI,假设它随时需要。技能文件的逻辑是延迟加载:让AI自己判断什么时候需要深度信息。
这和软件架构里的懒加载一个思路。区别在于,这里的"性能优化"直接换算成API账单和上下文窗口利用率。
如果你现在的CLAUDE.md超过500行,建议审计一遍:哪些信息AI从代码库推断不出?那些才值得保留。其余拆成技能文件,让AI自己决定什么时候读。
省下的不只是token。上下文窗口干净了,AI的注意力也更聚焦在当下的任务,而不是被二十条历史指令分散。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.