AI工程师吵了一整年的MCP和CLI之争,Anthropic用一篇技术文档画上了句号。不是选边站,而是换了个思路——把工具定义从上下文挪到运行时代码里,token消耗直接砍掉98.7%。
这场争论的双方其实都有硬数据。质疑MCP的人算过账:Playwright MCP吃掉13.7K token,Chrome DevTools MCP吃掉18K,5个服务器堆起来,还没开始干活就烧掉55K token(数据来源:@akshay_pachaar)。支持MCP的人反驳得也很实在:CLI在多租户应用里会崩,没有类型契约,agent还得浪费回合去解析陌生API的文本返回。
![]()
但两边都搞错了靶子。问题从来不在协议本身,而在于启动会话时就把所有工具的完整描述塞进模型上下文。一个工作流能膨胀到150K token,其中大部分模型根本用不上。
Anthropic的Code Mode改写了模型的分工。以前模型通过上下文调用工具,现在模型写代码,代码在运行时调用工具。工具住在运行时里,模型只看见它import的东西。
官方示例很说明问题:一份Google Drive的会议记录要同步到Salesforce CRM。老办法是把两个工具的schema都加载进来,整份记录让模型过两遍。新办法是十行TypeScript,需要啥import啥。同样的事,2K token搞定——98.7%的降幅。
Cloudflare把这个思路推到了极致。他们2500个端点的完整API,原本schema要占1.17M token,现在压到1K:只暴露两个函数,search和execute。agent写代码先搜目录,匹配上的再执行。
"MCP已死"是误读。Anthropic的数据显示,MCP SDK下载量在2026年达到3亿次,年初还是1亿(数据来源:@akshay_pachaar)。这是agent基础设施里增长最快的协议。
真正死掉的是"启动时加载所有工具"这种做法——它从来就不是好主意。Code Mode混合了两种原语:Bash留给git、curl这类二进制工具,类型化模块导入留给专有API,类型签名只在agent真的import工具时才加载。MCP的类型契约加上CLI的懒加载,跑在同一个运行时里。
2026年搭agent的规则变了:工具定义属于代码,不属于上下文。模型写几行调用代码,运行时接管剩下的。
两个节点值得盯:Anthropic下一版MCP SDK,可能在2026年Q2,看Code Mode会不会成为默认运行时模式;Cloudflare的API token基准测试,以及其他API提供商会不会跟进search-and-execute模式。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.