Anthropic终结MCP之争：98.7%的token是怎么省下来的|调用|代码|上下文|mcp|自然语言|agent

Anthropic终结MCP之争：98.7%的token是怎么省下来的

2026-05-11 01:52:17　来源: 野生运营

北京举报

分享至

AI工程师吵了一整年的MCP和CLI之争，Anthropic用一篇技术文档画上了句号。不是选边站，而是换了个思路——把工具定义从上下文挪到运行时代码里，token消耗直接砍掉98.7%。

这场争论的双方其实都有硬数据。质疑MCP的人算过账：Playwright MCP吃掉13.7K token，Chrome DevTools MCP吃掉18K，5个服务器堆起来，还没开始干活就烧掉55K token（数据来源：@akshay_pachaar）。支持MCP的人反驳得也很实在：CLI在多租户应用里会崩，没有类型契约，agent还得浪费回合去解析陌生API的文本返回。

但两边都搞错了靶子。问题从来不在协议本身，而在于启动会话时就把所有工具的完整描述塞进模型上下文。一个工作流能膨胀到150K token，其中大部分模型根本用不上。

Anthropic的Code Mode改写了模型的分工。以前模型通过上下文调用工具，现在模型写代码，代码在运行时调用工具。工具住在运行时里，模型只看见它import的东西。

官方示例很说明问题：一份Google Drive的会议记录要同步到Salesforce CRM。老办法是把两个工具的schema都加载进来，整份记录让模型过两遍。新办法是十行TypeScript，需要啥import啥。同样的事，2K token搞定——98.7%的降幅。

Cloudflare把这个思路推到了极致。他们2500个端点的完整API，原本schema要占1.17M token，现在压到1K：只暴露两个函数，search和execute。agent写代码先搜目录，匹配上的再执行。

"MCP已死"是误读。Anthropic的数据显示，MCP SDK下载量在2026年达到3亿次，年初还是1亿（数据来源：@akshay_pachaar）。这是agent基础设施里增长最快的协议。

真正死掉的是"启动时加载所有工具"这种做法——它从来就不是好主意。Code Mode混合了两种原语：Bash留给git、curl这类二进制工具，类型化模块导入留给专有API，类型签名只在agent真的import工具时才加载。MCP的类型契约加上CLI的懒加载，跑在同一个运行时里。

2026年搭agent的规则变了：工具定义属于代码，不属于上下文。模型写几行调用代码，运行时接管剩下的。

两个节点值得盯：Anthropic下一版MCP SDK，可能在2026年Q2，看Code Mode会不会成为默认运行时模式；Cloudflare的API token基准测试，以及其他API提供商会不会跟进search-and-execute模式。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.