AI调用量竞赛消停：烧钱难见回报|度量|智能体|工程师|麦克唐纳|token|ai调用量

AI调用量竞赛消停：烧钱难见回报

2026-05-29 05:10:43　来源: 灰度测试中

北京举报

分享至

“今年我们在Anthropic上的账单将接近3亿美元，我多希望有一个智能路由，能判断哪些查询真需动用最强大也最贵的模型，哪些用更小、够用又便宜的模型就行。”几周前还在鼓励工程师比拼Token用量的多家企业，如今纷纷踩下了刹车。

这股被称作“Tokenmaxxing”的风潮，逻辑十分直白：想找出哪些员工在部署AI智能体时最具创新力，就看他们消耗了多少Token。Token是AI模型处理文本的基本单位，大约相当于1.5个英文单词，用得越多，意味着这名员工的AI智能体越活跃、越愿意尝试新事物。亚马逊、Meta、OpenAI等公司甚至设立了正式的或非正式的使用量排行榜，让工程师们你追我赶。

然而古德哈特定律再次应验——当一个指标本身变成了目标，它就不再是好的度量。英国《金融时报》报道，亚马逊部分员工为了让自己的Token用量数据更好看，驱动AI智能体去运行完全无意义或不必要的任务，因为经理们已开始依据这些数据评估绩效。与此同时，高昂的账单也让不少公司大吃一惊。

态度的逆转来得很快。据The Verge报道，微软已在几个核心产品部门取消了Claude Code订阅；Meta撤下了员工自发建立的Tokenmaxxing排行榜；Uber则在今年前四个月就把整个2026年度的“Token预算”全部花光，部分原因就是Claude Code的高频次使用。对成本更敏感的团队，开始限制哪些员工可以使用第三方AI智能体，至少是那些将性能最强模型作为“大脑”的智能体。

更让高管们焦虑的是，汹涌的Token支出并未转化为公司级的投资回报。Uber首席运营官安德鲁·麦克唐纳在上周的一档播客中坦言，公司一直在努力，却很难把部分员工的生产力提升，与公司整体的实际商业影响直接挂钩。“如果你不能画出一条清晰的线，把有用的功能……”尽管他的完整表述未能全部披露，但这一困境已跃然纸上。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.