“今年我们在Anthropic上的账单将接近3亿美元,我多希望有一个智能路由,能判断哪些查询真需动用最强大也最贵的模型,哪些用更小、够用又便宜的模型就行。”几周前还在鼓励工程师比拼Token用量的多家企业,如今纷纷踩下了刹车。
这股被称作“Tokenmaxxing”的风潮,逻辑十分直白:想找出哪些员工在部署AI智能体时最具创新力,就看他们消耗了多少Token。Token是AI模型处理文本的基本单位,大约相当于1.5个英文单词,用得越多,意味着这名员工的AI智能体越活跃、越愿意尝试新事物。亚马逊、Meta、OpenAI等公司甚至设立了正式的或非正式的使用量排行榜,让工程师们你追我赶。
![]()
然而古德哈特定律再次应验——当一个指标本身变成了目标,它就不再是好的度量。英国《金融时报》报道,亚马逊部分员工为了让自己的Token用量数据更好看,驱动AI智能体去运行完全无意义或不必要的任务,因为经理们已开始依据这些数据评估绩效。与此同时,高昂的账单也让不少公司大吃一惊。
态度的逆转来得很快。据The Verge报道,微软已在几个核心产品部门取消了Claude Code订阅;Meta撤下了员工自发建立的Tokenmaxxing排行榜;Uber则在今年前四个月就把整个2026年度的“Token预算”全部花光,部分原因就是Claude Code的高频次使用。对成本更敏感的团队,开始限制哪些员工可以使用第三方AI智能体,至少是那些将性能最强模型作为“大脑”的智能体。
更让高管们焦虑的是,汹涌的Token支出并未转化为公司级的投资回报。Uber首席运营官安德鲁·麦克唐纳在上周的一档播客中坦言,公司一直在努力,却很难把部分员工的生产力提升,与公司整体的实际商业影响直接挂钩。“如果你不能画出一条清晰的线,把有用的功能……”尽管他的完整表述未能全部披露,但这一困境已跃然纸上。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.