网易首页 > 网易号 > 正文 申请入驻

罗福莉:各位醒醒吧,该结束token虚假狂欢了

0
分享至


作者 | 董道力
邮箱 | dongdaoli@pingwest.com

这两天,所谓“Anthropic封禁OpenClaw”的报道铺天盖地,但事实上Anthropic 是停止了OpenClaw这种第三方产品直接通过Claude Pro等固定付费的订阅方式来调用能力的路径。

你真的想用Anthropic 的模型和产品,要么通过官方来使用这种订阅模式,要么可以使用按量充费的API额度,封禁是没有封禁,只是限制了调用和对应的“收费”方式。

相比于错误理解成“封禁”并第一时间联想到“过河拆桥”的一堆讨论,小米 MiMo 大模型负责人罗福莉的一篇长文是少有的对这个事情真正认真分析,并聊到点子上的。

她认为,Anthropic 的动作并不意外,此前我们一直在一场无法持续的虚假token消耗狂欢里,现在该醒醒了。


1

订阅制不适合第三方 Agent

罗福莉首先对 Claude Code 的订阅设计给出正面评价,认为这是业内少有的、认真对待算力分配问题的产品设计。其逻辑是:轻度用户用的少,补贴重度用户,总体均衡。

但她随即指出,这套逻辑有一个隐藏前提:用户用的必须是 Anthropic 自己的框架。一旦脱离 Claude Code,就会出问题。

她以 OpenClaw 作为案例,指出第三方 harness 同时破坏了两个层面的均衡。

第一层是请求次数。她在推文中写道:"我没办法严格计算第三方 harness 接入造成的损失,但我近距离看过 OpenClaw 的上下文管理,很糟糕。在单次用户查询里,它会触发多轮低价值工具调用,每轮作为独立 API 请求发出,每个请求携带的上下文窗口往往超过 100K tokens。实际请求次数是 Claude Code 原生框架的数倍。折算成 API 定价,真实成本大概是订阅价格的数十倍。"

简单说,同一件事,OpenClaw 要跑十趟,原生框架跑一趟。


第二个层面是缓存效率。她在评论区补充道:"更大的问题是,很多第三方 harness 在接近上下文长度限制时,每隔几步就压缩一次工具返回结果,导致 cache 命中率极低。"

Claude 的缓存机制依赖上下文前缀的一致性,前缀匹配,才能复用缓存、跳过重复计算。但每次压缩都会改写上下文内容,导致前缀失配,缓存作废,模型被迫重新全量读入。

两个问题叠在一起,把每一次查询的实际 token 消耗都推向极值。

OpenClaw 的用户几乎清一色是重度用户,而即便是轻度用户,通过 OpenClaw 发出的每一次请求,在成本结构上也等同于重度用户。

订阅制赖以成立的分布假设就此坍塌,补贴关系不复存在,Anthropic 单方面承担成本缺口。

就像健身房办卡,就是赌一些用户办了卡但不来,从而补贴天天去健身房用户的成本,而 OpenClaw 让每个用户 7x24 小时的都去高强度训练,健身房成本就下不来了。

1

短期阵痛,长期改善工程纪律

而对于用户的愤怒,罗福莉认为这个短痛是有用的。

她写道:"第三方 harness 还是可以调用 Claude,只是不能再搭订阅的便车了。短期内,这批用户会感受到成本冲击,轻松跳升数十倍。但这个压力,恰恰会推动这些 harness 去改进上下文管理、最大化 prompt cache 命中率、减少无效 token 消耗。痛苦最终会转化为工程纪律。"

订阅制的问题在于,它让 harness 开发者从来不需要为单次请求的 token 消耗负责。上下文管理差不要紧,cache 命中率低不要紧,反正成本由 Anthropic 的服务器悄悄吸收。

但一旦回到 API 计费,这个结构就变了。token 浪费会直接体现在账单上,"优化效率"从可做可不做,变成了有商业压力驱动的工程需求。

每个开发者单独决策时都倾向于多用,整体生态的调用质量因此持续恶化。计费结构的改变,是把外部性内部化的强制手段。


1

Tokens 价格战只会导致恶性循环

相比于感慨Anthropic 过河拆桥,抄袭OpenClaw后要用自己第一方工具收割用户的讨论,罗福莉提出了一个更加有点“皇帝新衣”味道的提醒:

今天单纯为了token消耗而狂欢,以及模型厂商们由此出发打的各种价格战,将难以为继。是时候醒醒了。

她写道:"我劝 LLM 公司不要在还没搞清楚 coding plan 怎么定价之前,就跟着降价内卷。低价卖 token、同时向第三方全面开放,对用户看起来很友好,但那是一个陷阱。Anthropic 刚从这个陷阱里走出来。如果用户在劣质 harness、不稳定推理服务、降配模型上反复碰壁,最终什么都没做成,用户体验和留存都不会好看。"

这个陷阱的机制是:大模型公司推出 coding plan 向第三方 harness 开放,和 Claude 一样会入不敷出。为了控制成本,平台只能降低算力或换用更便宜的低智模型。用户表面上有充足的额度,但什么都做不好,留存自然也不用说。

问题的根源在于计费结构。Coding Plan 本质上是按订阅周期加请求次数的粗放额度包,开发者买的是一段时间内的粗略使用权,感受不到单次请求的真实成本。

当第三方 harness 接入时,上下文管理粗放、冗余请求、低 cache 命中率造成的算力浪费,成本完全由平台默默吸收。

订阅制切断了用量与成本之间的信号传导,重度用户通过低效 harness 透支的算力,最终迫使平台要么封禁第三方,要么靠降速、限流、降配模型来止损,这正是 Anthropic 走到今天这一步的路径。


当然,罗福莉的另一个目的也是为她在小米做的尝试和方案“做广告”。

MiMo 的 Token Plan 走的是另一条路。MiMo 没有封掉第三方入口,而是改变了计费结构:按实际 token 消耗量配额,开发者购买以 Credit 为单位的 token 额度。

无论使用原生框架还是 OpenClaw 等第三方 harness,每一个浪费的 token 都直接从用户的额度包里扣。平台不再为低效 harness 买单,用得多付得多,用得糙成本高,"用量-成本"的关系重新透明起来。

她将这套逻辑定位为:不是不让用,而是让计费结构本身成为约束机制,推动生态向高效率方向演化。

低价订阅的问题不在于便宜本身,而在于它切断了信号传导。在定价逻辑没想清楚之前跟进,复制的可能不是 Anthropic 的优势,而是它刚刚踩过的坑。

1

竞争正式进入下一个阶段

罗福莉在推文最后把视野拉到了更大的框架上。

她写道:"全球算力的供给速度,已经追不上 Agent 场景下 token 消耗的增速。真正的出路不是更便宜的 token,而是协同进化,更高 token 效率的 agent harness,乘以更强大、更高效的模型。Anthropic 这次,不管主观意图是什么,客观上把整个生态,无论开源还是闭源,都推向了这个方向。Agent 时代不属于烧算力最多的人,而属于用算力最聪明的人。"


罗福莉在推文最后正是在挑战过去几年 AI 行业信奉的"算力竞赛"叙事。

主流逻辑一直是:算力更多,模型更强,成本更低,用户更多,形成正向飞轮。

但 Agent 场景打破了这个等式。当一次用户查询可以触发数十次 API 调用,每次携带超过 100K tokens 的上下文,算力消耗的增速就不再是线性的。单纯压低 token 价格,只会加速这个消耗,而不会改变其结构。

这意味着,下一轮竞争的核心指标,可能不再是"每 token 多便宜",而是"每 token 能完成多少有效工作"。谁先在这个维度上建立优势,谁就能在全球算力供给跟不上 Agent 需求增速的窗口期里,占据真正有利的位置。

Anthropic 这次调整,无论出于什么动机,都在客观上把整个生态推向了这个方向。

快把烧token变成某种爱好和社交展示资本的人们吐槽吐槽Anthropic 就罢了,对于各类Harness产品以及模型厂商们来说,这事真正的信号意义其实很强,如果还是想着趁乱靠免费量大管饱去接住一波流量用户,就太不合时宜了。

一个阶段性的狂欢是时候让位于在工程和基础设施设计上的真正重要的工作了。


点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4998 的 iPhone 16 Pro,终于上架了!

4998 的 iPhone 16 Pro,终于上架了!

花果科技
2026-06-01 20:34:32
宁德时代官宣钠电池将量产,钠电池有何优劣?会取代锂电池吗?

宁德时代官宣钠电池将量产,钠电池有何优劣?会取代锂电池吗?

之乎者也小鱼儿
2026-06-01 16:19:25
1978 年阿尔巴尼亚背弃约定,我国随即叫停全部援助项目

1978 年阿尔巴尼亚背弃约定,我国随即叫停全部援助项目

唠叨说历史
2026-05-28 18:27:31
天涯社区回归上线即被挤崩打不开 前执行总编:打不开也是一种重启成功

天涯社区回归上线即被挤崩打不开 前执行总编:打不开也是一种重启成功

快科技
2026-06-02 08:51:17
带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

奇思妙想草叶君
2026-06-03 02:25:44
2027年,如果房价持续下跌,中国50%的家庭或将面临3个大麻烦

2027年,如果房价持续下跌,中国50%的家庭或将面临3个大麻烦

离离言几许
2026-06-02 18:07:50
今年防汛形势复杂严峻,北京市防汛办发出4条呼吁

今年防汛形势复杂严峻,北京市防汛办发出4条呼吁

澎湃新闻
2026-06-02 17:08:04
廖碧儿现身中山四十七岁状态出众被赞冻龄!过往被称作富二代杀手 择偶偏爱优质对象

廖碧儿现身中山四十七岁状态出众被赞冻龄!过往被称作富二代杀手 择偶偏爱优质对象

TVB资讯台
2026-06-02 23:26:22
女人允许你“看”这里,就是对你动情了,男人千万别错过

女人允许你“看”这里,就是对你动情了,男人千万别错过

那年秋天
2026-05-13 08:26:45
广厦惊险晋级!王博换人赌赢,送水举动引爆全网讨论

广厦惊险晋级!王博换人赌赢,送水举动引爆全网讨论

五姑娘台球
2026-06-02 23:17:50
24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

爱下厨的阿酾
2026-06-02 17:12:48
刘诗诗怎么成这样了?她是怎么做到年纪越大,越讨人嫌的!

刘诗诗怎么成这样了?她是怎么做到年纪越大,越讨人嫌的!

乡野小珥
2026-06-02 01:13:37
千万别修!这5种家电坏了直接扔,维修费太贵,不如买新的划算

千万别修!这5种家电坏了直接扔,维修费太贵,不如买新的划算

家电小超人
2026-06-01 16:05:03
汪小菲彻底变了,偏爱汪宝儿,一双儿女独自在台北,对筱梅是真爱

汪小菲彻底变了,偏爱汪宝儿,一双儿女独自在台北,对筱梅是真爱

乐天闲聊
2026-06-03 01:21:28
日本菲律宾妄图划分台专属海域,大陆发声后,国民党反应亮了

日本菲律宾妄图划分台专属海域,大陆发声后,国民党反应亮了

DS北风
2026-06-02 11:26:10
97年东莞,表哥离世后,出住屋里的表嫂,竟然成了我人生导师

97年东莞,表哥离世后,出住屋里的表嫂,竟然成了我人生导师

雾岛夜话
2025-05-22 18:24:52
一号难求、诊室空荡!警方捣毁百万挂号黑产

一号难求、诊室空荡!警方捣毁百万挂号黑产

看看新闻Knews
2026-06-02 17:50:30
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

三农老历
2026-04-13 17:10:06
俄乌血腥博弈,俄军在东线打出古罗马经典战术,俄乌战争大局已定

俄乌血腥博弈,俄军在东线打出古罗马经典战术,俄乌战争大局已定

干史人
2025-04-04 10:30:11
四川资中一小区6户业主玻璃窗被弹珠击穿 警方回应:初步判断有人用弹弓打鸟 | 云求助

四川资中一小区6户业主玻璃窗被弹珠击穿 警方回应:初步判断有人用弹弓打鸟 | 云求助

封面新闻
2026-06-02 21:10:06
2026-06-03 06:03:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
3128文章数 10504关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
家居
房产
公开课
军事航空

艺术要闻

二十年前割麦的场景

家居要闻

流线型轮廓 包容多元身形

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版