网易首页 > 网易科技 > 网易科技 > 正文

用户嫌贵但还在用!OpenAI和Anthropic可能找到了AI的付费场景

0
分享至

出品 | 网易智能

作者 | 小爪

编辑 | 王凤枝

很多人都把“小龙虾”忘了。

3月那阵子,它让很多人第一次真切感到:AI不只会聊天,开始会动手了。各种智能体满天飞,所有人都在聊“下一个操作系统级入口”。到了5月,除了少数发烧友,没什么人再打开它了。

于是一个很自然的判断冒出来:智能体也凉了。

但知名技术博主、开源开发者、AI工具评论者西蒙·威利森(Simon Willison)近日撰文OpenAI和Anthropic可能已经找到了PMF》,给了一个相反的答案。

西蒙认为,OpenAI和Anthropic可能已经找到了PMF(product-market fit),让产品真正长在了用户的工作流里。不是因为聊天机器人更会聊天,不是因为演示更能打动人,而是因为Claude Code、OpenAI Codex这类编程智能体,已经让一批用户从“试试看”走到了“天天用、重度用、贵了也要用”。

用的人多了,用量上去了,真正有用的AI甚至开始变贵。小龙虾退烧,只能说明智能体叙事从热闹进入筛选;西蒙这篇文章要讲的,是另一件更硬的事:AI没凉,真正有PMF的智能体,开始进入用户账单、预算和工作流。

西蒙的核心判断

这篇文章的重点,不是“编程智能体很强”,而是OpenAI和Anthropic可能终于找到了真正能变成收入的PMF。西蒙给出的判断标准也不复杂:用户会不会反复回来,产品会不会被塞进工作流,价格变真实以后,用户是转身就走,还是开始讨论怎么继续用。

第一组证据,是使用深度变了。早期AI工具更多是低频试用:问一个问题、生成一段文案、试一段演示,觉得新鲜,但未必第二天还打开。Claude Code、Codex这类工具不一样,它们开始被放进每天的工作流里:读项目、改文件、跑测试、解释报错、继续下一轮修改。用户不是来围观能力,而是在把一部分工作交给它推进。

第二组证据,是账单。西蒙用自己的使用量算了一笔账:他每月付100美元给Anthropic、100美元给OpenAI,一共200美元;但过去30天,如果按API token价格折算,Claude Code大约花掉1199.79美元,OpenAI Codex大约花掉980.37美元,加起来是2180.16美元。也就是说,一个中重度用户在个人订阅里“包住”的真实调用量,已经接近订阅费的11倍。

这个反差很重要。个人订阅用户会觉得自己赚到了,模型公司却会看到另一件事:编程智能体的真实使用量足够大,已经不能再当成赠品了。当智能体真的开始干活,它就不再是一次问答,而是一连串观察、推理、调用工具、修改、报错、再修改的高强度计算。

西蒙还提到,到2026年4月,OpenAI Codex和Anthropic的Claude Code / Cowork,企业使用都更直接地对齐API价格。OpenAI的Codex计价在4月从按消息转向更接近token用量;Anthropic的企业方案也从“企业订阅包含典型工作日用量”的想象,转向“订阅费之外,使用量另按API价格计费”。这意味着企业客户不再只是订阅一个AI软件,而是在为真实推理消耗付钱。

这就是西蒙说OpenAI和Anthropic可能找到PMF的核心证据:编程智能体不只是让人觉得酷,而是开始让用户愿意为真实使用付真钱。真正有PMF的产品,往往不是所有人都立刻欢呼,而是客户在预算会议上讨论怎么管控,而不是直接取消。

为什么偏偏是编程智能体

这听起来像程序员小圈子的故事,其实不是。编程智能体先跑出来,不是因为程序员最爱尝鲜,也不是因为程序员最会写prompt,而是因为代码工作天然给了AI一套验收系统。


代码能不能跑,可以验证;测试过不过,可以验证;diff改了什么,可以检查;git能不能回滚,可以控制;日志、报错、类型检查、CI,都在给智能体提供密集反馈。AI最危险的地方不是不会说话,而是它很会说,但你不知道它到底做对没有。代码世界复杂、抽象、容易出错,却也更容易把错误暴露出来。

这就是编程智能体和很多其他智能体的分水岭。一个会议智能体总结得好不好,常常需要人重新读一遍;一个研究智能体给的资料靠不靠谱,往往还要回源核对;一个销售智能体自动发邮件,出错就是品牌风险;一个金融智能体真能动账户,误操作就可能直接变成损失。越靠近真实业务,越需要权限、审批、审计、回滚和责任边界。

编程智能体当然也会犯错,但它们所在的流程更容易把风险关在一个可检查的范围里。一个智能体改代码,你可以看diff、跑测试、让它重试,再决定要不要合并。换句话说,代码不是AI最简单的应用场景,却可能是最早形成可靠反馈闭环的复杂场景。

不过这也带来一个反向门槛:编程智能体用得越重,对人的代码质量、架构理解和review能力要求越高。AI帮你写出代码,不等于你就能长期维护它;它把构建门槛降下来了,也把验收和维护的责任更清楚地推到人面前。

真正的门槛不是会不会写prompt,而是能不能给AI建验收标准。西蒙那篇文章里的PMF判断,背后其实就是这个逻辑。

智能体开始被筛选

过去一年,智能体这个词被用得太满了。什么都可以叫智能体:销售智能体、客服智能体、会议智能体、招聘智能体、财务智能体、个人助理智能体。很多产品第一次演示时确实有冲击力,模型会自己分步骤,会调用工具,会从一个网页跳到另一个网页,像是真的开始替人做事。

演示不是PMF。让AI自动跑十步,和让它每天稳定完成一项真实工作,中间隔着上下文、权限、成本、安全、审计和失败兜底。用户第一次看到它能动手,会兴奋;第三次发现它会乱点、乱填、乱花token,就会开始问:它到底能接什么系统?谁批准它行动?它错了谁负责?我能不能回滚?

这不是说泛智能体都没前途。西蒙的写法其实更克制:目前最清楚看到PMF的,是编程智能体。其他智能体方向当然也可能成立,只是它们还需要证明自己能从“能演示”走到“能日常使用”。

会聊天的智能体不稀缺。会点按钮的智能体也不一定稀缺。真正稀缺的是能稳定完成高频任务、能被验证、能被纳入真实流程、出错后能缩小事故半径、变贵后用户还愿意继续用的智能体。

西蒙文中提到的Microsoft和Uber案例,也可以放在这个角度看。企业预算被Claude Code之类工具提前消耗完,表面上看像坏消息;但从产品角度看,它也说明使用需求比原先预算假设强得多。预算疼,不等于产品没有价值,很多时候说明产品已经从“可有可无的新玩具”变成了“财务部门必须重新核算的生产力工具”。

这也是PMF的另一种样子。不是媒体继续兴奋,不是用户继续晒图,而是采购、财务和技术团队开始认真讨论:怎么限制用量,怎么分配预算,怎么把它放进正式流程。

这和普通人有什么关系

对普通人来说,氛围编程(vibe coding)的价值在于,很多想法第一次可以低成本落地。一个网页、一个内部工具、一个自动化表格、一个报名系统,以前可能需要找开发、写需求、排期、外包,现在可以先做出一个粗版本,拿给真实用户或同事看。

不过真正重要的不是“人人都能写代码”,而是“人人都要学会验收AI做出来的东西”。AI可以降低构建门槛,但不能替你承担维护责任。一个原型能跑,和一个产品能长期被使用,是两回事。

这也正好回到西蒙的判断:编程智能体先接近PMF,不是因为它们会写代码,而是因为代码世界有一套更清楚的验收机制。普通人能从这件事里学到的,也不是写prompt的技巧,而是怎样把一个任务变成可执行、可检查、可修正的流程。

筛选开始了

智能体没凉,因为账单开始说话了。西蒙文章最有意思的地方在于,它没有继续追问“模型又强了多少”,而是把问题换成了:谁已经找到了用户愿意长期使用、并且持续付费的场景。Claude Code、Claude Cowork、Codex这些编程智能体,是目前最清楚的样本。

他顺手算了另一笔账:这些公司不仅在收钱,推理调用越频繁,算力成本越高。智能体从回答一句话变成连续执行任务,最后会同时变成供应商的收入、客户的账单和云算力的压力。

小龙虾热潮的降温,也不是坏事。它让讨论从“什么都能智能体化”回到更朴素的产品问题:有没有真实痛点,有没有日常使用,有没有验收闭环,有没有价格承受力。

如果答案是yes的,会从玩具变成工具,从工具变成工作流,从工作流变成预算项;如果答案暂时还不清楚的,就需要继续等待真实使用来验证。

所以,不要问AI是不是凉了。

要问:哪些AI已经开始让人愿意付真实账单,哪些智能体还只是让人看了一眼热闹。

前者才是PMF。

后者还在接受筛选。

延伸阅读
相关推荐
热点推荐
托波利亚承认,战争期间她不会带着三个孩子离开乌克兰。

托波利亚承认,战争期间她不会带着三个孩子离开乌克兰。

魅力乌克兰
2026-05-29 01:52:16
毛主席对基辛格说:我不相信台湾问题能和平过渡,愿意等100年

毛主席对基辛格说:我不相信台湾问题能和平过渡,愿意等100年

文史季季红
2026-05-28 07:25:03
小沈阳被曝紧急送医,知情人透露:已是第2次陷入昏迷

小沈阳被曝紧急送医,知情人透露:已是第2次陷入昏迷

犀利强哥
2026-05-28 22:50:39
拿百万年薪,手握3个CBA总冠军,现宣布订婚,未婚妻没他肩膀高

拿百万年薪,手握3个CBA总冠军,现宣布订婚,未婚妻没他肩膀高

不似少年游
2026-05-26 14:36:13
重磅:瑞典即将交付乌克兰鹰狮战斗机!正式迈入四代机时代

重磅:瑞典即将交付乌克兰鹰狮战斗机!正式迈入四代机时代

项鹏飞
2026-05-28 18:13:51
董璇自曝与张维伊结婚一年,大部分的时间都在谈恋爱,是先婚后恋

董璇自曝与张维伊结婚一年,大部分的时间都在谈恋爱,是先婚后恋

韩小娱
2026-05-26 08:06:47
没想到,武契奇访华仅4天,45岁妻子仅凭一个举动就给他长脸了

没想到,武契奇访华仅4天,45岁妻子仅凭一个举动就给他长脸了

聊历史的阿稼
2026-05-29 00:25:56
华为余承东:特斯拉要接近人眼,我们要超越人眼

华为余承东:特斯拉要接近人眼,我们要超越人眼

热点科技
2026-05-27 18:38:10
Model Y成本降28%,价格战反伤毛利,特斯拉卷不动了?

Model Y成本降28%,价格战反伤毛利,特斯拉卷不动了?

阿芒娱乐说
2026-05-27 15:27:51
上海91:88绝杀广厦!杨鸣赛后点评,四句话精准点透比赛本质!

上海91:88绝杀广厦!杨鸣赛后点评,四句话精准点透比赛本质!

田先生篮球
2026-05-28 23:29:33
最爱孩子的一代人 养出了最不爱父母的一代!网友:说出了养娃心声

最爱孩子的一代人 养出了最不爱父母的一代!网友:说出了养娃心声

夜深爱杂谈
2026-05-26 21:49:31
阿里京东美团被传抢朴朴,大厂还是放不下「买菜生意」?

阿里京东美团被传抢朴朴,大厂还是放不下「买菜生意」?

钛媒体APP
2026-05-28 18:26:19
20多年前陈红在陈凯歌家拍照,她躺在沙发上的样子,堪称人间尤物!

20多年前陈红在陈凯歌家拍照,她躺在沙发上的样子,堪称人间尤物!

感觉会火
2026-04-28 21:18:46
iPhone16 Pro开始清仓了,618再降1101元,苹果A18 Pro+钛金属

iPhone16 Pro开始清仓了,618再降1101元,苹果A18 Pro+钛金属

科技阿维
2026-05-28 22:11:49
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
西方正制造一个可怕的共识:对华战争,可无视道德底线和伦理原则

西方正制造一个可怕的共识:对华战争,可无视道德底线和伦理原则

小噎论事
2026-04-04 07:22:13
沉默96小时后,国台办严肃定性,郑丽文紧急踩刹车:不会引战两岸

沉默96小时后,国台办严肃定性,郑丽文紧急踩刹车:不会引战两岸

时尚的弄潮
2026-05-29 00:29:27
美股股指期货全线下挫,芯片股盘前普跌,一软件股盘前大涨36%,美国将公布重磅数据

美股股指期货全线下挫,芯片股盘前普跌,一软件股盘前大涨36%,美国将公布重磅数据

21世纪经济报道
2026-05-28 19:34:29
我50岁才懂:给孩子找对象,穷人看彩礼,中产看学历,体制内只看这两点

我50岁才懂:给孩子找对象,穷人看彩礼,中产看学历,体制内只看这两点

心理观察局
2026-05-20 07:19:06
果然被我猜中了,高市早苗真要辞职了!

果然被我猜中了,高市早苗真要辞职了!

阿七说史
2026-05-27 15:48:46
2026-05-29 05:12:49

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

教育
房产
数码
公开课
军事航空

教育要闻

中考数学:很多同学表示无解题,思维太局限

房产要闻

突发重磅!三亚新机场公司正式成立!

数码要闻

宏碁推出Predator Atlas 8掌机:8" FHD+ 120Hz 500nits触屏

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美锁定伊朗打击新目标 考虑重启军事行动

无障碍浏览 进入关怀版
×