网易首页 > 网易号 > 正文 申请入驻

70+万一年的AI账单!未来,每位开发者的AI成本或将失控……

0
分享至

【CSDN 编者按】在过去一年,AI 模型的计算能力突飞猛进,但与之伴随的并非成本的持续下降,而是应用层推理开销的急剧上升。曾经以“便宜、无限量”吸引用户的订阅模式,如今正面临限额、降级等现实约束;而重度用户的推理成本甚至有望冲破年均 10 万美元的大关。

原文链接:https://blog.kilocode.ai/p/future-ai-spend-100k-per-dev

作者 | Ewa Szyszka 翻译 | 郑丽媛

出品 | CSDN(ID:C SDNnews)

投稿或寻求报道 | zhanghy@csdn.net

最近,开源 AI 编程工具 Kilo 在 OpenRouter 上首次突破了每月 1 万亿 Tokens 的使用量大关:


同属一个“开源 AI 编码家族”的 Cline、Roo、Kilo,也都在本月迎来了快速增长:


据我分析,促使这种增长的部分原因是:最近 Cursor 和 Claude 陆续对用户收紧了“使用限额”。

(1)今年 6 月,Cursor 宣布对其 Pro 计划取消每月 500 次快速请求限制,改为“无限使用”模式。但事实是:所谓的“无限”仅限于 Auto 模型,其它模型仍按 API 定价,每个月 20 美金的额度,换算下来约 225 个 Sonnet 4 请求、550 个 Gemini 请求或 650 个 GPT 4.1 请求。

(2)今年 7 月,Anthropic 宣布将对 Claude 实施新的每周使用限额。根据官方公告,新的每周使用限额将主要影响 Pro 计划和 Max 计划:

● Pro 套餐(每月 20 美元)每周可用 Claude Sonnet 4 模型约 40–80 小时;

● Max 计划(每月 100 美元)每周可用 Sonnet 4 约 140–280 小时、Opus 4 约 15–35 小时;

● Max 计划(每月 200 美元)每周可用 Sonnet 4 约 240–480 小时、Opus 4 约 24–40 小时。

这波限额把不少用户“赶”进了开源工具阵营,于是就有了本文开头所说的数据陡增——而 Cursor、Claude 之所以要限额,其背后实际是整个行业在 AI Token 经济学(Tokenomics)上的一次错误假设。


行业的“误判”:推理成本会跟着原始成本一起暴跌?

过去一年中,AI 模型的原始推理成本(Raw Inference Cost)确实大幅下降,同比降低了大约 10 倍。这让很多创业公司赌了一把:既然成本下降得这么快,那我现在卖订阅就算亏钱也没关系,明年成本降下来后就能回本甚至大赚。

比如,Cursor 的 Ultra 套餐就是经典案例:

● 每月向用户收 200 美元;

● 实际提供的 Tokens 成本价值约 400 美元;

● 直接以 -100% 的毛利率运营。


Cursor 赌的就是一年后推理成本下降 90%,那么同样的 200 美元订阅就能带来160 美元的毛利润(+80% 毛利率)——结果,这事儿压根没发生,应用层的推理成本(Application Inference Cost)反而还涨了!


为什么应用推理成本会爆炸

应用推理成本增加主要有两个原因:

(1)前沿模型的单个 Token 成本并没有下降;

(2)每个应用的 Token 消耗量暴涨。

前者是因为模型越做越大,并且引入了推理阶段扩展(Test-time Scaling),也叫长思考(Long Thinking)。相比训练阶段的扩展,这种在推理阶段加计算量的方法会直接推高推理成本。比如 OpenAI 的 o1 系列就是“思考型”模型,在处理复杂问题时,长思考推理阶段的计算量可能是传统单次推理的 100 倍以上。


至于后者,则是因为模型支持更长的上下文窗口、更全面的输出建议,这些都让单次调用消耗的 Tokens 大幅增加。

于是,当单个 Token 的价格稳定 + Token 消耗量飙升时,结果就是:过去两年应用层推理成本涨了约 10 倍。因此,市场龙头 Cursor 推出了每月 200 美元的套餐(此前默认是每月 20 美元),Claude Code 等也紧随其后。


每月200美元的封顶套餐导致高强度用户被各种限制

如今,AI 工具的高端订阅价普遍封顶在 200 美元左右,与此同时重度用户发现自己被各种“限制”:请求速率受限、被降级到低版本模型、压缩上下文窗口,还有其他各种限制手段。

如果不想受限,用户就得自己掏钱按量付费——而这完全与开源 AI 编码工具家族(Cline、Roo、Kilo)的原则相反:“绝不限制用户”。由于用户直接承担成本,这些工具反而在降低推理开销方面做了很多优化,例如:

1、将任务拆分为多个可高效执行的小任务;

2、多模式协作(例如 Kilo 中有 Orchestrator、Architect、Code、Debug 模式);

3、架构设计任务用闭源模型(如 Sonnet 4),代码生成用开源模型(如 Qwen3);

4、提交前先用 AI 优化 Prompt;

5、使用记忆库提升上下文利用率;

6、启用 Prompt 缓存;

7、在模型出现幻觉时,支持中途终止任务。

尽管已经在努力降低成本,但对重度用户来说,AI 的使用成本依旧在涨。


发者推理成本或将飙升至每年 10+ 万美元

展望未来,我预计推理成本还会快速上涨,原因有两个:

● 将有更多并行的 AI 代理。例如 Warp 已经向用户开放并行编码代理,未来行业也大概率会将并行代理作为默认功能,这意味着每人每小时的 Token 消耗量将大大增加。

● AI 代理在需要人工反馈前能干更久。因为它们能工作得更多、停顿更少,而这也增加了每人每小时的 Token 消耗量。

这两个趋势一叠加,顶级 AI 用户的推理花费将突破每年 10 万美元(约 72 万人民币)。不过,这个数字放在软件行业也并非闻所未闻——像芯片设计工具 Cadence、Synopsys 的年许可费就有 25 万美元。


别嫌10美元贵,看训练成本就知道什么叫“烧钱”

事实上,推理阶段的花费只是九牛一毛——对大多数工程师来说,推理成本大约只是 AI 训练阶段的千分之一。

上面提到的“AI推理工程师”年薪可能是 10 万美元,推理花费也是 10 万美元,但生产力能比没有 AI 时高很多倍;而顶级的“AI训练工程师”可能一年花1亿美元训练模型,自己也能拿 1 亿美元年薪。

一般来说,前沿实验室在 AI 训练上投入的是数十亿美元级别的算力,而这些预算仅由少数几个人掌控。有传言称,Mark Zuckerberg 为了挖人,给这些顶尖 AI 训练工程师开出过 1 亿美元到 10 亿美元的签约奖金(合同期限未知)。

因此总体而言,AI 推理工程师和 AI 训练工程师之间的薪酬差异,主要在于他们的相对影响力:

● 训练工程师:少数几个人决定并训练的模型,却被数百万用户使用;

● 推理工程师:只是调用并使用这些模型的环节。

2025 全球产品经理大会

8月15–16日·北京威斯汀酒店

互联网大厂&AI创业公司产品人齐聚

12 大专题,趋势洞察 × 实战拆解

扫码领取大会 PPT,抢占 AI 产品新红利

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美媒:歼-36三号原型机首飞

美媒:歼-36三号原型机首飞

武器纵论
2026-01-06 12:54:06
他们官宣分手!恋情曝光仅24小时!

他们官宣分手!恋情曝光仅24小时!

上海约饭局
2026-01-06 16:55:46
杨幂蓝色镂空裙照疯传!雪白肌肤若隐若现,这腰臀比太顶了?

杨幂蓝色镂空裙照疯传!雪白肌肤若隐若现,这腰臀比太顶了?

娱乐领航家
2026-01-04 22:00:03
体检报告中,若这3个指标都正常,基本可排除很多疾病

体检报告中,若这3个指标都正常,基本可排除很多疾病

财经早餐
2025-08-05 06:38:02
1月6日24时油价调整,涨幅大降,油价继续大跌超0.45元/升价格

1月6日24时油价调整,涨幅大降,油价继续大跌超0.45元/升价格

油价早知道
2026-01-06 10:19:46
马杜罗被抓,绝对忠诚等于绝对不忠诚

马杜罗被抓,绝对忠诚等于绝对不忠诚

小院之观
2026-01-04 18:55:42
点球大战王钰栋罚丢了!朱鹏宇向余望太稳了,U23亚洲杯启用VAR

点球大战王钰栋罚丢了!朱鹏宇向余望太稳了,U23亚洲杯启用VAR

刀锋体育
2026-01-06 11:35:39
年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

单手搓核弹
2026-01-06 13:44:21
日本网友:一直以来关系都很好的中国朋友对我说了“小日本”……

日本网友:一直以来关系都很好的中国朋友对我说了“小日本”……

日本物语
2026-01-05 21:11:57
我70岁才明白:孩子不尊重你,无需翻脸,用“乌鸦定律”就行

我70岁才明白:孩子不尊重你,无需翻脸,用“乌鸦定律”就行

兰姐说故事
2026-01-03 17:40:03
国企最大的弊端就是一些溜须拍马的人,在提拔另一些溜须怕马的人

国企最大的弊端就是一些溜须拍马的人,在提拔另一些溜须怕马的人

细说职场
2026-01-05 16:58:04
亚布塞莱:我希望能在NBA打5年,这样我的家人能享受终身医保

亚布塞莱:我希望能在NBA打5年,这样我的家人能享受终身医保

懂球帝
2026-01-06 16:29:06
赵露思不尴尬吗?宝格丽900万珠宝给她戴了,却一身廉价味显难堪

赵露思不尴尬吗?宝格丽900万珠宝给她戴了,却一身廉价味显难堪

嫹笔牂牂
2025-12-23 07:09:08
网传2026微软即将启动新一轮大裁员,最多或裁1.5万人!

网传2026微软即将启动新一轮大裁员,最多或裁1.5万人!

互联网大观
2026-01-05 22:09:04
特斯拉官网明示廉价版 Model Y 即将上市!

特斯拉官网明示廉价版 Model Y 即将上市!

花果科技
2026-01-06 10:53:07
成龙26岁女儿近况曝光!和妻子在香港开工作室,已和成龙关系破冰

成龙26岁女儿近况曝光!和妻子在香港开工作室,已和成龙关系破冰

阿纂看事
2026-01-04 16:50:03
段永平:李东生至今(指2000年)没有向我道歉,企业家要有风度

段永平:李东生至今(指2000年)没有向我道歉,企业家要有风度

讲真
2026-01-05 23:50:45
1月6日俄乌最新:库皮扬斯克光复以来最大的胜利?

1月6日俄乌最新:库皮扬斯克光复以来最大的胜利?

西楼饮月
2026-01-06 16:11:48
医生从濒死患者动脉掏血栓如同掏碎肉,因为严重的肺动脉栓塞,导致血氧极低无法自主呼吸

医生从濒死患者动脉掏血栓如同掏碎肉,因为严重的肺动脉栓塞,导致血氧极低无法自主呼吸

观威海
2026-01-06 10:46:23
好讽刺!司晓迪发照片爆料鹿晗!关晓彤发的帖文锤了就是鹿晗家

好讽刺!司晓迪发照片爆料鹿晗!关晓彤发的帖文锤了就是鹿晗家

小邵说剧
2026-01-06 14:02:49
2026-01-06 20:27:00
CSDN incentive-icons
CSDN
成就一亿技术人
26237文章数 242211关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

家居
教育
时尚
旅游
数码

家居要闻

引光之宅 地下室也有生机

教育要闻

儿子在家里干多少活合适呢

推广|| 她们新年状态大开挂?原来悄悄做了这笔“美丽投资”

旅游要闻

周末微度假走起!崂山三大精品线路亮相上海

数码要闻

威刚XPG发布Cybercore III电源 支持GPU功率监控及1000W/1200W双版本

无障碍浏览 进入关怀版