网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

多租户AI配额：为什么"每分钟20次"救不了你的SaaS

2026-05-08 04:29:27　来源: 碳基打工人

北京举报

0

分享至

周二上午十点，你的企业客户CEO正在向董事会演示AI功能。两分钟后，页面弹出429错误。原因？某个免费用户在后台用脚本批量处理支持邮件，耗尽了整分钟的API额度。

这不是假设。一个团队告诉我，他们第一次遇到这事后加了"每租户每分钟20请求"的限制。然后月底有租户做报表 burst 到40次，被限流后投诉。他们提到100。另一个租户跑脚本。循环到第三轮，单租户限额已经高到20个租户加起来仍能打爆上游密钥。那个"简单限制"成了YAML里的摆设。

问题出在单位选错了。LLM SaaS的稀缺资源是上游每分钟token数，不是请求数。一次32K上下文摘要调用，相当于60次分类请求。按请求计费、排队或限流，你的桶在撒谎。

Token预算在限流层之上。它回答的是：给定有限的上游token供给，怎么分才能让吵闹的租户饿不死安静的，付费的不排在免费的后面。

桶的形状很简单：每个租户有tokens_remaining计数器和refill_rate。请求按预期token成本（prompt + max_tokens）扣减；桶以每秒refill_rate refill，到上限封顶。预期成本定义上就是错的——模型实际输出通常更少——但误差跨请求平均掉，桶的形状是对的。

下面这个模式从上到下，每个解决上一层制造的问题。

最底层：扔掉"每分钟N请求"。它惩罚突发、无视token成本、把200 token分类和40K token摘要同等对待。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

机器之心Pro 2026-05-07 12:59:10
0 跟贴 0
8000亿的海光信息贵吗？

虎嗅APP 2026-05-08 06:00:10
3 跟贴 3

推理新范式：动态效能算法让算力资源实现最大化

智东西 2025-11-12 19:58:10
0 跟贴 0

微信又瞎折腾？未读语音变灰，大批用户疯狂吐槽

雷科技 2026-05-08 11:38:51
0 跟贴 0
打破碎片化瓶颈！浙大&哈佛开源UniGeo，高保真相机可控编辑

新智元 2026-05-07 12:08:49
0 跟贴 0

DeepSeek V4 发布后遇冷，开发者只聊Codex：便宜不是万能药

雷科技 2026-05-06 21:25:43
182 跟贴 182

那东西总是有点误差的是吧

默默在家 2026-05-06 01:08:20
17 跟贴 17
对话亚马逊云科技Mai-Lan：S3的下一个战场，如何应对Agent时代的数据消费狂潮

钛媒体APP 2026-05-08 12:14:13
0 跟贴 0

算力压力大，豆包也扛不住要收费了

经济观察报 2026-05-08 09:55:25
0 跟贴 0
需求从工具转向结果，SaaS会死在重生的路上么？丨ToB产业观察

钛媒体APP 2026-05-06 19:15:28
0 跟贴 0
不用等官方了！第三方「国产Codex」爆火，一天收割8K个Star

雷科技 2026-05-07 20:49:14
22 跟贴 22
从爆火到平淡，OpenClaw改变了什么

钛媒体APP 2026-05-08 08:53:10
0 跟贴 0
博主用边框识破视觉误差，当年不少人被这个把戏糊弄过，网友：称一下重量就能识破

星沙时报 2026-05-04 15:02:38
19 跟贴 19
一句话，AI生成了整个可点击的广州！Flipbook实测太离谱了

雷科技 2026-05-08 11:21:17
0 跟贴 0
武汉多人买格力空调还没安装门店关闭，格力让消费者以优惠价格再买一次？多方回应

潇湘晨报 2026-05-07 15:53:43
10064 跟贴 10064
波兰总统：波兰可以接收美国从德国撤出的5000人部队

澎湃新闻 2026-05-07 16:02:26
11893 跟贴 11893
谢娜首场个人演唱会结束后，杜海涛在后台看到谢娜开心不已，网友：我说为啥跟你击掌呢

氧气周末 2026-05-07 11:01:49
126 跟贴 126
别急着做新工具的“小白鼠”：AI时代的慢沉淀与大迭代

秦朔朋友圈 2026-05-08 00:04:02
0 跟贴 0
港股SaaS股走强迈富时涨超9%

每日经济新闻 2026-05-08 09:43:07
0 跟贴 0
前壁仞总裁，融资数亿元

智东西 2026-05-08 12:13:09
0 跟贴 0
媒体：特朗普党内同盟访华当着王毅的面感谢中国

新民周刊 2026-05-08 09:06:30
13 跟贴 13
修成直线明明能节约成本，为何非要设计个大弯，这到底什么讲究！

松离搞笑家 2026-05-07 16:25:49
1 跟贴 1
千年古寺变提款机器，悬空寺黄牛乱象被曝光，全是坑人套路，后续

眼光很亮 2026-05-07 07:27:02
4 跟贴 4
印尼菲日合作刚发声，中方953亿投资恐泡汤

玫瑰与花海 2026-05-08 09:02:42
0 跟贴 0
歼-35AE量产机公开引关注，巴基斯坦有望成为首个海外用户吗？

观武论烽烟 2026-05-08 10:05:00
0 跟贴 0
樱桃树外的大棚，搭建效果完美控水，不敢想象多大成本！

搞怪艺术家 2026-05-06 17:03:54
1 跟贴 1
上海迪士尼能通话录音游客不能录，否则无法提供服务！游客：凭什么迪士尼能录我不能

潇湘晨报 2026-05-07 16:14:22
571 跟贴 571
中国拒绝“漫天要价”的背后：不是中国离不开世界杯，是世界杯更需要中国

中国网 2026-05-07 17:51:22
3298 跟贴 3298
峨眉山景区回应“男子推搡猴子”：3年内禁止其进入景区

界面新闻 2026-05-07 16:44:02
6184 跟贴 6184
不问配置不聊价格，浙江一女子开口就要买5台最新款iPhone，老板不但不卖，反手报了警

环球网资讯 2026-05-08 07:38:20
926 跟贴 926
重庆洪崖洞景区奶芙店私自增加所售奶芙制品重量，官方通报

界面新闻 2026-05-07 15:36:33
190 跟贴 190
欧盟中国商会警告：淘汰中国设备要付出4000亿美元代价

参考消息 2026-05-07 17:47:03
2097 跟贴 2097
女子机场租用充电宝1小时扣费149元，退费需回现场自证，网上显示小电科技被投诉量超5万件

极目新闻 2026-05-07 13:36:00
867 跟贴 867
“排队3小时，打卡1分钟”，多景区迎“泼天流量”

澎湃新闻 2026-05-06 00:04:10
3858 跟贴 3858
吴彦祖隐退13年复出，夫妻营业引网友惊恐

凛若秋霜 2026-05-08 09:47:13
7 跟贴 7
中国953亿打水漂？印尼对华连出三记狠招，转头与日本签防务协议

兵器海陆空视频 2026-05-08 10:06:27
0 跟贴 0
南通农村：买杯咖啡下地敲油菜

南通濠生活 2026-05-08 09:59:11
0 跟贴 0
5月9日随州开课｜用AI替我打工2个月，今天曝光这只"龙虾"的使用手册！

随州网 2026-05-08 10:06:53
0 跟贴 0
“很久没有这种兴奋感了”！段永平出手！清仓中国神华买入泡泡玛特称泡泡玛特的商业壁垒远比想象中强大是王宁的粉丝

每日经济新闻 2026-05-07 17:25:55
275 跟贴 275
Steam手柄秒罄后开排队：V社学聪明了，但老玩家有点懵

别打我我投降 2026-05-08 11:12:09
1 跟贴 1

委内瑞拉，从热搜消失了

民间胡扯老哥

2026-05-08 06:45:03

太原一出租车司机“狂喷”乘客？官方：顶格行政处罚

太原一出租车司机“狂喷”乘客？官方：顶格行政处罚

界面新闻

2026-05-08 10:22:07

三亚4只皮皮虾1035元反转！市监局：价格合规，游客别想白吃

三亚4只皮皮虾1035元反转！市监局：价格合规，游客别想白吃

垛垛糖

2026-05-07 20:14:29

举报一个查一个！耿同学举报3位大学院长和教授，同济院长被免职还差南开和中山

举报一个查一个！耿同学举报3位大学院长和教授，同济院长被免职还差南开和中山

可达鸭面面观

2026-05-07 13:03:19

星空卫视宣布暂停，大量网友涌向评论区

星空卫视宣布暂停，大量网友涌向评论区

南方都市报

2026-05-07 12:27:53

科贝：巴尔韦德&楚阿梅尼将停赛3-20场，甚至可能直接被开除

科贝：巴尔韦德&楚阿梅尼将停赛3-20场，甚至可能直接被开除

懂球帝

2026-05-08 01:09:39

5月1日起红灯右转全国统一新规：不是不让转，是不要再乱转了

5月1日起红灯右转全国统一新规：不是不让转，是不要再乱转了

笑熬浆糊111

2026-05-08 05:47:49

14岁神童手搓发动机被曝造假！漏洞百出吹上天，普通人拿什么比？

14岁神童手搓发动机被曝造假！漏洞百出吹上天，普通人拿什么比？

社会日日鲜

2026-05-08 04:18:01

190元榴莲遭仅退款，商家驱车1600公里找买家：翻遍垃圾桶找证据，派出所立案

190元榴莲遭仅退款，商家驱车1600公里找买家：翻遍垃圾桶找证据，派出所立案

潇湘晨报

2026-05-07 23:12:22

重磅：乌克兰攻击莫斯科军事基地！俄罗斯15地取消阅兵式

重磅：乌克兰攻击莫斯科军事基地！俄罗斯15地取消阅兵式

项鹏飞

2026-05-07 20:16:25

别轻视小人物：20个历史血泪教训，强者多亡于蝼蚁

别轻视小人物：20个历史血泪教训，强者多亡于蝼蚁

小莜读史

2026-05-06 20:15:38

外甥被赶出台企，顽固“台独”分子破防了

外甥被赶出台企，顽固“台独”分子破防了

枢密院十号

2026-05-07 19:41:09

网传山西大同订婚强奸案男主出狱后发文：一天刑期未减，因我始终没有认罪

网传山西大同订婚强奸案男主出狱后发文：一天刑期未减，因我始终没有认罪

互联网大观

2026-05-07 18:16:26

一场4-0！让英超保级又生变数：热刺有2对手要争六，全输或降级

一场4-0！让英超保级又生变数：热刺有2对手要争六，全输或降级

体育知多少

2026-05-08 09:00:37

燃尽！詹姆斯连4场至少20+6创多项历史第一难阻0-2陷困境

燃尽！詹姆斯连4场至少20+6创多项历史第一难阻0-2陷困境

醉卧浮生

2026-05-08 12:18:06

国际足联急了！三次降价求央视转播世界杯，6200 万多一分免谈

国际足联急了！三次降价求央视转播世界杯，6200 万多一分免谈

狸花小咪

2026-05-08 01:33:06

央视工作人员：以前世界杯转播权提前半年搞定现在一切都不确定

央视工作人员：以前世界杯转播权提前半年搞定现在一切都不确定

念洲

2026-05-08 07:31:02

毛主席后代现状：无心进入政坛，大多从商，从不言是伟人后代

毛主席后代现状：无心进入政坛，大多从商，从不言是伟人后代

历史人文2

2026-05-05 11:30:03

伊朗南部多次传出爆炸声，伊朗军方称美军空袭沿海地区

伊朗南部多次传出爆炸声，伊朗军方称美军空袭沿海地区

新京报

2026-05-08 09:27:42

火爆！亚历山大险夹伤里夫斯被吹一级恶犯旧将卡鲁索抱怨吃T

火爆！亚历山大险夹伤里夫斯被吹一级恶犯旧将卡鲁索抱怨吃T

醉卧浮生

2026-05-08 11:17:44

碳基打工人

坐标北京，靠咖啡续命，靠小红书下饭的普通人类。

2320文章数 32关注度

往期回顾全部

科技要闻

追赶星舰：中国商业火箭离SpaceX有多远？

头条要闻

女子网购发现所在街道被"拉黑" 商家:"白嫖"的人太多

头条要闻

女子网购发现所在街道被"拉黑" 商家:"白嫖"的人太多

体育要闻

巴黎再进欧冠决赛，最尴尬的情况还是发生了

娱乐要闻

黄子佼获缓刑4年，无需入狱服刑

财经要闻

一觉醒来，美伊又打起来了

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

亲子

手机

公开课

军事航空

家居要闻

流动的尺度打破家的形式主义

亲子要闻

东莞儿童/青少年孩子近视了怎么办？配眼镜推荐（附五款防控镜片参考）

手机要闻

红魔11S Pro定档5月18日发布：支持水冷+风冷双散热

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

伊朗：最高领袖穆杰塔巴全面掌控局势

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版