网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI成本重心转移：推理正在取代训练成为持续支出黑洞

2026-05-26 01:23:49　来源: 灰度测试中

北京举报

0

分享至

训练是一次性投资，推理是永久性驻留——这个区别被大多数AI成本讨论刻意回避了。AI基础设施预算的叙事已经转变：不是从"便宜"到"昂贵"，而是从"事件"到"常态"。训练有终点线，推理稳态没有。每个部署的模型都会持续占用计算资源、服务基础设施和运营开销，只要应用还在运行，成本时钟就永不停止。与传统云工作负载不同，推理不存在自然降低支出的空闲状态。

这在架构层面至关重要，因为它改变了治理对象。有界工作负载的优化杠杆是效率，永久性驻留工作负载的优化杠杆是权限——谁决定什么占据基础设施、以何种条件、承担何种责任。这是完全不同的治理问题。

推理稳态不是阶段，而是新基线

模型一旦投产，就永久占用基础设施。端点保持温热，因为冷启动延迟会违反服务等级目标（SLO）。并发余量必须提前预留。路由层、令牌缓存、回退模型和可观测性管道与主服务路径并行持续运行。

推理稳态是AI工作负载在任何时候所需的最低可行基础设施占用——不是平均值，不是峰值，而是无法在SLA承诺范围内运营的底线。随着采用率增长，这条底线向上扩展，几乎从不回落。

请求是信号，驻留是成本。

推理支出为何不会自然衰减

传统云成本指导假设工作负载存在空闲状态。推理以四种独立方式打破这一假设：

延迟SLO强制要求温热容量。在请求之间保持容量温热是有意的架构选择，而非优化失败。AI推理执行预算问题由此衍生——你无法在一个被设计为永不空闲的系统上强制执行运行时成本限制。

需求随采用率扩展。推理支出不会衰减——它随产品成功而阶梯式上升。

模型增殖速度快于退役速度。旧模型很少完全退出环境——金丝雀流量、回退路由和合规要求使其以缩减容量保持温热。

金丝雀部署使临时驻留翻倍。在规模上，多个模型的金丝雀占用合计成为服务支出的永久性比例。

⚠ 常见错误：将推理成本视为使用优化问题。温热容量是使SLA可实现的机制——针对它进行优化会在降低支出之前先损害可靠性。

持久推理驻留栈

三层。三个所有者。无共享优化面。

第一层——计算驻留。团队以为的：GPU支出。实际发生的：并发预留。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

超越TurboQuant，长上下文推理真2-bit KV Quantization算法问世

机器之心Pro 2026-05-29 16:01:28
0 跟贴 0
终于，清华快手养出了通人性的AI！

新智元 2026-05-29 18:45:18
0 跟贴 0

DeepSeek狂吞17万亿Tokens？国产AI算力，最关键一战来了！

新智元 2026-05-29 13:17:47
35 跟贴 35

刚刚，智元拿下WorldArena世界模型总分冠军！

机器之心Pro 2026-05-29 21:54:56
0 跟贴 0
X平台疯传！这个国产开源模型，把信息图生成整明白了附实测

智东西 2026-05-29 21:57:26
0 跟贴 0

科技巨头疯狂抢电，却没人看懂真正的战场

DeepTech深科技 2026-05-29 19:11:07
0 跟贴 0

被黑洞吞噬的物质都去哪了，会不会到达另一个宇宙？

世界地理小知识 2026-05-29 19:55:05
1 跟贴 1
整个银河系加起来也比不过它，TON618

老友地理 2026-05-28 10:09:53
1 跟贴 1

深圳：一座把不稳定当作增长燃料的城市

秦朔朋友圈 2026-01-08 07:14:07
1 跟贴 1
太空中为什么是黑的，其实都是谎言

万物研究 2026-05-27 08:37:57
33 跟贴 33
宇宙中的恐怖存在——黑洞

六六冷知识 2026-05-27 21:27:00
1 跟贴 1
宇宙中最神秘的天体，环状星系霍格天体

万物研究 2026-05-28 10:10:24
4 跟贴 4
黑洞居然也有二代？引力波撕开宇宙禁区，我们看到恒星终极秘密

黑科技在身边 2026-05-28 21:12:16
4 跟贴 4
【再获佳绩】帝奥微五款车规产品入编《国产车规芯片可靠性分级目录（2026）》

新浪财经 2026-05-27 14:07:32
0 跟贴 0
比黑洞更恐怖的 “量子奇点”，藏在黑洞中心，能瞬间毁灭宇宙

世界地理小知识 2026-05-29 19:55:07
1 跟贴 1
金靖刘宇宁继承者争夺之战reaction

小夏娱乐圈唠叨 2026-05-29 10:38:31
0 跟贴 0
知道不代表能感受到：双系统如何让逻辑说服不了情绪

字节漫游指南 2026-05-30 04:26:12
0 跟贴 0
俄亥俄州立启动十余年最大球场调研，Wi-Fi升级与AI叫板“信号黑洞”

竞技风云录 2026-05-30 00:50:08
0 跟贴 0
你的大脑里有个“黑洞”，它让你看到的现实独一无二

宇宙来信2 2026-05-30 05:02:42
0 跟贴 0
他甘愿当金丝雀，只是为了留在我身边？

彦儿Sariel 2026-05-27 21:57:06
0 跟贴 0
恋情曝光！朱梓骁直播示爱蛋蛋，昔日“金丝雀”如今活成这样？

文刀贰 2026-05-27 22:59:57
7 跟贴 7
DC最强女英雄竟无人问津？不是不红，是被耽误了！

自愈小日子 2026-05-28 01:18:46
1 跟贴 1
孩子去“光头强家”，对着床上被子一头栽下去，没想到是模型！

笑出猪叫的趣闻阁 2026-05-26 17:08:43
1 跟贴 1
你受困于什么

文化学者黎荔 2026-05-30 00:07:34
0 跟贴 0
韦布望远镜颠覆认知：先有黑洞，还是先有星系？

NASA爱好者 2026-05-30 03:30:09
0 跟贴 0
美航天火箭测试发生意外，还未升空就原地爆炸，蘑菇云腾空而起

车马点兵V 2026-05-29 13:14:23
0 跟贴 0
2/3质量归黑洞，这还算星系吗？

闪存猎手 2026-05-30 06:35:12
0 跟贴 0
彭罗斯预言了宇宙与大脑的沟通，40年后，他获得了诺贝尔奖

画凉 2026-05-29 05:13:54
0 跟贴 0
杭州公园引入“黑科技”：一天抓7000多只蚊子！“河边坐一个半小时没被咬”“我都想买一个放家里”

都市快报橙柿互动 2026-05-29 09:17:46
5495 跟贴 5495
为什么土星会有一圈光环？土星看似很美丽，实则很恐怖

万物研究 2026-05-28 10:10:23
1 跟贴 1
我们会是宇宙中的，第一批文明吗？

万物研究 2026-05-28 23:32:27
1 跟贴 1
如果巨型香蕉绕地球轨道运行，从地面看是这样的

悠悠说世界 2026-05-29 12:19:22
0 跟贴 0
双重新图景：光子绝对零度传播的超光速与亚光速假说

原创物理理论研究与探索 2026-05-28 21:11:28
6 跟贴 6
美国航天出事故！新格伦火箭在基地炸成火球，登月计划要黄了？

李李视界 2026-05-29 17:39:25
0 跟贴 0
优衣库等品牌收集非必要个人信息被通报

封面新闻 2026-05-29 12:10:44
1961 跟贴 1961
从内到外揭秘银河系，太阳只是4000亿分之一

万物研究 2026-05-29 20:29:00
1 跟贴 1
马斯克的小目标：星舰10000发/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
1 跟贴 1
浙江两级文物部门回应：文物战国青铜剑疑有拼接痕调查结束近期通报

新京报 2026-05-29 17:23:45
1784 跟贴 1784
山东迎来新机遇：建设2个特大城市，14个大城市，有你家乡吗

纵使风吹 2026-05-29 01:33:51
0 跟贴 0
176年一遇的特殊排列，四颗巨行星连线，旅行者一号有多幸运？

万物研究 2026-05-29 20:27:01
1 跟贴 1

朱莉柬埔寨养子正式去“父姓”，皮特已被4位孩子抛弃，态度冷淡

朱莉柬埔寨养子正式去“父姓”，皮特已被4位孩子抛弃，态度冷淡

译言

2026-05-30 06:04:55

徐州女幼师用热熔枪连烫两次孩子嘴唇！多名家长称早发现孩子有伤

徐州女幼师用热熔枪连烫两次孩子嘴唇！多名家长称早发现孩子有伤

听心堂

2026-05-29 21:22:08

白人女性与黑人女性的体味差异，网友真实分享引发热议

白人女性与黑人女性的体味差异，网友真实分享引发热议

特约前排观众

2025-12-22 00:20:06

新加坡真的宜居吗？住了一年告诉你，35度高温天天晒到底是啥感受

新加坡真的宜居吗？住了一年告诉你，35度高温天天晒到底是啥感受

复转这些年

2026-05-28 17:52:23

华为推出韬定律，被鼓吹已威胁到英伟达、光刻机，评论区不给面子

华为推出韬定律，被鼓吹已威胁到英伟达、光刻机，评论区不给面子

谭谈社会

2026-05-29 08:11:36

释永信获刑24年背后的贪腐迷局

释永信获刑24年背后的贪腐迷局

凤眼论

2026-05-29 20:03:09

46岁汤唯：被争议困住半生，却凭一张素颜脸，美成内娱清流天花板

46岁汤唯：被争议困住半生，却凭一张素颜脸，美成内娱清流天花板

野狐馋师

2026-05-30 06:17:40

上港幸好没留下他！如今25岁正处于职业生涯黄金期，却没球队要

上港幸好没留下他！如今25岁正处于职业生涯黄金期，却没球队要

振刚说足球

2026-05-29 13:33:23

时尚天河，没救了！

广州PLUS

2026-05-29 23:46:19

震惊！贵州大学招聘岗位限配偶条件，被质疑“萝卜岗”，评论炸锅

震惊！贵州大学招聘岗位限配偶条件，被质疑“萝卜岗”，评论炸锅

火山詩话

2026-05-28 15:07:01

五天近12亿，《给阿嬷的情书》被11亿成本大片打败，丢掉全球冠军

五天近12亿，《给阿嬷的情书》被11亿成本大片打败，丢掉全球冠军

影视高原说

2026-05-28 18:59:51

激光防空灭蚊，五角大楼后背发凉，老外抢空订单，中方对付吸血虫

激光防空灭蚊，五角大楼后背发凉，老外抢空订单，中方对付吸血虫

清欢百味

2026-05-30 03:25:11

起底山东问题鸡蛋涉事公司

雷达财经

2026-05-29 18:41:09

地毯拖拽行李费力？广州白云机场回应T3三大热点

地毯拖拽行李费力？广州白云机场回应T3三大热点

南方都市报

2026-05-30 00:19:26

豪赌全明星！火箭重磅交易方案出炉，目标锁定骑士核心米切尔

豪赌全明星！火箭重磅交易方案出炉，目标锁定骑士核心米切尔

夜白侃球

2026-05-29 15:53:04

王玉雯29岁生日直播：16个月无戏可拍，撕开了内娱最残酷的遮羞布

王玉雯29岁生日直播：16个月无戏可拍，撕开了内娱最残酷的遮羞布

手工制作阿歼

2026-05-29 17:08:33

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

上游新闻

2026-05-29 18:03:05

首次！大船装满近5000辆车，卖爆了

首次！大船装满近5000辆车，卖爆了

中国新闻周刊

2026-05-29 07:33:08

辽宁铁人连胜！会做人：徐正源挨个安抚对手，对海港主帅躬身帖耳

辽宁铁人连胜！会做人：徐正源挨个安抚对手，对海港主帅躬身帖耳

足球大腕

2026-05-29 23:07:35

30位情妇、60辆豪车，有钱人的生活能有多奢淫？比赌王过得还潇洒

30位情妇、60辆豪车，有钱人的生活能有多奢淫？比赌王过得还潇洒

历史伟人录

2026-05-24 20:05:31

灰度测试中

生活正在重构，目前还在灰度测试阶段，暂不全量发布。

4142文章数 32关注度

往期回顾全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年中国佛教协会：完全是咎由自取

头条要闻

释永信被判24年中国佛教协会：完全是咎由自取

体育要闻

即使是文班亚马，也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百领克10+&领克10上市16.99万元起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

房产

本地

教育

军事航空

亲子要闻

为什么说太空不能有性行为？一旦怀孕，究竟对人类意味着什么？

房产要闻

顺德澐璟「澐冠」再出圈：顶阶人群不是买房，是追加“传世资产”

本地新闻

用剪纸的方式，打开江苏扬州

教育要闻

动点定值问题，一个视频学会！

军事要闻

中方公布参加香会阵容几大议题受到关注

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版