网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

4年踩坑实录：K8s监控该盯这12个指标

2026-04-16 08:10:35　来源: 灰度测试中

北京举报

0

分享至

生产环境跑了4年Kubernetes后，一位工程师把监控指标从1000个砍到12个——告警噪音降了80%，真正的问题反而一个没漏。

这不是偷懒，是终于搞懂了K8s可观测性的三层逻辑。

第一层：集群健康——平台还活着吗？

大多数团队的第一反应是监控每个节点的CPU。错了。

单个节点飙到90%可能只是调度不均，集群整体还有余量。真正该告警的是集群级容量：当整体利用率超过80%时，你的扩容缓冲已经告急。

控制面（Control Plane）的四个指标必须单独盯：

API Server请求延迟P99超过1秒，etcd的WAL同步延迟超过100毫秒，调度器有Pod pending超过5分钟，控制器队列深度持续增长——任何一个亮起，都不是"等会儿再看"的事。

etcd那个100ms阈值尤其阴险。磁盘I/O抖动时，它不会直接报错，但整个集群的响应会变慢，像得了慢性病。

第二层：工作负载健康——你的应用还好吗？

这里是最容易踩坑的地方。团队爱监控Pod状态，但Pod是短暂的，工作负载才是真相。

Deployment的可用副本数小于期望状态超过5分钟，或者世代号不匹配——说明滚动更新卡住了，新版本没真正上线。

Pod重启次数增长、OOM被Kill、Pending超过2分钟，这三类告警要配齐。但最有价值的是这个：

「15分钟内重启率大于0，持续15分钟触发」——CrashLoopBackOff的早鸟检测。很多团队等Pod状态变红才响应，那时服务已经中断很久了。

HPA（水平自动伸缩）的两个信号常被忽略：当前副本数等于最大值，说明触顶了；CPU利用率持续高于目标值，说明伸缩策略跟不上负载变化。

第三层：应用性能——用户感受到什么？

前面两层保证平台能跑，这层回答用户爽不爽。

RED方法三件套：每秒请求量、错误率（告警阈值1%）、P99延迟（告警阈值500毫秒）。USE方法补位：CPU请求与限制的比例，看资源利用率是否健康。

错误率超过1%就该叫醒值班的人。不是5%，不是"看情况"——1%意味着每100个用户就有1个遇到问题，在流量高峰时这是灾难。

为什么分层这么重要？

因为每一层的误报成本不同。集群层误报可能让人麻木，但漏报会让整个平台雪崩；工作负载层误报最多，但优化后能提前15分钟发现故障；应用层指标最少，但直接关联业务损失。

那位工程师的原话是：「监控所有指标，等于理解 none of them。」

现在检查你的告警列表。如果同一类问题有三条以上不同阈值的告警，或者某个指标你收到后从未采取行动——删掉它。把认知带宽留给真正会救命的12个。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

南方多省电价突然飙升专家：与霍尔木兹海峡局势有关

每日经济新闻 2026-04-25 20:30:11
14013 跟贴 14013
苏超最新积分榜出炉！

无锡博报 2026-04-25 21:51:59
150 跟贴 150

美国富豪非洲打猎被5头大象踩死

看看新闻Knews 2026-04-25 19:38:18
4607 跟贴 4607

现场视频：辽宁舰曾遭遇外军两个航母编队跟踪监视，我军歼-15挂弹起飞，从高度8000米一直缠斗至2000米，最终成功驱离外军机

北京青年报 2026-04-25 18:58:06
1449 跟贴 1449
“月薪1.6万招人放羊”老板再发声：多人通过初选，但担心条件艰苦留不住人；称就算降薪也要交社保

极目新闻 2026-04-25 16:12:24
2412 跟贴 2412

内地旅客买6000港元虫草磨粉后结账竟变成7.1万

看看新闻Knews 2026-04-25 19:24:12
4974 跟贴 4974

重达7530吨！全球单机容量最大，开始安装

环球网资讯 2026-04-25 19:52:08
1224 跟贴 1224
欧尔班宣布退出匈牙利国会

参考消息 2026-04-26 13:18:23
0 跟贴 0

告别收费，深圳水官高速迎来全新起点，市民热议未来变化

南方都市报 2026-04-26 13:28:30
18 跟贴 18
赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

齐鲁壹点 2026-04-26 07:18:18
504 跟贴 504
罕见！超级牛散，进入中信证券前十大股东！

证券时报 2026-04-26 14:12:15
11 跟贴 11
“记者卧底桂林六日游低价团”后续：地接旅行社被罚30万并停业整顿

极目新闻 2026-04-24 08:03:58
550 跟贴 550
泡泡玛特推出Labubu冰箱，售价5999元，上千人预约

大象新闻 2026-04-26 13:01:02
544 跟贴 544
华山南峰论剑石被拆，官方回应：北峰以外所有“华山论剑”石都会被拆

现代快报 2026-04-26 14:00:13
30 跟贴 30
美国知名学者杰弗里·萨克斯：美式霸权正走向终结

国际在线 2026-04-25 19:09:02
307 跟贴 307
约基奇都对你说了什么？麦丹：只看到一个大块头冲了过来

北青网-北京青年报 2026-04-26 14:33:06
2 跟贴 2
于无声处听惊雷——2026年湖南省首届“瑞奇杯”围棋超级联赛侧记

潇湘晨报 2026-04-26 13:24:32
2 跟贴 2
媒体：美政府一边搭建退税平台一边警告企业别退税

澎湃新闻 2026-04-26 16:56:04
0 跟贴 0
惊了！“土皇帝”村支书与被土埋大半截的“村民”

闲侃闲侃 2026-04-26 17:11:04
0 跟贴 0
背离初衷！本是帮扶弱势群体的标识，为何成了年轻人的人设道具？

颤抖的熊猫 2026-04-26 17:14:56
0 跟贴 0
李维刚又赔光了？5分钟卖光2万斤滞销脐橙，网友：这次真怕他塌房

雷科技 2026-04-26 17:14:53
0 跟贴 0

特朗普、穆杰塔巴、佩泽希齐扬，同日表态

特朗普、穆杰塔巴、佩泽希齐扬，同日表态

极目新闻

2026-04-26 07:59:00

公婆卖掉老家房给小姑子上海买房,我没吭声,半年后他们搬来我家

公婆卖掉老家房给小姑子上海买房,我没吭声,半年后他们搬来我家

王二哥老搞笑

2026-04-26 14:07:24

果然有情况！湖南如厕老兵底裤被扒：刑满释放人员、多次闹访缠访

果然有情况！湖南如厕老兵底裤被扒：刑满释放人员、多次闹访缠访

小鋭有话说

2026-04-26 15:20:50

替补43分！多森姆季后赛大爆发，火箭没交易输麻？

替补43分！多森姆季后赛大爆发，火箭没交易输麻？

篮球实录

2026-04-26 14:57:26

活久见！网传江西一新娘妈妈将一捆捆现金高举头顶，给宾客观摩

活久见！网传江西一新娘妈妈将一捆捆现金高举头顶，给宾客观摩

火山詩话

2026-04-26 11:29:17

43+4，被打蒙了，1.3秒彻底爆发，气死了！第一次见

43+4，被打蒙了，1.3秒彻底爆发，气死了！第一次见

体育新角度

2026-04-26 15:40:51

赵露思陪好朋友魏笑去领证了

书台小事

2026-04-26 13:22:16

戴安娜因太好看引发SBI强烈不满，称不伦不类令人作呕

戴安娜因太好看引发SBI强烈不满，称不伦不类令人作呕

街机时代

2026-04-25 18:00:03

只喝烧开的自来水，不碰桶装水，不买矿泉水，最后结果如何？

只喝烧开的自来水，不碰桶装水，不买矿泉水，最后结果如何？

芹姐说生活

2026-04-26 15:17:10

A股：下周，两个重要消息落地，明天，周一或要这样走！

A股：下周，两个重要消息落地，明天，周一或要这样走！

明心

2026-04-26 11:59:45

兵败如山倒！国产新能源或已经证明：中国压根不需要二线豪华品牌

兵败如山倒！国产新能源或已经证明：中国压根不需要二线豪华品牌

音乐时光的娱乐

2026-04-26 15:08:43

为何火箭诞生首个0-3？赛后申京毫不客气说出实情，说的非常实在

为何火箭诞生首个0-3？赛后申京毫不客气说出实情，说的非常实在

不想长大的莫扎特

2026-04-25 18:16:16

颜骏凌在本轮结束后官宣重要决定！球迷都直言没想到，纷纷祝福他

颜骏凌在本轮结束后官宣重要决定！球迷都直言没想到，纷纷祝福他

张丽说足球

2026-04-26 12:51:11

注意！中老年男性有性生活和没性生活，差别居然这么大？

注意！中老年男性有性生活和没性生活，差别居然这么大？

皓皓情感说

2026-04-22 08:20:32

中国女篮最新消息！传来三大核心好消息，李梦、陈明伶、张茹

中国女篮最新消息！传来三大核心好消息，李梦、陈明伶、张茹

一家说

2026-04-26 09:32:51

35岁离婚，因嗜酒家财散尽，50岁中年又丧女，如今66岁腾格尔如何

35岁离婚，因嗜酒家财散尽，50岁中年又丧女，如今66岁腾格尔如何

白面书誏

2026-04-25 15:13:17

皇马今夏第一签：37场造20球，身价6500万中场，只需900万欧元！

皇马今夏第一签：37场造20球，身价6500万中场，只需900万欧元！

越岭寻踪

2026-04-26 16:26:02

郑钦文VS莱巴金娜前瞻：观赛时间不友好，战劲敌能否更进一步？

郑钦文VS莱巴金娜前瞻：观赛时间不友好，战劲敌能否更进一步？

全景体育V

2026-04-26 06:51:35

扎心了！10后小学生锐评80后：老年人思维

扎心了！10后小学生锐评80后：老年人思维

大象新闻

2026-04-25 13:41:02

伊朗最大的战略失误就是拒绝从中国购买先进武器装备。

伊朗最大的战略失误就是拒绝从中国购买先进武器装备。

小熊看国际

2026-04-26 11:42:38

灰度测试中

生活正在重构，目前还在灰度测试阶段，暂不全量发布。

1674文章数 18关注度

往期回顾全部

科技要闻

涨价浪潮下，DeepSeek推动AI“价格战”

头条要闻

美国网民质疑：为什么先救万斯

头条要闻

美国网民质疑：为什么先救万斯

体育要闻

森林狼3比1掘金：逆境中杀出了多孙穆？！

娱乐要闻

仅次《指环王》的美剧，有第二季

财经要闻

中办、国办：加强新就业群体服务管理

汽车要闻

预售19.38万元起哈弗猛龙PLUS七座版亮相

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戏

旅游

本地

公开课

教育要闻

四年级数学：简便计算，难住不少数学老师

《刺客信条：黑旗记忆重置》仍然会保留血液效果

旅游要闻

游客在山顶打架，景区又能怎么办

本地新闻

云游中国｜逛世界风筝都留学生探秘中国传统文化

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版