网易首页 > 网易号 > 正文 申请入驻

Alertmanager 配置终极指南:从“邪道”到正规军

0
分享至

新钛云服已累计为您分享861篇技术干货

Prometheus Operator 的 AlertmanagerConfig 死活不生效时,我选择了对加密配置下手...

问题背景

部署 Prometheus Operator 后,精心配置的 AlertmanagerConfig 资源死活不生效。在无数次调试无果后,我决定绕过 Operator,直接对加密的默认配置动手——这是一条邪修之路,但效果立竿见影!

邪道方案:直捣黄龙

1.获取加密配置

kubectl get secret alertmanager-rancher-monitoring-alertmanager-generated \
  -n cattle-monitoring-system -o yaml > secret.yaml

2.解密核心配置

# 安装 yq 工具
wget https://github.com/mikefarah/yq/releases/download/v4.25.1/yq_linux_amd64 -O /usr/local/bin/yq
chmod +x /usr/local/bin/yq
# 解密 alertmanager 配置
echo "$(yq eval '.data."alertmanager.yaml.gz"' secret.yaml)" | base64 -d | gzip -d > alertmanager.yaml
# 解密模板文件
echo "$(yq eval '.data."rancher_defaults.tmpl"' secret.yaml)" | base64 -d > rancher_defaults.tmpl

3.魔改配置(QQ邮箱示例)

global:
  resolve_timeout: 5m
  smtp_smarthost: 'smtp.qq.com:465'
  smtp_from: 'xxxx@qq.com'
  smtp_auth_username: 'xxxx@qq.com'
  smtp_auth_password: 'xxxxxxx'
  smtp_require_tls: false
route:
  receiver: "k8s-alarm"
  group_by: [alertname]
  routes:
  - receiver: "null"
    matchers:
    - alertname = "Watchdog"
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 12h
receivers:
- name: "k8s-alarm"
  email_configs:
  - to: 'test@gmail.cn'
    send_resolved: true
- name: "null"
templates:
- /etc/alertmanager/config/*.tmpl

4.重新加密并部署

# 压缩配置
gzip -c alertmanager.yaml > alertmanager.yaml.gz
# Base64 编码
ALERTMANAGER_CONFIG=$(base64 -w0 alertmanager.yaml.gz)
TEMPLATE_CONFIG=$(base64 -w0 rancher_defaults.tmpl)
# 生成新 Secret
yq eval ".data.\"alertmanager.yaml.gz\" = \"$ALERTMANAGER_CONFIG\" | 
         .data.\"rancher_defaults.tmpl\" = \"$TEMPLATE_CONFIG\"" secret.yaml > updated-secret.yaml
# 修改 Secret 名称
sed -i 's/name: alertmanager-.*/name: alertmanager-main/' updated-secret.yaml
# 应用配置
kubectl apply -f updated-secret.yaml -n cattle-monitoring-system

5.修改Alertmanager工作负载

# 修改 volumes 配置
volumes:
- name: config-volume
  secret:
    secretName: alertmanager-main  # 替换默认值

效果验证




警告:此方案虽快但险,Operator 升级可能导致配置被覆盖!

正规军方案:优雅之道

1.配置告警接收器和路由

# k8s-alarm.yaml
apiVersion: monitoring.coreos.com/v1alpha1
kind: AlertmanagerConfig
metadata:
  name: k8s-alarm
  namespace: test
spec:
  receivers:
    - name: tialert
      webhookConfigs:
        - url: https://your-webhook-url
          sendResolved: true

  route:
    groupBy: [alertname]
    groupInterval: 5m
    groupWait: 30s
    matchers:
      - name: severity
        value: "warning|critical"
        regex: true
    receiver: tialert
    repeatInterval: 4h

2.配置静默路由

# null.yaml
apiVersion: monitoring.coreos.com/v1alpha1
kind: AlertmanagerConfig
metadata:
  name: silence-watchdog
  namespace: cattle-monitoring-system
spec:
  receivers:
    - name: null-receiver

  route:
    matchers:
      - name: alertname
        value: "Watchdog"
    receiver: null-receiver

3.自定义告警规则

# app-alert.yaml
apiVersion: monitoring.coreos.com/v1
kind: PrometheusRule
metadata:
  name: app-backend-alerts
  namespace: test
  labels:
    prometheus: rancher-monitoring
    role: alert-rules
spec:
  groups:
  - name: app-backend
    rules:
    - alert: HighRequestRate
      expr: |
        sum(rate(http_requests_total{job="app-backend"}[5m])) by (service) > 100
      for: 10m
      labels:
        severity: critical
      annotations:
        summary: "High request rate on {{ $labels.service }}"
        description: "Request rate is {{ $value }} per second"

总结对比

选择建议:调试阶段可用“邪道”快速验证,生产环境务必使用正规方案!

无论是“邪道”还是“正规军”,最终目的都是让告警系统稳定、可靠、可控。调试阶段,适当“走捷径”可以快速验证思路,但千万别让临时方案变成长期债务。真正的运维高手,不是不走捷径,而是知道什么时候该回头,把“邪修”的经验,沉淀为“正道”的规范。

如有相关问题,请在文章后面给小编留言,小编安排作者第一时间和您联系,为您答疑解惑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
36岁男子失联已经237天,妹妹:有回流人员在境外的某园区见过他

36岁男子失联已经237天,妹妹:有回流人员在境外的某园区见过他

好词好文
2026-02-01 12:23:48
科技龙头获资金加仓近40亿港元

科技龙头获资金加仓近40亿港元

数据宝
2026-02-01 13:02:34
李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

子芫伴你成长
2026-01-25 08:10:03
村里又出大学生?国产武侠《锦衣卫》播放量破260万

村里又出大学生?国产武侠《锦衣卫》播放量破260万

游民星空
2026-01-31 10:17:24
不忍了!郭晶晶回应代言风波,真相终于大白,我们都被骗了!

不忍了!郭晶晶回应代言风波,真相终于大白,我们都被骗了!

叨唠
2026-01-31 21:41:25
知名长租公寓广州多门店被撤场,租户发声

知名长租公寓广州多门店被撤场,租户发声

南方都市报
2026-02-01 12:37:34
因不提供“特殊服务”遭辱,22岁女子刺死1名官员,判决让人欣慰

因不提供“特殊服务”遭辱,22岁女子刺死1名官员,判决让人欣慰

谈史论天地
2026-01-16 11:55:08
女子被困缅甸新园区近一年半,每天工作18小时,完不成任务就挨打,“身体和精神都快到极限了”

女子被困缅甸新园区近一年半,每天工作18小时,完不成任务就挨打,“身体和精神都快到极限了”

扬子晚报
2026-01-30 15:05:51
舒马赫能坐轮椅了!妻子科琳娜照顾13年花费超20亿,始终没有放弃

舒马赫能坐轮椅了!妻子科琳娜照顾13年花费超20亿,始终没有放弃

照见古今
2026-01-30 17:54:20
不要和服务人员走得太近,网友:洗剪吹是重灾区!

不要和服务人员走得太近,网友:洗剪吹是重灾区!

夜深爱杂谈
2026-01-31 19:32:35
若连碗面都要靠官媒压阵才能卖出,那不吃也罢——横竖都是预制的

若连碗面都要靠官媒压阵才能卖出,那不吃也罢——横竖都是预制的

星星会坠落
2026-01-30 13:12:25
不打了?伊朗亮出最大底牌,特朗普签署总统令,美国进入紧急状态

不打了?伊朗亮出最大底牌,特朗普签署总统令,美国进入紧急状态

老搽学科普
2026-02-01 11:58:21
三重危机引爆皇马内乱:姆巴佩称在皇马彻底孤立无援!

三重危机引爆皇马内乱:姆巴佩称在皇马彻底孤立无援!

田先生篮球
2026-01-31 14:44:19
黄枫:黑龙江省原副省长,黑龙江省政协原副主席

黄枫:黑龙江省原副省长,黑龙江省政协原副主席

娱乐圈的笔娱君
2026-02-01 11:55:04
联盟重磅官宣!乔治被禁赛25场:球员本人已紧急发布道歉声明

联盟重磅官宣!乔治被禁赛25场:球员本人已紧急发布道歉声明

移动挡拆
2026-02-01 02:01:54
NBA科普:骑士如何引进詹姆斯?这笔操作远比你想象中复杂

NBA科普:骑士如何引进詹姆斯?这笔操作远比你想象中复杂

罗说NBA
2026-02-01 06:03:30
1972年,尼克松与江青的合影当中,身后长相清秀的女翻译,是谁?

1972年,尼克松与江青的合影当中,身后长相清秀的女翻译,是谁?

谈古论今历史有道
2026-02-01 11:50:03
男频系统剧现「名场面」!床戏观摩画春宫图,女女葡萄吻

男频系统剧现「名场面」!床戏观摩画春宫图,女女葡萄吻

新腕儿
2026-01-30 13:31:22
十年后还有春运吗?网友的分析太清醒了,最后一条戳中无数人

十年后还有春运吗?网友的分析太清醒了,最后一条戳中无数人

另子维爱读史
2026-01-31 20:06:08
医保不再报销!这10种常用药以后得自费,家家药箱都该自查

医保不再报销!这10种常用药以后得自费,家家药箱都该自查

老特有话说
2026-01-28 16:17:16
2026-02-01 13:40:49
新钛云服
新钛云服
云管理服务专家
458文章数 30关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

媒体:宝可梦十年间三次踩线 可不是简单的"工作失误"

头条要闻

媒体:宝可梦十年间三次踩线 可不是简单的"工作失误"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

本地
教育
艺术
数码
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

教育要闻

高二上学期结束了,英语只有20分怎么办?要如何才能提分?

艺术要闻

明代隐藏的“草书高手”,他的字无人能模仿

数码要闻

博西家电重构新年俗,让团圆不再被家务“捆绑”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版