网易首页 > 网易号 > 正文 申请入驻

Loki日志全链路实战:从收集到告警的完整指南

0
分享至

新钛云服已累计为您分享836篇技术干货

01

为什么选择Loki ?

传统日志系统的痛点

  • 资源消耗高:ELK(Elasticsearch)需要为全文检索建立复杂索引,存储成本飙升,官方数据是通常可以将数据压缩20%~30%,实测下来在某些场景下可以达到50%,使用DEFLATE压缩算法,最低可以降低超过70%

  • 云原生适配差:Kubernetes动态环境下的日志标签管理困难


Loki的核心优势

  • 轻量级设计:仅索引元数据(标签),有近10倍的压缩比,5G数据输入存储实际增长0.5G。

  • 无缝集成:原生支持Prometheus生态,原生集成grafana,支持集群本身监控告警和日志监控告警。

  • 动态标签:完美适配Kubernetes Pod/Node等动态资源标签

02

Loki架构解析

核心组件与数据流

Loki则采用了分布式架构,将日志数据存储在多个节点上,Promtail进行日志收集,可视化依赖于Grafana。


关键概念解析

03

部 署

环境准备

  • 硬件建议:

    • 生产环境:至少3节点集群(每个节点4核8GB+)

    • 存储:优先选择SSD + S3兼容存储(MinIO)

  • 版本选择:

推荐使用v2.8+版本
helm repo add grafana https://grafana.github.io/helm-charts
helm repo update


Kubernetes集群部署

使用Helm部署Loki Stack(包含Promtail)
helm upgrade --install loki grafana/loki-stack \
  --set promtail.enabled=true \
  --set loki.persistence.enabled=true \
  --set loki.persistence.size=100Gi


Promtail配置示例

#promtail-config.yaml
server:
  http_listen_port: 9080

positions:
  filename: /tmp/positions.yaml

clients:
url: http://loki:3100/loki/api/v1/push

scrape_configs:
job_name: kubernetes
kubernetes_sd_configs:
role: pod
  pipeline_stages:
docker: {}
  relabel_configs:
source_labels: [__meta_kubernetes_pod_label_app]
  target_label: app

04

告警集成

grafana告警规则配置

05

性能优化与分析实践

存储优化技巧

#loki-config.yaml 优化片段
schema_config:
  configs:
    - from: 2023-01-01
      store: boltdb-shipper
      object_store: s3
      schema: v11
      index:
        prefix: index_
        period: 24h

chunk_store_config:
  max_look_back_period: 720h # 日志保留30天


日志查询和分析


  1. 首先,指定 查询文件 filename="/usr/local/nginx/logs/loki-error.log"

  2. 然后,通过json的方式

  3. 最后,设置条件选择,比如status=500、server_name=test.com


查询加速策略

  1. 预过滤标签


#先通过精确标签缩小范围
{cluster="aws", pod=~"frontend-.+"} |= "timeout"


  1. 避免全文本扫描:优先使用|=(包含)而非|~(正则)

06

真实场景案例

案例1:nginx5xx日志收集

重新编译nginx

#上传安装包
nginx-1.25.3.tar.gz、ngx_http_geoip2_module-3.4.tar.gz、libmaxminddb-1.9.1.tar.gz、GeoLite2-City.mmdb、GeoLite2-Country.mmdb

#nginx重新编译
./configure --prefix=/usr/local/nginx --with-compat --with-file-aio --with-threads --with-http_addition_module --with-http_auth_request_module --with-http_dav_module --with-http_flv_module --with-http_gunzip_module --with-http_gzip_static_module --with-http_mp4_module --with-http_random_index_module --with-http_realip_module --with-http_secure_link_module --with-http_slice_module --with-http_ssl_module --with-http_stub_status_module --with-http_sub_module --with-http_v2_module --with-mail --with-mail_ssl_module --with-stream --with-stream_realip_module --with-stream_ssl_module --with-stream_ssl_preread_module --with-cc-opt='-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector-strong --param=ssp-buffer-size=4 -grecord-gcc-switches -m64 -mtune=generic -fPIC' --with-ld-opt='-Wl,-z,relro -Wl,-z,now -pie' --add-dynamic-module=/root/nginx/ngx_http_geoip2_module-3.4 


修改日志格式

load_module modules/ngx_http_geoip2_module.so;
#修改日志格式
  log_format json_analytics escape=json '{'
                    '"msec": "$msec", ' 
                    '"connection": "$connection", '
                    '"connection_requests": "$connection_requests", ' 
                    '"http_referer": "$http_referer", '
                    '"http_user_agent": "$http_user_agent", ' 
                    '"request_method": "$request_method", '
                    '"server_protocol": "$server_protocol", '
                    '"status": "$status", '
                    '"pipe": "$pipe", ' 
                    '"server_name": "$server_name", '
                    '"request_time": "$request_time", ' 
                    '"gzip_ratio": "$gzip_ratio", '
                    '"http_cf_ray": "$http_cf_ray",'
                    '"geoip_country_code": "$geoip2_data_country_code",'
                    '"geoip2_city_name_en": "$geoip2_city_name_en", '
                    '"geoip2_city_name_cn": "$geoip2_city_name_cn", '
                    '"geoip2_longitude": "$geoip2_longitude", '
                    '"geoip2_latitude": "$geoip2_latitude"'
                    '}';
    map $http_x_forwarded_for $real_ip {
        default "";
        "~^(?P \d+\.\d+\.\d+\.\d+)"  $ip;
        "~^(?P \d+\.\d+\.\d+\.\d+),.*"  $ip;
    }
#指定日志的位置,会放在nginx目录下
    map $status $log_path {
        ~^4       /logs/loki-error.log;
        ~^5       /logs/loki-error.log;
        default   /logs/access.log;
    }
    geoip2 /usr/local/nginx/modules/GeoLite2-Country.mmdb {
        auto_reload 5m;
        $geoip2_metadata_country_build metadata build_epoch;
        $geoip2_data_country_code source=$real_ip country iso_code;
        $geoip2_data_country_name country names zh-CN;
    }

    geoip2 /usr/local/nginx/modules/GeoLite2-City.mmdb {
         $geoip2_city_name_en source=$real_ip city names en;
         $geoip2_city_name_cn source=$real_ip city names zh-CN;
         $geoip2_longitude source=$real_ip location longitude ;
         $geoip2_latitude source=$real_ip location latitude ;
    }
    fastcgi_param COUNTRY_CODE $geoip2_data_country_code;
    fastcgi_param COUNTRY_NAME $geoip2_data_country_name;
    fastcgi_param CITY_NAME    $geoip2_city_name_cn;    check interval=3000 rise=2 fall=5 timeout=1000 type=tcp;
    check_http_send "HEAD /health/check/status HTTP/1.0\r\n\r\n";
    check_http_expect_alive http_2xx http_3xx;


配置promtail收集

cat << EOF >> /data/promtail/config.yaml
server:
  http_listen_port: 9080
  grpc_listen_port: 0

positions:
  filename: /tmp/positions.yaml

clients:
url: http://192.168.119.191:3100/loki/api/v1/push

scrape_configs:
job_name: nginx
static_configs:
targets:
localhost
    labels:
    job: nginx
    host: $host
    agent: promtail
    path    : /usr/local/nginx/logs/loki-error.log
EOF


结合grafana呈现效果


案例2:数据库慢查询收集

配置promtail收集

cat config.yaml 
server:
  http_listen_port: 9080
  grpc_listen_port: 0
positions:
  filename: /tmp/positions.yaml
clients:
url: http://192.168.119.191:3100/loki/api/v1/push
scrape_configs:
    - job_name: mysql-slowlogs
      static_configs:
        - labels:
            instance: usa4-rds03-slave
            projectname: chat
            job: mysql
            __path__: /database/mysql/1266/mysql-slow.log
      pipeline_stages:
        - multiline:
              firstline: '#\sTime:.'
        - regex:
*              expression: '#\s*Time:\s*(?P .*)\n#\s * User @Host:\s *( ? P [ ^\[] +) .*@\s *( ? P .*]) .*** Id:\s ***( ? P \d +)\n#\s * Query_time:\s *( ? P \d +\.\d +)\s * Lock_time:\s *( ? P \d +\.\d +)\s * Rows_sent:\s *( ? P \d +)\s * Rows_examined:\s *( ? P \d +)\n( ? P ( ?s: .*))$'
        - labels:
            timestamp:
            user:
            host:
            id:
            query_time:
            lock_time:
            rows_sent:
            rows_examined:
            query:
        - drop:
            expression: "^ *$"
            drop_counter_reason: "drop empty lines"


结合grafana呈现效果

07

总 结

总体而言,Loki相对轻量级,具有较高的可扩展性和简化的存储架构,但需要额外的组件,Loki使用的是自己的查询语言LokiQL,有一定的学习曲线。若是数据量适中,数据属于时序类,如应用程序日志和基础设施指标,并且应用使用kubernetes Pod形式部署,则选择Loki比较合适。

Loki正在成为云原生时代日志管理的标准解决方案,其与以下技术的整合值得关注:

  • OpenTelemetry:统一日志、指标、追踪的采集标准

  • WALWrite-Ahead Logging:提升高吞吐场景下的可靠性

  • 边缘计算:轻量级特性适合IoT设备日志收集

如有相关问题,请在文章后面给小编留言,小编安排作者第一时间和您联系,为您答疑解惑。

附录

参考文章:

https://www.ctyun.cn/developer/article/418138645577797

http://cloud.tencent.com/developer/article/2241079

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
谢婷婷带混血儿子返港,机舱内晒出儿子正面照,眉眼神态酷似生父

谢婷婷带混血儿子返港,机舱内晒出儿子正面照,眉眼神态酷似生父

TVB的四小花
2026-04-16 17:58:56
发生了什么?中资油轮好不容易穿越霍尔木兹海峡,却又折返?

发生了什么?中资油轮好不容易穿越霍尔木兹海峡,却又折返?

兵国大事
2026-04-15 17:19:41
Q女士直播爆更多内幕!态度大变,继续硬刚张婉婷,甩锅给宋宁峰

Q女士直播爆更多内幕!态度大变,继续硬刚张婉婷,甩锅给宋宁峰

舍长阿爷谈事
2026-04-17 04:22:21
深度 | 算力租赁全产业链,10 大核心关联公司

深度 | 算力租赁全产业链,10 大核心关联公司

飞跑的鹿
2026-04-16 20:07:20
深圳官方最新回应:已开始定损

深圳官方最新回应:已开始定损

南方都市报
2026-04-16 19:43:32
脑机接口,疯狂吸金

脑机接口,疯狂吸金

赛柏蓝
2026-04-16 17:20:12
足坛一夜动态:维拉7-1!欧联四强英超德比 梅西收购西班牙球队

足坛一夜动态:维拉7-1!欧联四强英超德比 梅西收购西班牙球队

念洲
2026-04-17 06:07:38
NBA官宣!东契奇和坎宁安申诉成功!爱德华兹失去评奖资格

NBA官宣!东契奇和坎宁安申诉成功!爱德华兹失去评奖资格

篮球教学论坛
2026-04-17 01:06:53
五一调休引众怒:看似放5天,其实只放1天,何必呢?

五一调休引众怒:看似放5天,其实只放1天,何必呢?

爱下厨的阿酾
2026-04-17 02:32:18
三天闪电访华!苏林急得直跺脚,东南亚集体掉头靠向中国

三天闪电访华!苏林急得直跺脚,东南亚集体掉头靠向中国

瓦伦西亚月亮
2026-04-16 18:51:44
真半价理想/问界!零跑D19发布!21.98万起,这价格太猛了!

真半价理想/问界!零跑D19发布!21.98万起,这价格太猛了!

新浪财经
2026-04-16 22:06:53
NBA传闻:东契奇和坎宁安事件后,球员工会希望修改65场规则

NBA传闻:东契奇和坎宁安事件后,球员工会希望修改65场规则

好火子
2026-04-17 05:44:24
零涂层电饭煲降价42%:松下这次押对了什么

零涂层电饭煲降价42%:松下这次押对了什么

我是一个粉刷匠2
2026-04-16 15:15:17
小舅子买了新车请全家吃饭,我特意没带手机!到结账时他说你请客

小舅子买了新车请全家吃饭,我特意没带手机!到结账时他说你请客

奶茶麦子
2026-04-16 16:43:10
周继红出手了!跳水队大换血,2人上桌2人下桌,全红婵陈芋汐在列

周继红出手了!跳水队大换血,2人上桌2人下桌,全红婵陈芋汐在列

阿纂看事
2026-04-16 14:04:03
45岁谢霆锋盯紧25岁欧阳娜娜,全网对溢出屏幕的情侣感疯狂尖叫!

45岁谢霆锋盯紧25岁欧阳娜娜,全网对溢出屏幕的情侣感疯狂尖叫!

陈意小可爱
2026-04-16 15:14:10
欧冠出局 79岁佛爷安抚全队!皇马换帅势在必行:两人候选

欧冠出局 79岁佛爷安抚全队!皇马换帅势在必行:两人候选

叶青足球世界
2026-04-16 09:19:39
美职篮球员脚下踩的不再全是“美国制造”,NBA迎来“中国主场”

美职篮球员脚下踩的不再全是“美国制造”,NBA迎来“中国主场”

新浪财经
2026-04-17 06:26:21
9换1史诗级交易!附加赛最大赢家出现,却不是勇士

9换1史诗级交易!附加赛最大赢家出现,却不是勇士

毒舌NBA
2026-04-16 18:38:39
全新宝马 X5 国内曝光,“绝美颜值”很帅气!

全新宝马 X5 国内曝光,“绝美颜值”很帅气!

新浪财经
2026-04-14 18:56:49
2026-04-17 07:24:49
新钛云服
新钛云服
云管理服务专家
466文章数 30关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:伊朗已同意几乎所有要求

头条要闻

特朗普:伊朗已同意几乎所有要求

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

手机
本地
健康
教育
数码

手机要闻

OPPO Find X10:8000mAh超大电池+双2亿影像,中屏机皇实锤!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

干细胞抗衰4大误区,90%的人都中招

教育要闻

牛剑之外,近十年从未降低过门槛的三所英国大学!

数码要闻

荣耀史上最短发布会,发布荣耀史上最强MagicBook数字系列

无障碍浏览 进入关怀版