网易首页 > 网易号 > 正文 申请入驻

中间件实时监控,运维难题一站解决

0
分享至

中间件是介于操作系统和在其上运行的应用程序之间的软件,实现了分布式应用程序的通信和数据管理,用于协调不同的系统和组件之间的通信,是连接应用与底层资源直接的桥梁。因此,中间件的稳定与高可用对于整个业务系统的可靠性和性能至关重要。

北京智和信中间件监控运维方案通过对中间件的实时监控和编排运维,提高对中间件故障的感知、分析、解决能力,保障中间件持续稳定运行。

第1章 中间件监控范围与指标

智和信通方案通过构建对Tomcat、Jboss、WebLogic等中间件的关键指标的监控,实现对中间件性能和资源的实时追踪,识别并解决影响中间件性能的问题,保障中间件的高性能及高可用性,更全面地支撑业务及应用的稳定、持续运行,提升用户体验。

1.1.常见中间件监控模型及指标扩展

目前方案已实现对中间件包括Web中间件、数据库中间件、消息中间件、安全中间件、事务中间件、应用程序服务器中间件、分布式计算中间件等常见中间件的监控管理,涵盖的品牌包括Tomcat、Jboss、WebLogic、Nginx、Apache、RabbitMQ、Kafka、Redis、东方通、中创、宝蓝德、普元、金蝶天燕等国内外中间件。

同时采取用户自定义扩展中间件品牌、类型及其资源的方式,赋予用户强大的适配能力,其他中间件品牌也可通过灵活可配的模型库进行扩展适配,最大可能地实现对不同时期、不同品牌、不同型号中间件的管控;支持自定义中间件类型、中间件资源、故障监视器、性能监视器、TRAP监视器等。

1.2.常见中间件资源监测点和指标

本方案通过主动轮询和日志解析的方式对中间件的常见性能指标,如响应时间、吞吐量、JVM内存、执行线程、JDBC连接池、并发用户数等进行监控,同时除内置的常见指标外,其他资源和指标也可以通过模型库不断进行拓展。

第2章 中间件实时监控

通过建立全面的监控运维体系,北京智和信中间件监控运维方案实时监控中间件的各项关键性能指标,包括:CPU/内存使用率、实时‌流量/带宽、执行队列等。针对各类中间件特点深入监控其内部组件和整体运行状态,提升中间件可靠性,保障业务系统稳定运行。

2.1.自动发现中间件设备

智和信通具备独特的中间件自动发现技术,在网络可达范围内,仅需输入IP范围即可自动发现网络中的中间件及其他设备,识别中间件品牌、版本的信息,获取中间件内部资源,匹配故障与性能监视器,并自动发现中间件与其他设备的连接关系,生成可视化链路,通过可视拓扑动态展示中间件、链路的运行状态。

2.1.1.自动生成网络拓扑

方案以图形拓扑的形式展现中间件在网络中和其他设备间的拓扑关系,支持树形结构和平面结构的联动展示,也可以按片区、按地域、按层级等多种布局方式划分网络,在拓扑中以不同颜色图标、光效展现中间件的实时状态信息。

2.1.2.可视化展示中间件资源

在拓扑图的基础上,进一步展示中间件的内部细节,以图形方式展示中间件基础信息、CPU、内存、执行队列、线程池、JVM信息、连接池信息等关键指标,对中间件进行细化监控,实时告警,事前管理,降低故障发生率。

2.2.中间件性能态势感知

中间件的运行性能将直接影响业务系统的响应速度和稳定,同时定时监测中间件的相关性能情况,持续观测、多维管理,通过分析、展示中间件性能态势,实现对中间件设备的“可观、可管、可控”。

2.2.1.全面监控中间件性能

全面采集中间件的各项性能指标,如JVM堆栈利用率、JVM堆中内存、活动连接数、等待连接数、空闲连接数、执行线程总数、当前空闲执行线程数等,并可按照时间范围、资源类型、性能指标等多种维度,以图形、表格等多种形式进行展示。

2.2.2.实时、历史性能分析

对实时、历史性能数据进行统计分析,通过曲线图、柱状图或表格等形象化地展示,按天、星期、月查看性能指标变化。运维人员能随时把握中间件性能变化态势,防患于未然。

2.2.3.多中间件性能对比

支持选择多台中间件进行同维度性能数据分析,提供可视化性能对比视图,通过性能对比分析中间件性能变化趋势。

2.3.中间件自动巡检

可自定义中间件的巡检策略,预设时间自动执行中间件巡检,定期巡查中间件实时运行状态,并向指定邮箱发送结果报告,可自行选择要统计的中间件所属网络、中间件类型、中间件资源、中间件支撑的业务、中间件关联的链路等范围类型,生成巡检报表。

2.4.日志与事件管理

接收中间件主动发送如连接池泄露、连接失败、内存泄漏、线程死锁、创建连接失败、连接池已满、连接数据库超时、锁超时、服务器无响应等事件与日志消息,集中存储、解析处理后,将错误、告警、攻击行为等异常信息及时地通知用户。通过统一界面集中管理事件与日志,提高其完整性和可追溯性,帮助用户快速定位问题并采取相应的解决措施。

2.5.故障告警与智能收敛

搭载多种告警机制,自定义配置告警阈值,具备主动的故障监控功能,从众多的事件和状态中,系统地将零散的状态信息,总结成为当前状态,并对异常状态进行告警,第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位产生告警的中间件,提升告警处理效率,极大降低因中间件故障带来的损失。

告警管理采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告降噪机制,通过AI算法,对各类告警进行自动压缩收敛,减少90%的无效告警,抑制告警风暴,有效避免误报和漏报,直达故障根因。

第3章 中间件承载的业务状态拨测

针对中间件所支撑的业务应用性能与用户体验进行检测分析,无需安装插件就可以为用户提供开箱即用的企业级主动拨测式业务监测。以拓扑形式展示每个业务流程中的每台相关设备,支持设备逻辑视图和面板视图,展示业务流程中涉及的所有的设备之间的链路关系,流程方向。

构建包含各业务整体流程的调用依赖关系图谱,展示业务部署中网络设备间多维度关系拓扑。对从业务的前台受理到真正完成的整个业务流程所依赖的业务应用、中间件、中间件、中间件、操作系统等进行实时监控分析,呈现业务各节点的实时运行状态,包括用户体验、节点可用性、节点负载等状态信息,快速定位业务瓶颈根因,并可根据用户自愈策略,触发自动运维实现故障自愈。

第4章 统计报表和大屏展示

通过定义中间件相关数据报表的能力,实现中间件性能和状态的灵活展现和统计分析,通过对比、TOPN等分析方式并结合报表排序规则、过滤规则等能力,周期自动生成报表,帮助用户更好地了解中间件的各项负载情况和运行态势,为优化资源配置和性能调整提供依据。

通过大屏展示核心运维数据态势,细粒度可达网络中中间件、中间件资源和链路。所有的网络故障与性能瓶颈都一目了然地呈现,大大降低了管理成本,同时也提高了运维人员处理故障的能力,节省的故障处理时间,为运维人员管理网络提供了可靠的保证。

第5章 中间件远程控制和编排式配置

方案提供中间件远程控制的能力,采用“监控+运维+控制”的方式,将不同类型、不同版本的中间件统一纳入控制管理。通过智能算法对中间件的资源配置进行智能动态调整,当中间件出现性能瓶颈时,自动调优资源配置,优化中间件运行环境,当中间件发生故障时,自动启动自愈机制,快速恢复中间件的正常运行。

5.1.中间件远程配置执行

将周期性、重复性、规律性的大量日常中间件配置工作,如启动/停止服务、定期备份中间件配置、修改JVM参数等运维工作,转化为依托于平台的自动执行工作流,实现对中间件的批量、定时自动化控制管理。

5.2.故障自愈以中间件离线重启为例

以中间件实时监控和日志、事件管理为基础,通过多指标聚合检测动态识别中间件异常,智能判断告警类型及级别,利用自动化故障诊断和修复能力,实现对中间件常规故障的自动处置,特殊告警触发升级与工单,最终实现故障恢复,减少人工干预,提高运维效率。

下面以中间件离线重启为例,介绍如何通过智和网管平台实现中间件故障自愈。

效果要求:当中间件掉线时,触发自动重启上线策略,恢复中间件运行。

第一步:将需要管理的中间件纳入平台进行监控,并设置中间件在线状态监视器,中间件离线进行告警。

第二步:进入安管模块的运维编排菜单,创建【中间件离线重启】策略。根据真实排障过程,通过进行策略节点拖拽编排的方式规划自愈流程。

第三步:配置触发方式。方式支持通过告警触发和通过时间触发两种方式进行,为实现故障自愈的效果,我们选择通过匹配告警的方式触发策略。选定触发设备,并以在线状态为监控指标,当出现掉线告警时,自动触发自愈策略。

编排流程配置完成后,中间件出现掉线告警时,立即触发中间件自动重启作业流,自动执行编排内的操作,对故障进行校验和处置。并在执行过程中,对每一步处置操作进行记录形成日志,确保有迹可循。

5.3.配置备份、对比与恢复

支持中间件配置的批量备份、下载、周期性备份、查看等,对中间件的多个备份文件进行对比。定期自动对中间件配置进行巡检备份,并可进行对比分析,为用户管理网络做出合理的建议提供数据支撑,支持进行已备份配置间的对比分析和针对性的配置恢复。

第6章 应用价值

北京智和信通为用户提供高可用的中间件监控运维与故障自愈方案,通过监控中间件的运行状态和日志,迅速发现并诊断出现的异常问题,并提供详细的故障信息,协助运维人员快速定位故障源头。更值得一提的是,借助于自动化运维编排能力,可对常见中间件故障实现自愈。这意味着在很多情况下,系统可以自动修复问题,而无需人工干预,极大地提高了运维效率和系统的稳定性。

平台的告警和通知机制非常灵活,在中间件运行出现特定阈值或异常时,立即通知运维人员,通过智能降噪机制,更准确地识别与定位关键异常,从而在对关联业务影响最小的情况下进行故障处置。通过定时捕获和大数据分析等技术,识别潜在的性能瓶颈,并通过IT资源的调整和优化提升中间件的响应速度,也保障了整个业务系统的流畅运行。

对中间件进行实时监控和管理的同时,方案兼顾对网络设备、服务器、数据库、应用等整个IT基础设施的立体监测,不仅支持多源数据的统一收集与处理,还提供了直观的监控仪表板和定制化报告功能,让运维人员能够迅速把握IT系统全局运行态势,做出精准决策。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全运会最新金牌榜:4队破100奖牌,山东50金霸榜,广东重返第二

全运会最新金牌榜:4队破100奖牌,山东50金霸榜,广东重返第二

知轩体育
2025-11-20 11:10:58
成都27岁女子家门口遇害案开庭,被告人此前曾携刀具敲门滋扰部分住户

成都27岁女子家门口遇害案开庭,被告人此前曾携刀具敲门滋扰部分住户

澎湃新闻
2025-11-20 16:04:27
莫言称:向日本投掷两颗原子弹,是不可饶恕的罪恶!

莫言称:向日本投掷两颗原子弹,是不可饶恕的罪恶!

雪中风车
2025-11-18 14:27:01
你别不信,大部分公公,都会趁儿子不在家的时候跟儿媳妇保持距离

你别不信,大部分公公,都会趁儿子不在家的时候跟儿媳妇保持距离

热心市民小黄
2025-11-19 00:26:51
数据!中国围棋2025年大丰收,除LG杯外,5场世界大赛,4场夺冠!

数据!中国围棋2025年大丰收,除LG杯外,5场世界大赛,4场夺冠!

L76号
2025-11-19 16:38:15
美专家:若中国武力统一台海,西方可能冻结中国海外3.2万亿资产

美专家:若中国武力统一台海,西方可能冻结中国海外3.2万亿资产

百态人间
2025-11-20 05:15:03
极度不要脸!

极度不要脸!

梳子姐
2025-11-20 15:41:19
突发!易梦玲和胡彦斌官宣恋情!

突发!易梦玲和胡彦斌官宣恋情!

嘻笑堂
2025-11-20 15:59:01
全网疯传的“天花板空姐”:美到窒息的五官,上帝造人也太偏心了

全网疯传的“天花板空姐”:美到窒息的五官,上帝造人也太偏心了

奥字侃剧
2025-10-06 09:59:24
排队2小时没进门!网友惊呆:有“一亿人”,挤爆了

排队2小时没进门!网友惊呆:有“一亿人”,挤爆了

河南交通广播1041
2025-11-16 17:19:21
异性之间,发现一个规律,男人长期对一个女人有感觉,无条件宠你,无非三种可能

异性之间,发现一个规律,男人长期对一个女人有感觉,无条件宠你,无非三种可能

LULU生活家
2025-11-15 17:52:52
钓鱼台国宾馆18号楼:需要什么资格才可以住进去

钓鱼台国宾馆18号楼:需要什么资格才可以住进去

贱议你读史
2025-11-19 15:20:43
不断挑战底线,凉凉不可避免!香港一步步失去了内地游客的市场!

不断挑战底线,凉凉不可避免!香港一步步失去了内地游客的市场!

青眼财经
2025-08-07 23:48:28
逆天了!全员涨薪!月薪不低于8000,深圳一工厂发布喜报引发关注

逆天了!全员涨薪!月薪不低于8000,深圳一工厂发布喜报引发关注

火山诗话
2025-11-20 09:04:44
被狂吹的西班牙王后穿搭:“大衣+露腿”违和,与大众无关

被狂吹的西班牙王后穿搭:“大衣+露腿”违和,与大众无关

述家娱记
2025-11-15 13:21:42
江湖梦10:康哥开心了

江湖梦10:康哥开心了

金昔说故事
2025-11-20 16:42:33
广州升温,就在今天!但是......

广州升温,就在今天!但是......

羊城攻略
2025-11-20 19:55:38
日本网友发现西北靶场卫星图,日本全境或为战场,解放军说话算话

日本网友发现西北靶场卫星图,日本全境或为战场,解放军说话算话

Ck的蜜糖
2025-11-18 09:12:32
李春平死了

李春平死了

霹雳炮
2025-11-05 22:34:23
文峰股份:公司副总经理秦国芬被立案调查并实施留置措施

文峰股份:公司副总经理秦国芬被立案调查并实施留置措施

界面新闻
2025-11-20 17:44:22
2025-11-21 01:04:49
智和信通一体化运维平台
智和信通一体化运维平台
智和网管平台SugarNMS
137文章数 0关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

游戏
家居
旅游
教育
手机

《闪避刺客》DLC“离奇的一天”G-STAR试玩报告:爽"/> 主站 商城 论坛 自运营 登录 注册 《闪避刺客》DLC“离奇的一天”G-STAR试玩报...

家居要闻

黑白极简 慵懒通透空间

旅游要闻

旅超大赛!金山主打“免费潮”,周末快来薅羊毛

教育要闻

家长怒斥:睡眠剥夺!初中生不早于8点到校,能否强制落地?官方回复了

手机要闻

档位最强!荣耀500官宣全系8000mAh青海湖大电池:抖音连刷31小时

无障碍浏览 进入关怀版