网易首页 > 网易号 > 正文 申请入驻

Bonree ONE 技术带动「新质」可观测

0
分享至

2024年4月25日,博睿数据 Bonree ONE 2024 春季正式版焕新发布,以全息观测、体验至上、轻锐交付三项特性开启智能运维新篇章。点击文末“阅读原文”,立即申请试用。

作者|博睿数据数智能力中心负责人-太道

随着数字化转型的深入,企业对于IT系统的可观测性提出了更高的要求。可观测性不仅关乎系统的稳定性和安全性,更是企业决策和运营效率的重要保障。Bonree ONE作为国内领先的一体化智能可观测平台,本次春季版的发布,在新一代技术变革中为生产力升级保驾护航,后台三板斧(高效能架构、高技术引擎、高质量数据)让可观测更“新质”。

高效能架构

架构是IT系统的骨架,决定了系统的稳定性和扩展性。高效能架构需要具备轻量化、高可用和易维护性,以适应不断变化的业务需求和技术环境。Bonree ONE在本次春季版中从以下几个方面做了技术上的提升。

1. 多地多中心

Bonree ONE平台支持异地多活的高可用架构。一般在金融或其他重要业务领域中,客户业务数据分布在多城市多数据中心(DC),同时对可观测性平台也是一样的能力要求。具体需要可观测平台具备数据本地存储(避免过多占用跨地带宽),多数据中心资源可以全局统一管理但权限又可以灵活,并且调用链要包含完整的跨数据中心的调用过程和详情。这对万亿级以上数据平台的技术挑战极大。Bonree ONE技术底座实现了数据本地化存储,在ClickHouse集群存储层实现分布式表,本地先计算一次后再聚合数据分析结果(当然,里面有很多技术细节的考虑),并通过OneService的统一联邦数据服务建立全局数据地图和动态路由,做到了跨地跨中心计算,既做到了数据分开存,也做到了可以全局分析,还做到了任一节点的服务高可用和数据高可用。例如我们的四地八中心底层架构:

2. 存储瘦身

早期时候,调用链、会话、日志的数据存到了Elasticsearch。我们历史架构如下图,大数据团队需要维护多种存储。比如,告警业务A说要做AI训练,就得自己加工一份时序数据到HDFS,指标中心业务B说加工指标,就自己加工一条链路到ClickHouse,DEM业务C想做会话分析,APM业务D又想做调用链分析,日志业务E还想做日志分析,那么业务C、D、E就分别加工各自数据到ES,这就导致完全各自业务各自加工存储。这样烟囱式的发展到一定程度后,数据不好管理,资源浪费严重,并且各业务之间数据很难做关联式的统计和分析(比如用户的网络请求和后端调用链关联的多端打通场景),产品迭代越来越重。

在IT架构中,只要组件多、存储重,很多问题就会暴露。为了彻底解决数据底层割裂、资源成本、性能、稳定性等问题,本次Bonree ONE春季版将所有信号数据全部迁移到了ClickHouse中,彻底下线了ES。

经过本次 Bonree ONE架构瘦身治理和全面技术优化,博睿数据公有云千亿数据量的集群,下线了所有ES机器24台(16C32G配置),扩容了10台CK,节省了58%机器成本。如果从资源占用比例看,收益更大:

3. ZooKeeper瘦身

众所周知,大数据很多开源引擎都用ZooKeeper做分布式协调和数据同步。作为ClickHouse大数据底座,我们原先架构也是用默认的用ZooKeeper去做数据管理。但随着数据量和数据种类不断扩充的情况下,ClickHouse集群对于ZooKeeper的压力越来越大。例如在基于实时性要求高的告警数据入库查询时,数据查询的实时性要求秒级返回,ZooKeeper会出现性能瓶颈(比如一套ZK集群最多支持5个shard),资源占用和维护成本非常高,还经常出现fullgc和zxid溢出的故障发生。显然,我们把调用链数据和日志数据迁移到ClickHouse后,原有ZK方案明显支持不住,如下图,看层次就非常复杂,20个shard需要5套ZK集群,每套ZK又有三个实例,在扩容和安装升级过程中,一步都不能错,否则就容易出问题。

本次 Bonree ONE 春季版中做了架构升级,我们把ClickHouse的ZK替换成了固定一套ClickHouse-Keeper的方案,同时从技术解决了多套转一套、ZK加密鉴权

的问题。如下图,从层次看就很精简了:

4. 安装包瘦身

在私有化安装包瘦身方面,我们技术也一直追求极致,所谓“加能力不加体积!小u盘就代表实力!”。经过一年的努力,我们安装包在依赖包精简、dockerfile镜像合并压缩、程序包精简、基础镜像瘦身等方面都做了相关治理和改造,从早期的11GB降到了本次发布的5GB左右,里面已经装进了全部可观测性的技能包(数字体验、指标分析、调用链、日志、全局拓扑、仪表盘、AI、告警,等等)。

高技术引擎

本次Bonree ONE春季版发布,技术亮剑出三大核心引擎(AI、OneService、ClickHouse)。就比如汽车,AI更像方向盘,能感知全域信号上下文,通过关系挖掘、文本挖掘、因果挖掘辅助动态的决策;OneService作为联邦引擎屏蔽了底层存储,并且从查询统一了标准SQL,提供核心腰部力量,更像传动轴;ClickHouse作为信号一体化湖仓底座,让Bonree ONE真正成为融合式平台,这跟传统的拼凑型产品有着质的区别。

1. AI引擎 - SwiftAI

SwiftAI作为 Bonree ONE 的AI核心引擎,本次从算法层面优化了自适应异常检测,自动按日和周级别聚类并满足不同场景分而治之,f1-score提高到了0.88,并和自研的混沌工程平台打通做可解释性验证和分析。根因分析方面,发布了新一代的融合式AI能力,跟数据集成自动化打通,做到了集成即AI,不用再额外定制化配置流程或开发,能自动和zabbix/promethus/skywalking/pinpoint等多源数据融合自动做根因,为用户带来了“1+1>2”的卓越体验;另一方面,根因算法做了进一步优化,从空间和时间算法上都做了调整,提高了收敛和根因的准确性。

2. 联邦引擎 - OneService

OneService作为Bonree ONE的联邦引擎,实现了多源异构数据联邦计算的能力,统一了标准SQL查询,比如同时联查MySQL和ClickHouse。同时底层能力先支持了实体属性和标签分析的能力,这个相比业内比较领先。有了OneService引擎后,业务团队不再担忧各种信创适配的排期成本,主要工作由一个团队轻量级完成即可,这样可以更好更快的支持业务新创需求。

3. 存储底座-ClickHouse

在ClickHouse引擎优化方面,从读写优化到内核二开,从高可用到运维管理自动化工具都做了大量工作。我们早期开始用社区版ClickHouse时,平台承载力大概在85探针/台,如今已经可以支持到200+探针/台了,得益于不畏挑战的技术精神。

高质量数据
Bonree ONE是可观测平台,能力不断迭代,功能不断增多,要想做到加码不加价,同时还需要持续做数据治理。我们会针对各种数据疑难问题做单独的技术优化和治理。比如在调用链业务场景,千亿级数据量做维度排序,我们用分位特征算法将数据量扫描缩小1000倍,查询性能从分钟级降到ms级。

再比如,网络请求首页优化,通过projection技术,优化后页面从5s访问耗时降到了ms级。

写在最后
技术经过不断迭代,目前Bonree ONE平台页面的访问耗时,历史上首次做到了P99在3s以内。从Bonree ONE经历了几个大版本的正式发布来看,组件和安装包瘦身不断降到一半,但性能提升数倍。Bonree ONE在技术方面的深耕,也得到了ClickHouse社区的认可,已收到邀请发表相关文章和meetup演讲。静水深流,技术永无止境为业务保驾护航。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重拳整治网络售假等乱象 市场监管总局打出“组合拳”

重拳整治网络售假等乱象 市场监管总局打出“组合拳”

第一财经资讯
2026-03-21 10:46:11
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
一年流出视频294部的小宝到底探过多少朵花?

一年流出视频294部的小宝到底探过多少朵花?

挪威森林
2026-01-25 17:18:42
华人团队解散,印度天才入职!马斯克承认xAI的技术路线走错了

华人团队解散,印度天才入职!马斯克承认xAI的技术路线走错了

书纪文谭
2026-03-17 15:03:58
2-0!恭喜郑钦文,轰7记ACE球,重回中国金花一姐,下轮对手曝光

2-0!恭喜郑钦文,轰7记ACE球,重回中国金花一姐,下轮对手曝光

体育就你秀
2026-03-22 06:30:26
混音队教练:我们经常把杨瀚森当作进攻轴心,由他来组织策应

混音队教练:我们经常把杨瀚森当作进攻轴心,由他来组织策应

懂球帝
2026-03-22 12:37:08
离那些张口闭口不离宏大叙事的人远点

离那些张口闭口不离宏大叙事的人远点

廖保平
2026-03-20 10:14:56
“原价30元,现价1600元”,退市近两年的头孢遭疯抢,是谁在炒作?

“原价30元,现价1600元”,退市近两年的头孢遭疯抢,是谁在炒作?

闪电新闻
2026-03-22 10:53:40
美日已签字,高市登机回国,临走前喊话中国,对华豪赌正式开始

美日已签字,高市登机回国,临走前喊话中国,对华豪赌正式开始

冒泡泡的鱼儿
2026-03-22 19:29:26
泰山刚惨败玉昆!韩鹏赛后就在更衣室做出重要决定,宿茂臻已确认

泰山刚惨败玉昆!韩鹏赛后就在更衣室做出重要决定,宿茂臻已确认

舟望停云
2026-03-22 13:43:12
撑杆跳大魔王秘密领证!遭熟人疯狂剧透,本人无奈回应

撑杆跳大魔王秘密领证!遭熟人疯狂剧透,本人无奈回应

仰卧撑FTUer
2026-03-22 08:41:02
两大迹象表明,台海战争可能会爆发!美国可不要犯历史错误!

两大迹象表明,台海战争可能会爆发!美国可不要犯历史错误!

雅儿姐在遛弯
2026-03-18 12:45:08
中核集团聚变领域首席科学家段旭如:聚变发电商业化时间表明确,2045年左右建成示范堆

中核集团聚变领域首席科学家段旭如:聚变发电商业化时间表明确,2045年左右建成示范堆

经济观察报
2026-03-20 19:16:10
966.56万吨!四川发现世界第二大轻稀土矿

966.56万吨!四川发现世界第二大轻稀土矿

财联社
2026-03-22 11:43:15
“姐,我下周结婚,把姐夫买的新房让给我”姐姐:滚,想都别想

“姐,我下周结婚,把姐夫买的新房让给我”姐姐:滚,想都别想

多久情感
2026-03-21 19:26:00
美国财长在巴黎坐不住了,966万吨稀土+3722万吨重晶石意味着什么

美国财长在巴黎坐不住了,966万吨稀土+3722万吨重晶石意味着什么

史智文道
2026-03-22 14:47:39
粟裕全歼张灵甫74师,毛主席听完战报沉默半晌:连我都没料到他敢这么打

粟裕全歼张灵甫74师,毛主席听完战报沉默半晌:连我都没料到他敢这么打

史海孤雁
2026-03-18 18:18:12
香港高薪“抢医生”:入门月薪7万港元起,年薪轻松过百万

香港高薪“抢医生”:入门月薪7万港元起,年薪轻松过百万

第一财经资讯
2026-03-21 19:44:46
特朗普一语惊人:虽然中国的船造的多,但美国在两个方面遥遥领先

特朗普一语惊人:虽然中国的船造的多,但美国在两个方面遥遥领先

近史博览
2026-03-22 19:33:02
中国动了,朝鲜动了,韩国动了!全世界看清:高市早苗到底在怕啥

中国动了,朝鲜动了,韩国动了!全世界看清:高市早苗到底在怕啥

音乐时光的娱乐
2026-03-22 16:55:01
2026-03-22 22:28:49
博睿数据
博睿数据
AI驱动的全球智能可观测性领导者,蝉联中国应用性能管理及可观测性APMO市场份额第一。
478文章数 14关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

以色列防空神话被击穿损失惨重核圈失守 伊朗表态

头条要闻

以色列防空神话被击穿损失惨重核圈失守 伊朗表态

体育要闻

郑钦文连续迎战大满贯冠军 “双教练”团队正式亮相

娱乐要闻

今晚首播!央视年代剧《冬去春来》来了

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

教育
游戏
家居
旅游
公开课

教育要闻

地理模型的制作

《生化危机》30周年!卡普空高管发表寄语

家居要闻

时空交织 空间绮梦

旅游要闻

130万人次打卡!北京市属公园花海刷屏,周末游园热度拉满

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版