网易首页 > 网易号 > 正文 申请入驻

客户之声|客如云上线 OceanBase 小记

0
分享至

当一家业务遍布全国各地的头部 SaaS 服务商未来要服务百万商家时,作为 IT 系统基石的数据库该如何考量和选择变得尤为重要。今天,我们特别邀请了资深 DBA 李国标来给大家讲述 客如云上线 OceanBase 的故事。
李国标:拥有多年金融及互联网数据库运维管理经验,近年来服务于餐饮及新零售,致力于满足百万商家数智化服务需求的资深 DBA。
客如云是餐饮、零售、美业等服务业商家的数字化系统 SaaS 服务商,服务全国几十万家商户,帮助商家实现数字化、智能化升级。对于 IT 系统来说,大量的商户意味着高并发和海量的数据生成,基于海量数据为客如云构建了多层级报表应用以充分挖掘数据价值为客户提供服务。
随着业务的进一步发展,客如云开启了数据库新方案的寻路之旅。
为什么需要新方案
我们就海量数据的存储实践上,主要有以下三点原因:
海量数据逼近单实例存储上限
客如云的报表一级库在去年年底已用 85TB 空间,虽说会定期清理两年前的数据,但随着业务量的逐步增长,在不久的将来,两年的业务数据超过现用数据库的单库存储上限是必然事件,需要提前规划处理。更换存储引擎使用压缩可明显减少所需存储空间,查询/写入性能的衰减却是业务不能接受的,寻求全新的解决方案被提上日程。
降本增效是要求也是趋势
多个报表类业务的数据库在存储空间上都已经超过20TB,数据量还在以每月TB级别不断增长,也就导致了在数据存储上的高昂花费,且需不断的提高投入。
报表查询性能有待提高
既有数据库整体上对查询/写请求的处理表现良好且稳定,不过对于少量的报表类聚合查询,平均响应时间达秒甚更,尤其是某些查询不返回数据本应快速结束时,反执了超预期的时间,这个瑕疵影响服务质量的进步提升。
对新方案的预期
对于待选的新数据库,如果为了降低成本而影响了应用的服务质量,从业务的角度考量这是不能接受的;如果在解决面临问题的同时导致成本进一步升高,那么方案也不完美,客如云需要一个“鱼和熊掌兼得”的方案:
写入性能稳定
订单库数据流式处理后实时写入报表库,业务高峰期流量很大,写入延迟会导致消息积压进而影响服务质量,因此要求新方案在写入性能上不能低于现有的表现。
查询性能提升
对于少量的报表慢查询(执行时间>1s),新方案的表现应优于现状,在业务不断发展流量进一步增加的情况下,每日的慢查询数量低于当前数字。
综合成本降低
在业务需求被满足的同时,新方案的综合成本应有明显降低(≥20%),契合集团和公司的整体战略。
为什么选择 OceanBase
通过和 OceanBase 技术团队的深入沟通,了解到 OceanBase 微块级别编码+压缩的特点对于缓解存储压力会有明显帮助,同时在读写性能和数据压缩比之间做了很好的平衡,也能确保满足业务需求。
从实际场景出发,客如云进行了大量的验证工作,如下两项结果决定了最终选择:


单副本存储空间节省 80%
测试中客如云挑选了一级库中两张大表对比迁移前后的存储空间占用:
报表慢查询性能显著提高
抽取慢 SQL 报表中的常见查询对比执行情况:


*注:结果一致率低于100%是因为未排序列在不同数据库上输出顺序不一致
如何不停机迁移
流式业务在线实现数据库的切换,经过和 OceanBase 解决方案架构师以及内部相关研发同学讨论后,通过如下四步实现了“开着飞机换引擎”:
OMS数据迁移
OMS 是 OceanBase 提供的数据迁移工具,支持多种异构数据存储和 OceanBase 间的全量迁移/增量迁移/全量校验/数据同步,迁移过程对源端库没有影响。
客如云先将源端数据以全量+增量方式迁移到 OceanBase,全量校验通过后,持续应用新生增量来保持和源数据库的数据一致。


*注:OMS 架构如上图
应用侧双写/停止OMS增量
业务研发调整代码新增连接 OceanBase 的数据源,将每次写入都转化为对源端和目标端的双写,开启后停止 OMS 任务的增量应用。
数据清理校验
由于开启双写和 OMS 增量停止应用之间有一个时间窗口,这期间对于目标端 OceanBase 来说其实写入操作进行了两次:首先是业务程序的写入,其次是 OMS 抓取到源端 binlog 后解析成对应的 SQL 语句并执行。
OMS 在增量应用的幂等性方面做了充分的考虑,绝大部分情况即使写入操作先后逻辑上重复执行也保证了数据一致,这里有一个特例是自增主键的新进数据,在不同的数据库上自增主键 ID 难以完全匹配,因此业务团队也编写了脚本基于业务逻辑校验/删除窗口期的重复数据并持续校验每天的数据。
切流
双写持续一段时间确认没有问题后,修改应用侧数据源到仅有 OceanBase,应用重启后完成切流上线。
使用 OceanBase 的收益
情理之中
报表一级库 85 TB 数据在迁移到 OceanBase 后只用了 14 TB 存储空间,不仅使存量数据所需空间大幅度减少,后续增量数据对新购空间的需求/压力也将同时降低;慢查询数据量减半;数据库成本下降 40%。
意料之外
大表上在线 DDL (主要是列添加)秒级完成,OceanBase 基于 LSM Tree 的存储架构和多版本 schema 管理让此类操作不再令人抓狂;索引的创建更快速,使用更灵活,曾经客如云调整 item info 表上的一个索引用了近 3 周的时间,在 OceanBase 上索引的创建默认并行执行,大表上索引的调整一天内即可搞定,同时借鉴 Oracle 的 invisible index 等特性,也让不同索引间的对比和选择特别方便。
产品建议/期待
分区表+全局索引场景持续优化
通过本次迁移实践,发现当分区表上有多个全局索引时 DML 操作的 CPU 消耗相比单表的情况还是有明显升高,全局索引是分区(分片)概念上的重要功能,因为业务逻辑要求下很难在分区表上只使用本地索引,单表又需面对难扩展的现实,内核层面对全局索引关于分区表上写入性能上进一步优化很有必要。期待 OceanBase 4.0 对此类场景的优化。
云上配套产品能力进一步完善
OceanBase 内核对支撑业务所提供的功能以及表现出来的性能都不错,云上配套产品如果参考阿里云 DAS 在一键诊断/ SQL 洞察等方面进行增强,使用体验会更好。
在降本提效的大背景下,OceanBase 的技术优势在合适场景为客户创造了价值,客如云也在积极寻找其余合适项目进行迁移,希望 OceanBase 产品能力进一步扩展和增强,在未来更多场景,可以带来更多可能。
后记(架构师感悟)
OceanBase 解决方案架构师孙鹏:为了保障迁移的顺利和上线后的稳定,前期充分的沟通探讨必不可少,在综合系统流量规律、读写分布、数据清理及流转需求等方面后力求最优方案。
客如云流量和数据量双高的应用特点对于 OceanBase 公有云上的产品配套是一次很好的检验和历练,经此一役,相关产品的能力得到验证,成熟度得以提高,为后续同类场景的迁移做好了准备。
高并发、大存储的 TP 场景本就是 OceanBase 的强势所在,3.X 版本在 HTAP 方向重点优化后,对应场景的实际表现也值得期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曝何超莲窦骁已分居!两人未进行婚姻登记,婚前婚后互动差距大

曝何超莲窦骁已分居!两人未进行婚姻登记,婚前婚后互动差距大

萌神木木
2024-04-25 20:29:53
病毒学家张永振事件新进展,范小红书记回应:赖着不走,强买强卖

病毒学家张永振事件新进展,范小红书记回应:赖着不走,强买强卖

育学笔谈
2024-04-30 12:20:23
没想到,问界车祸的第二波热闹又来了

没想到,问界车祸的第二波热闹又来了

清晖有墨
2024-04-30 11:41:44
江苏光伏巨头放假11个月,集体员工罢工

江苏光伏巨头放假11个月,集体员工罢工

光伏能源圈
2024-04-30 21:23:12
如此薅羊毛?大学生网购80套演出服,穿完集体退货,商家崩溃怒斥

如此薅羊毛?大学生网购80套演出服,穿完集体退货,商家崩溃怒斥

周老师谈教育
2024-04-30 15:05:45
杨幂:陪睡简直太正常了!进组几个月,大家都需要解决生理问题

杨幂:陪睡简直太正常了!进组几个月,大家都需要解决生理问题

娱乐圈酸柠檬
2024-04-30 18:20:01
曝哈姆大概率被解雇!詹姆斯计划再打两年:湖人愿直接选中布朗尼

曝哈姆大概率被解雇!詹姆斯计划再打两年:湖人愿直接选中布朗尼

罗说NBA
2024-04-30 13:47:44
拉法行动正式开始,平民开始撤离,以色列不等待,哈马斯彻底懵了

拉法行动正式开始,平民开始撤离,以色列不等待,哈马斯彻底懵了

山河路口
2024-04-30 20:27:35
观察|乌军前线局势严峻,俄军准备进攻哈尔科夫?

观察|乌军前线局势严峻,俄军准备进攻哈尔科夫?

澎湃新闻
2024-04-30 14:32:35
女子闯红灯拒不下车,被强制拉下,执勤民警遭处分,网友:该跪下求她?

女子闯红灯拒不下车,被强制拉下,执勤民警遭处分,网友:该跪下求她?

小萝卜丝
2024-04-30 19:04:33
欧冠太刺激了!拜仁大逆转:4分钟轰2球,从0-1到2-1,凯恩创历史

欧冠太刺激了!拜仁大逆转:4分钟轰2球,从0-1到2-1,凯恩创历史

侃球熊弟
2024-05-01 04:29:00
王嘉尔与大杨嫂风波升级!二人绯闻不断,大杨哥黑脸拍桌子回应

王嘉尔与大杨嫂风波升级!二人绯闻不断,大杨哥黑脸拍桌子回应

娱乐圈酸柠檬
2024-04-30 23:56:49
有性生活的人和没有性生活的人,竟有如此多不同,看完涨知识了

有性生活的人和没有性生活的人,竟有如此多不同,看完涨知识了

肿瘤的真相与误区
2024-04-28 19:43:36
政治局会议来了,13大要点!

政治局会议来了,13大要点!

成方街哨兵
2024-04-30 17:02:45
蔡英文赖清德被P成邪教头目,台当局扬言侦办,施正锋讽:怀念戒严时代了

蔡英文赖清德被P成邪教头目,台当局扬言侦办,施正锋讽:怀念戒严时代了

海峡导报社
2024-04-30 16:37:03
投资数十万的校园超市开业两天被迫停业?校方:因私下转让改变业态未报备

投资数十万的校园超市开业两天被迫停业?校方:因私下转让改变业态未报备

封面新闻
2024-04-30 10:39:29
英国突发!首相:震惊

英国突发!首相:震惊

环球时报新闻
2024-04-30 22:36:04
吴艳妮戴7件首饰参赛后续:总重量超1斤,首位戴电子表参赛运动员

吴艳妮戴7件首饰参赛后续:总重量超1斤,首位戴电子表参赛运动员

邮轮摄影师阿嗵
2024-05-01 00:33:15
慌了?华为版“微信”45亿次下载!微信:将适配“纯血鸿蒙”!

慌了?华为版“微信”45亿次下载!微信:将适配“纯血鸿蒙”!

黑马公社
2024-04-30 11:55:07
中企赴俄:抓住机会,但也不要忽视风控

中企赴俄:抓住机会,但也不要忽视风控

经济观察报
2024-04-30 22:15:20
2024-05-01 04:44:49
OceanBase数据库
OceanBase数据库
企业级原生分布式数据库
43文章数 0关注度
往期回顾 全部

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

媒体:余承东将卸任华为终端BG CEO

头条要闻

媒体:余承东将卸任华为终端BG CEO

体育要闻

两星闪耀二十冠徐州国米球迷会包下大荧幕,庆祝国米意甲20冠

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

时尚
旅游
教育
家居
公开课

岁月不败美人,姐姐们的50岁也太好看了

旅游要闻

五一大雨,浇灭了多少旅游城市的心气?

教育要闻

【因素地理】“主导因素”“限制性因素”和“主要区位因素”,最全的区位因素知识点总结

家居要闻

心之所栖 黑白灰色系打造设计专属感

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版