网易首页 > 网易号 > 正文 申请入驻

Ceph RocksDB 性能改进说明

0
分享至


新钛云服已累计为您分享792篇技术干货


关于Ceph的RocksDB的性能优化,并没有什么特别好的方式。但本文会给出⼀个比较好的改进方式:如果你使用的是上游 Ceph Ubuntu 软件包,那么改进会变的更简单些。

简单说明

Mark Nelson 发现,在合并Pull request (PR) 之前,构建过程没有正确地将CMAKE_BUILD_TYPE选项 传递给由Ceph构建的外部项目(在本例中为 RocksDB)。

此之前,软件包使用RelWithDebInfo构建,以构建 "performance"发布包。虽然尚未得到验证,但自Luminous 发布以来,上游Ceph Ubuntu软件包有可能都受到了影响。在不使用RelWithDebInfo的情况下,RocksDB的性能达不到最佳。

这可以通过安装 "peformance "软 件包来缓解。实际的性能提升取决于集群,但 RocksDB 压缩会降低 3 倍。在某些情况下,随机4K写入性能会提高一倍。

参见链接 :

https://bugs.gentoo.org/733316

https://ceph.io/en/news/blog/202 4/ceph-a-journey-to-1tibps/

该如何解决这个性能问题?

  1. 对于您正在运行的版本,安装已解决此问题的版本:Pacific、Quincy、Reef。

  2. 如果您正在运行Ceph 的 EOL 版本,您可以自己构建它。请参阅文档或下面的简短版本。

git clone [ceph](https://github.com/ceph/ceph.git)cd cephgit checkout vYour_Release_Verionadd "extraopts += -DCMAKE_BUILD_TYPE=RelWithDebInfo" to debian/rules file./do_cmake.sh -DCMAKE_BUILD_TYPE=RelWithDebInfodpkg-buildpackage -us -uc -j$DOUBLE_NUMBER_OF_CORES_BUILD_HOST 2>&1 | tee../dpkg-buildpackage.log

注意:如果只需要二进制包而不需要源代码包,请在dpkg-buildpackage 中添加"-b "选项。确保有足够的可用文件空间和内存,尤其是在使用大量线程构建时。我使用的虚拟机有 256 GB 内存、64 个内核 和 300 GB 空间,耗时约1小时7分(完整构建包括源代码包)。

请确保查看dpkg-buildpackage.log

并检查

DCMAKE_BUILD_TYPE=RelWithDebInfo

如下所示:


cd /home/stefan/ceph/obj-x86_64-linux-gnu/src/rocksdb && /usr/bin/cmake -DCMAKE_POSITION_INDEPENDENT_CODE=ON -DWITH_GFLAGS=OFF -DCMAKE_PREFIX_PATH= -DCMAKE_CXX_COMPILER=/usr/bin/c++ -DWITH_SNAPPY=TRUE -DWITH_LZ4=TRUE -Dlz4_INCLUDE_DIRS=/usr/include -Dlz4_LIBRARIES=/usr/lib/x86_64-linuxgnu/liblz4.so -DWITH_ZLIB=TRUE -DPORTABLE=ON -DCMAKE_AR=/usr/bin/ar -DCMAKE_BUILD_TYPE=RelWithDebInfo -DFAIL_ON_WARNINGS=OFF -DUSE_RTTI=1 "-GUnixMakefiles" -DCMAKE_C_FLAGS=-Wno-stringop-truncation "-DCMAKE_CXX_FLAGS='-Wnodeprecated-copy -Wno-pessimizing-move'" "-GUnix Makefiles"/home/stefan/ceph/src/rocksdb

验证实际 RocksDB 性能改进

我们在存储节点上安装了重建的软件包(其中 ceph-osd 是最重要的),结果是惊人的好。


并放大某个特定的 OSD


如果您发现自己需要压缩 OSD,那么您将会感到惊喜。压缩 OSD 带来三大好处:

1. 提高了 RocksDB 本身的性能。

2. 增强的 OSD 写入性能,从而缩短恢复时间。

3. 减少停机时间,从而减少需要恢复的数据量。

服务器指标中的一些图可以说明这一点。我们压缩 OSD 的程序包括交错关闭 OSD。一旦所有 OSD 关 闭,就会并行执行压缩 (df|grep "/var/lib/ceph/osd" |awk '{print $6}' |cut -d '-' -f 2|sort -n|xargs -n 1 -P 10 -I OSD ceph-kvstore-tool bluestore-kv /var/lib/ceph/osd/ceph-OSD compact )。

磁盘IOPS(优化之前)


磁盘IOPS(优化之后)


这是一个使用SATA 固态硬盘的节点。使用NVMe磁盘的节点速度更快。压缩时间为3-5分钟。磁盘IOPS(优化之前)


磁盘IOPS(优化之后)


请注意,SATA固态硬盘和NVMe硬盘在OSD压缩时间上的差距越来越大。以前,由于RocksDB 的性能问题,这种差距并不明显。但是,随着速度更快、延迟更低的磁盘的推出,这种差距变得越来越明 显。这表明,在配备更快磁盘的集群中,可以看到最显著的性能提升。

在这个特定的集群中,安装优化包后将压缩所有 OSD 所需的时间缩短了约三分之一。以前需要 9 个半小时,现在只需 6 个小时即可完成。

真实环境中的性能提升

虽然我们希望看到性能翻倍,但事实并非如此。不过,我们仍然看到性能有了显著提高。为了检测⼀些故障,我们在云上运行了虚拟机,以持续(每 5 分钟一次)监控虚拟机内部的性能。其中一项测试是FIO 4K 随机写入测试(单线程,队列深度为1)。

CephFS上的4K随机写入(优化之前)


CephFS 上的 4K 随机写⼊(优化之后)


我们还进行了其他fio基准测试,主要优点是标准偏差降低,尾部延迟也减少了。

结论

  • 像 Mark Nelson 所做的那样,针对 "已知良好 "集群进行性能验证是有好处的。这有助于在运行生产工作负载之前及早发现性能问题。

  • 与使用SAS/SATA SSD或HDD等低性能驱动器的集群相比,配备更快磁盘的集群更有可能实现显著的性能提升。

建议/注意事项

  • 在进行性能测试时,探索各种部署策略。这可能包括在使用不同操作系统的裸机、使用上游容器的 容器化环境以及 Ceph 项目内支持的其他部署方法上进行测试。



在进行性能测试时,探索各种部署策略。这可能包括在使用不同操作系统的裸机、使用上游容器的 容器化环境以及Ceph项目内支持的其他部署方法上进行测试。

  • 随着时间的推移,进行这些测试可以产生更标准化的指标,如 "IO/Watt "或 "throughput/Watt "比率,从而更容易比较不同的测试。或许我们可以开发针对Ceph的测试,以便与Phoronix 测试套件等工具配合使用?

  • 尽管在这种特殊情况下不是问题,但值得⼀提的是,可能会出现与特定CPU架构相关的性能下降。例如,同时使用ARM64和x86-64 性能集群可以发现与特定构建选项相关的差异。这种⽅法有助于 及早发现此类问题。

    如有相关问题,请在文章后面给小编留言,小编安排作者第一时间和您联系,为您答疑解惑。

原文:https://ceph.io/en/news/blog/2024/silver-bullet-rocksdb-performance/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
现在是6月4日夜晚,突然曝出一个重大消息!要来大动作吗?

现在是6月4日夜晚,突然曝出一个重大消息!要来大动作吗?

股市皆大事
2024-06-04 16:34:31
国资委原副部长级干部骆玉林被公诉!曾被批“生活腐化堕落”

国资委原副部长级干部骆玉林被公诉!曾被批“生活腐化堕落”

正义网
2024-06-04 10:02:12
特步千金嫁七匹狼公子,仅是豪门爽文既视感这么简单?

特步千金嫁七匹狼公子,仅是豪门爽文既视感这么简单?

新民周刊
2024-06-04 18:25:16
大张伟夫妇罕合体,刘迎变化大暴瘦30斤,帮老公整理头发超温柔!

大张伟夫妇罕合体,刘迎变化大暴瘦30斤,帮老公整理头发超温柔!

西瓜爱娱娱
2024-06-04 17:01:51
月球插下的中国国旗,让美国登月遭到质疑,美国国旗露出了马脚?

月球插下的中国国旗,让美国登月遭到质疑,美国国旗露出了马脚?

百态人间
2024-05-18 18:31:45
纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

玲说百态味
2024-05-08 18:09:01
太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

域观天下
2024-06-03 10:13:51
到证明实力的时候了,凌晨3点俄军开打:5次爆炸突袭F-16战机掩体

到证明实力的时候了,凌晨3点俄军开打:5次爆炸突袭F-16战机掩体

帅先工场
2024-06-03 16:16:33
上海一阿姨的家火了!看过才知什么叫“岁月静好”,氛围感太足了

上海一阿姨的家火了!看过才知什么叫“岁月静好”,氛围感太足了

阿离家居
2024-06-04 14:52:56
1978年上海知青,抛下丈夫和女儿回城,临走前晚上解开衣扣:让我们为过去画一个句号

1978年上海知青,抛下丈夫和女儿回城,临走前晚上解开衣扣:让我们为过去画一个句号

霹雳炮
2024-06-03 23:07:29
1960年中苏关系破裂,总理建议10年还清苏联债务,毛主席:最多5年

1960年中苏关系破裂,总理建议10年还清苏联债务,毛主席:最多5年

帝哥说史
2024-06-04 06:40:02
意大利0-0土耳其,赛后评分:意大利3号球员排名第一

意大利0-0土耳其,赛后评分:意大利3号球员排名第一

侧身凌空斩
2024-06-05 05:05:22
再婚17年,老伴忠厚老实,陌生人却偷偷提醒:你男人浑身都是秘密

再婚17年,老伴忠厚老实,陌生人却偷偷提醒:你男人浑身都是秘密

烙任情感
2024-06-03 19:31:43
北京这一夜,50岁周迅像少女,陈晓男人味十足,陈数被嘲锥子脸

北京这一夜,50岁周迅像少女,陈晓男人味十足,陈数被嘲锥子脸

小徐讲八卦
2024-06-04 10:59:46
朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

猫眼观史
2024-03-25 14:31:14
李胜利居然硬钢向佐,港圈太子爷搜遍外网账号,谁给他的胆子?

李胜利居然硬钢向佐,港圈太子爷搜遍外网账号,谁给他的胆子?

阿芒娱乐说
2024-06-04 18:59:04
湖北4人被查

湖北4人被查

鲁中晨报
2024-06-04 17:27:04
“这里不是中国!不会有人惯你们!”中国大妈已经沦落成世界公害

“这里不是中国!不会有人惯你们!”中国大妈已经沦落成世界公害

三月柳
2024-06-01 15:24:12
为什么欧美国家的禁毒力度比中国弱?网友掀桌式列证,我大彻大悟

为什么欧美国家的禁毒力度比中国弱?网友掀桌式列证,我大彻大悟

娱乐圈的笔娱君
2024-06-04 18:09:10
稳了!国服版魔兽世界下载成功!离正式开服仅一步之遥

稳了!国服版魔兽世界下载成功!离正式开服仅一步之遥

魔兽世界情报局
2024-06-04 18:59:04
2024-06-05 07:54:44
新钛云服
新钛云服
云管理服务专家
369文章数 29关注度
往期回顾 全部

科技要闻

硬刚英伟达AMD 英特尔推出AI芯片Xeon 6

头条要闻

西安临潼区多辆公务车被指无牌上路行驶 记者采访被怼

头条要闻

西安临潼区多辆公务车被指无牌上路行驶 记者采访被怼

体育要闻

从英国联赛到NBA,两个美国人相爱相杀

娱乐要闻

杨幂留言为热巴庆生,姐妹情深惹人羡

财经要闻

六年四换帅,茅台到底经历了什么?

汽车要闻

2.0T+云辇-P+天神之眼 方程豹豹8还配软包内装

态度原创

健康
教育
时尚
艺术
家居

晚餐不吃or吃七分饱,哪种更减肥?

教育要闻

刚刚,2025 QS 世界大学排名发布

裙子配运动鞋,放松穿最好看!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

家居要闻

简而不冷 明朗的治愈能量

无障碍浏览 进入关怀版