网易首页 > 网易号 > 正文 申请入驻

Ceph 对象网关性能深入探讨:构建安全且可扩展的对象存储(下)

0
分享至


新钛云服已累计为您分享876篇技术干货



01

前 言

本文是关于Ceph 对象网关性能深入探讨:构建安全且可扩展的对象存储系列的第二篇。若尚未阅读第一与第二部分,建议从第一篇入手。前文详细介绍了测试环境,包括硬件软件配置、网络架构及基准测试方法论以及通过测试 Ceph RGW 在 4 节点、8 节点及 12 节点集群的扩展表现,我们揭示了 PUT 与 GET 操作吞吐量随节点增加呈现近似线性提升的规律。研究同时验证了横向扩展可提升资源使用效率——即使是资源密集型的纠删码工作负载,其单节点资源消耗也随集群扩大而显著降低。

02

TLS 终端性能:S3 端点传输加密评估

为评估 TLS 对 Ceph 对象网关(RGW)S3 端点性能的影响,我们对比了三种常见部署策略:端到端加密(RGW 层 SSL)、cephadm 部署的 Ingress 服务(HAProxy)SSL 终端卸载,以及未加密基准方案。HAProxy 服务与 Ceph 对象网关(RGW)服务采用共用节点部署模式,每节点配置虚拟 IP 地址(VIP),基准测试客户端在所有 VIP 间实现请求负载均衡。本次测试在十二节点集群上采用 EC 8+3 配置,分别针对中/大对象(4 MiB)与小对象(64 KiB)工作负载进行。

中/大型对象工作负载 (4 MiB)

本节重点介绍 4 MiB 对象大小结果,作为中大型对象大小的代表性案例。对于更大的对象,由于传输效率更高,每字节开销更低,本文观察到的趋势通常保持不变或进一步优化。

RGW 层 SSL 加密方案的吞吐量与无 SSL 配置几乎持平:GET 请求仅低 0.4%,PUT 吞吐量下降幅度稍大为 4.2%。这种微小差异符合预期,因为集群处于网络瓶颈状态。尽管测试期间 RGW 平均 CPU 使用率 GET 增加 40%、PUT 增加 71%,但单主机最高 CPU 利用率仅达约 83%,额外负载未对性能产生实质影响。这表明 RGW 层 SSL 加密作为默认安全选项,对大对象工作负载的性能影响可忽略不计。



相比之下,在 Ingress 服务层(HAProxy)终止 SSL 的方案表现出更明显的性能影响:GET 吞吐量下降约 27%,PUT 吞吐量降低 19%,延迟相应增加。这种下降并非源于 SSL 本身开销,而是由于加密工作负载转移至 HAProxy 层所致。在重负载下,随着对象大小从 64 KiB 增至 1 GiB,单个 HAProxy 守护进程平均消耗 3 至 6 个 vCPU。Ceph 主机峰值 CPU 使用率最高达 90%,这表明需要针对 HAProxy 进行适当调优与扩展,以避免 CPU 成为性能瓶颈。


小对象工作负载 (64 KiB)

在处理小对象时,吞吐量瓶颈自然从网络转移至 CPU,使得加密开销更为显著。尽管如此,在 Ceph 对象网关(RGW)启用 SSL 的影响仍处于可控范围:相较于无 SSL 基准,GET IOPS 下降 5.2%,PUT IOPS 降低 10.7%。RGW 的 CPU 使用率 GET 增加 4.2%,PUT 增加 11.3%,这表明加密工作在集群中分布良好。虽然小对象工作负载对 CPU 使用率更为敏感,但端到端 SSL 方案仍具实用性——在多数场景下性能损耗被控制在个位数百分比范围内。


Ingress 层 SSL 终端方案再次呈现更显著的性能差距:相较于无 SSL 配置,GET IOPS 下降约 18%,PUT IOPS 降低 8%,同时伴随 Ingress 服务 CPU 使用率上升与请求延迟微增。尽管数据显示性能差异较大,该方案仍适用于生产环境——当安全策略要求 TLS 卸载时,只需确保 Ingress 服务的扩展能力与并发量及吞吐量目标匹配即可实现有效部署。

结论 - SSL/TLS S3 端点安全性

总而言之,在 Ceph 对象网关(RGW)层配置 SSL/TLS 可在安全性与性能间实现出色平衡:该方案为大对象工作负载提供接近基准的吞吐量,对小对象仅造成轻微性能衰减,同时保持端到端加密优势。

03

集群服务传输加密:大规模内部流量保护

随着安全标准的不断发展,保护 Ceph 守护进程之间的内部通信正在成为生产部署的最佳实践,尤其是在受监管的环境中。在 Ceph 中,此内部加密是通过 Messenger v2 安全模式启用的,也称为集群网络加密或传输中的内部加密。与保护外部客户端和 S3 Ceph 对象网关 (RGW) 端点之间的流量的 TLS 不同,Messenger v2 确保所有守护进程间流量(包括 RGW 到 OSD、OSD 到 Monitor 和 Manager 通信)都经过加密和身份验证。

本节介绍在启用 Ceph 对象网关 (RGW) SSL 的基准之上启用 Messenger v2 安全模式对性能的影响。两种配置(带安全模式和不带安全模式)都在 RGW 上使用 SSL 进行面向客户端的加密。测试是在 12 节点集群上进行的,使用 8+3 纠删码,中/大型对象大小(1 MiB 至 256 MiB)。

核心结论:强安全性的最小性能开销

我们评估了启用和未启用 Messenger v2 安全性的配置中 GET 和 PUT 作的吞吐量和延迟。如下图和表格所示,读取和写入作的性能增量可以忽略不计,这表明传输中的内部加密与高吞吐量对象存储用例兼容。


接下来是一个表格,该表提供了使用我们的参考 4 MiB 对象大小测量的配置之间百分比变化的完整比较。


分析


  • 吞吐量影响:在所有测试对象大小(1 MiB 至 256 MiB)中,启用 Messenger v2 安全模式后 GET 吞吐量基本保持不变。PUT 吞吐量出现适度下降,其中 1 MiB 对象下降最明显(-3.1%),随对象大小增大影响趋近于零(如 64 MiB 和 256 MiB 仅-0.4%)。该趋势符合预期:小对象会放大加密开销,而大对象更受吞吐量限制且能摊薄额外成本。

  • 延迟影响:GET 与 PUT 延迟在所有场景下均保持稳定。观测到的波动极小(通常为 ±1 毫秒),这证实即使在高并发和不同对象大小下,启用 Messenger v2 安全模式也不会引入显著排队或处理延迟。

  • 资源利用率:RGW 层 CPU 使用率在 PUT 操作中略有上升(约 2-6%,具体取决于对象大小),GET 操作 CPU 使用率基本持平。内存消耗同样呈现微小变化(约 5-7%范围内),未出现资源耗尽或饱和迹象。


结论 – Messenger v2 内部加密方案

启用 Messenger v2 安全模式可为内部 Ceph 守护进程通信添加加密保护,对性能的影响可以忽略不计。我们的测试显示,所有对象大小的吞吐量和延迟都很稳定,RGW 内存和 CPU 使用率仅略有增加,主要是用于 PUT 操作。Messenger v2 的设计以最小的代价确保了强大的安全保障,使其与高吞吐量、企业级对象存储部署高度兼容。

04

最终建议——安全架构:TLS + Messenger v2

对于需要同时保障客户端传输安全与集群内部服务通信安全的环境,采用 S3 端点 TLS 加密与 Messenger v2 内部加密的组合方案,可在实现强安全性的同时将性能影响降至最低。

无论是保护 AI 训练、分析平台还是多租户对象存储服务,Ceph RGW 证明了全栈加密方案可放心部署——在吞吐量、延迟与扩展性方面均不会受到明显影响。

05

静态加密(SSE-S3):应用场景与 4 MiB 测试结果

为何选择 SSE-S3?

静态加密确保对象数据在持久化存储前完成加密,仅在访问时解密。Ceph RGW 中的 SSE-S3 采用信封加密机制:每个对象使用独立数据密钥加密载荷,该数据密钥本身由 KMS(本基准测试中采用 Vault Transit 并通过 Vault Agent 实现令牌管理与认证卸载)进行存储和保护。该设计提供强安全保证与集中式密钥管控。

性能权衡符合预期:每个对象的 PUT/GET 操作均增加加密工作及(KMS 保护密钥的)解包步骤。对象越小,固定每对象成本占比越高。小对象测试中我们观察到预期规律:对象大小越小,每对象密钥操作与加密的相对开销越大

测试数据(12 节点,EC 8+3,512 客户端线程,4 MiB 对象)

测试方案:

  • 基准方案 :RGW + TLS + msgr_v2(未启用 SSE)

  • SSE@RGW 方案 :基准方案 + SSE-S3(TLS 在 RGW 层终止)

  • SSE@Ingress 方案 :SSE-S3 + TLS 在 HAProxy 层卸载(msgr_v2 启用)

SSE 与基线性能的吞吐量和延迟比较:



  • 对于 4 MiB 对象,SSE@RGW 方案可保持约 90%的 PUT 吞吐量,仅伴随适度延迟增长——这对大对象写入密集型而言属积极结果。

  • GET 路径表现出更高敏感性,因为每次读取均需解包对象数据密钥(涉及 KMS 往返+解密操作),该过程在高并发下成为限速因素。将 TLS 卸载至 Ingress 层可释放 RGW 的 CPU 资源并部分弥补 GET 性能差距,但 KMS 密钥解包成本仍是主要开销。


结论 – 静态加密 (SSE-S3)

SSE-S3 以可预测的性能开销提供强静态加密保护:对于大对象可保持高效处理(PUT 操作接近基准性能),但对于频繁存取的小对象工作负载则受 KMS 性能影响。通过对象大小优化、KMS 扩展部署以及 RGW/Ingress 容量规划,可有效缓解此类权衡。

06

下一步

我们未来的目标


  • 探索快速 EC 改进 (Ceph 9.x) 以实现小对象 EC 性能。

  • 使用 200/400 GbE 重新运行大型对象测试,以突破当前的网卡上限。

  • 研究 SSL 终端卸载场景下 Ingress 服务更优的默认调优参数


07

结 论

在整个三部分系列中,我们验证了启用安全功能后的可预测扩展能力:


  • 12 节点集群实现约 111 GiB/s GET 与 66 GiB/s PUT 吞吐量,4→8→12 节点扩展呈现近线性增益且延迟保持稳定或降低,64 KB 对象场景下达成约 39.1 万/8.6 万 IOPS。

  • RGW 层 TLS 加密性能接近基准,Messenger v2 带来的开销可忽略不计,SSE-S3 则呈现可基于对象尺寸调节的加密成本


上述结果充分证明 Ceph 对象存储是大规模高吞吐、低延迟工作负载场景下的不错选择。

如有相关问题,请在文章后面给小编留言,小编安排作者第一时间和您联系,为您答疑解惑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
北京鼓楼铁骑警花走红网络!网友:认真执勤的样子真酷

北京鼓楼铁骑警花走红网络!网友:认真执勤的样子真酷

BRTV新闻
2026-01-03 12:52:23
善恶终有报,57岁央视女主持王小丫,原来早已经走上另一条大路

善恶终有报,57岁央视女主持王小丫,原来早已经走上另一条大路

梦录的西方史话
2025-10-29 15:48:51
紧急驰援!48小时内第5架俄罗斯IL-76降落伊朗,地区局势更趋复杂

紧急驰援!48小时内第5架俄罗斯IL-76降落伊朗,地区局势更趋复杂

军迷战情室
2026-01-03 12:54:03
拒绝连败,广东险胜北控,赛后听听媒体专家怎么说,萨姆纳发文

拒绝连败,广东险胜北控,赛后听听媒体专家怎么说,萨姆纳发文

邹维体育
2026-01-03 22:15:04
蒋圣龙为何无缘邵佳一国足首期名单,背后原因找到了,引发热议

蒋圣龙为何无缘邵佳一国足首期名单,背后原因找到了,引发热议

懂个球
2026-01-03 14:55:20
CBA积分榜最新排名!广厦双杀北京夺回第1:广东第2辽宁第13

CBA积分榜最新排名!广厦双杀北京夺回第1:广东第2辽宁第13

篮球快餐车
2026-01-04 02:18:14
特朗普称马杜罗夫妇在美国军舰上

特朗普称马杜罗夫妇在美国军舰上

新华社
2026-01-03 22:38:05
3-2!1.2亿天王双响,赖斯定乾坤,阿森纳7连胜,静候曼城犯错

3-2!1.2亿天王双响,赖斯定乾坤,阿森纳7连胜,静候曼城犯错

我的护球最独特
2026-01-04 03:25:46
登哥你...怎么又多了一个儿子?!

登哥你...怎么又多了一个儿子?!

柚子说球
2026-01-03 17:55:09
瑞士酒吧火灾,女儿求助老爸救下10人。而火烧到房顶,他们却在拍照

瑞士酒吧火灾,女儿求助老爸救下10人。而火烧到房顶,他们却在拍照

英国那些事儿
2026-01-03 23:02:51
小摩托主动降薪,有球可踢?鲁媒:认清形势,要的薪水还不如本土

小摩托主动降薪,有球可踢?鲁媒:认清形势,要的薪水还不如本土

建哥说体育
2026-01-03 21:36:58
女人出不出轨:看她身边有没有这3种“人”:比查手机更准

女人出不出轨:看她身边有没有这3种“人”:比查手机更准

枫红染山径
2026-01-04 02:56:56
别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

别墅是中产返贫的最大陷阱!过来人血泪总结:别墅的四大硬伤

流苏晚晴
2026-01-02 17:56:17
国际社会谴责美国打击委内瑞拉

国际社会谴责美国打击委内瑞拉

华西都市报
2026-01-04 02:20:09
19点30分,中国男足vs泰国!感谢亚足联送助攻,最稳一战预定3分

19点30分,中国男足vs泰国!感谢亚足联送助攻,最稳一战预定3分

侃球熊弟
2026-01-04 00:25:03
伊朗爆发抗议游行 高层被斩首削弱控制,伊朗民众走上街头

伊朗爆发抗议游行 高层被斩首削弱控制,伊朗民众走上街头

火星人的想法
2025-12-31 06:00:03
美国五艘航母同时逼近南海,白宫放话,要求解放军给台湾让出空间

美国五艘航母同时逼近南海,白宫放话,要求解放军给台湾让出空间

十三级台阶
2025-12-30 08:29:15
这下好了,君合律所不仅上海人,全国人民都知道了!

这下好了,君合律所不仅上海人,全国人民都知道了!

夜深爱杂谈
2025-11-02 15:47:12
短短24小时,马杜罗火速改口,当众向特朗普低头,俄伊都被坑了?

短短24小时,马杜罗火速改口,当众向特朗普低头,俄伊都被坑了?

谛听骨语本尊
2026-01-03 14:23:09
2026-01-04 04:27:00
新钛云服
新钛云服
云管理服务专家
457文章数 30关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

艺术
家居
时尚
房产
公开课

艺术要闻

色彩能愉悦你的眼睛,黑白则能慰藉你的心灵!

家居要闻

无形有行 自然与灵感诗意

好美啊!58岁的她开挂了

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版