网易首页 > 网易号 > 正文 申请入驻

云原生存储升级:1 分钟,异常 POD 自动漂移

0
分享至

在云原生技术蓬勃发展的当下,容器编排系统 Kubernetes 无疑是其中的中流砥柱。自 2014 年 6 月 6 日,Kubernetes 的第一次提交被推送到 GitHub,历经十年的飞速演进,它早已超越了单纯编排系统的范畴。如今,Kubernetes 提供了一种规范,让用户能够精准描述集群架构,定义服务的最终状态,并能自动将系统达成并维持在该状态。

而 CSI(Container Storage Interface)作为 Kubernetes 上建立的行业标准接口规范,使存储系统能为容器应用提供数据持久化能力,极大地推动了云原生存储的发展。

云原生存储的痛点与挑战

XSKY 作为软件定义存储的代表性厂商,紧密跟随云原生生态的步伐。早在 CSI 标准发布前,就已深度适配 Kubernetes in-tree 架构,提供分布式块、文件存储服务。2018 年底 CSI 标准正式版本发布后,又迅速支持 CSI 标准,推出 CSI-ISCSI、CSI-NFS 协议接口,多年来助力上百家客户成功实现云原生应用转型。

在大量的交付案例中,我们也察觉到当前 CSI 在使用过程中存在一些亟待解决的痛点:

  • CSI Driver 部署与运维难题:目前 CSI Driver 主要采用命令行单独安装的方式,这使得 PV 卷缺乏总容量监控以及性能监控管理,给运维工作带来诸多不便。
  • 多存储环境管理复杂:在实际项目中,一套 K8s 平台可能对接多套不同性能的存储,或者一套存储要对接多套 K8s 集群。这种情况下,需要为每套 K8s 进行集群管理,实现对 PV 卷容量、配额等的统一限制,否则资源分配比较随机,无法有效管理每套 K8s 使用容量,管理难度较大。
  • 块存储 Pod 异常切换困境:云原生应用数据持久化主要依赖块和文件存储。文件存储天然支持多节点共享,当云原生节点出现异常时,应用能迅速自动切换到可用节点。但当使用块存储承载数据库、中间件等应用时,一般采用 RWO 模式挂载。此时若节点异常,Kubernetes 需要 6 分钟才能自动强制切换,而且切换后应用仍无法运行,因为后端存储未能正确释放块存储对应异常节点的映射,导致业务长时间受影响,难以满足业务要求的 SLA 标准。

XCNSP 重磅登场,开启云原生存储新篇章

为了攻克这些难题,满足云原生新需求,XSKY 发布了 XCNSP(XSKY 云原生存储平台),这是一款基于原有 CSI Driver 进行重大升级的存储管理平台,为云原生存储带来了全新的解决方案。

01

主要功能亮点

(1)Pod 高可用

这一功能彻底解决了块存储挂载到 Pod 后,Pod 所在节点关机等异常情况下的自动切换问题。在 1 分钟内,Pod 即可自动切换到其他可用节点,确保业务正常访问。

  • 高可用检查条件:在 K8s 节点部署 XKSY 高可用插件,同时为需要保护的 Pod 添加特定标签 “csi.xsky.com/Podha: "enable"”,并且高可用插件会对节点和 Pod 进行全面且详细的健康检查;
  • 高可用操作:高可用插件一旦通过健康检查发现异常,触发条件后会立即删除异常节点受保护的 Pod,促使 Pod 快速漂移;随后删除该节点高可用 Pod 卷的 VolumeAttachment 记录,取消卷与异常节点的挂载信息,让业务能在 1 分钟内顺利切换到可用节点并恢复运行;
  • 事后处理:当异常节点恢复后,系统会自动清理残余卷,保证系统的整洁与稳定。

(2)统一平台,可视化运维管理

XCNSP 提供了直观的可视化统一管理界面,全面支持星飞全闪(CSI-iSCSI、CSI-NVMEof)和 SDS 混闪(CSI-iSCSI 、CSI-NFSv3/v4)。同时,能够对所有 PV 卷进行精准的容量、性能监控,让运维管理更加高效便捷。

(3)多租户配额管理

针对每种类型的存储,XCNSP 允许创建一个或多个项目,用于对全局容量、卷个数、快照个数进行灵活限制,满足不同租户的多样化需求。

(4)支持单 PV 310 万IOPS

XCNSP 专注于存储管理的深度集成,在 IO 路径上未做任何改动,能够充分发挥存储本身的性能优势。它支持最新的星飞全闪块存储,可以使用 NVMe-oF 提供单卷高达 310 万 IOPS 的超高性能,足以满足云原生上所有应用的严苛性能需求。

Pod高可用测试对比与实际效果

我们创建有 3 台节点的 k8s 集群,节点名是 k8s-test、k8s-test-2、k8s-test-3。

01

模拟节点故障

以下是模拟挂载块存储卷的 Pod 所在节点关机,看 XSKY Pod HA 插件如何自动恢复业务 Pod。

  • 我们首先创建一个 StatefulSet 类型 nginx 应用,不设置高可用 label;
  • 然后让 k8s-test-2 节点停机,在将近 10 分钟后,此应用一直处于 Terminating 状态,无法自动恢复;

  • 接下来我们重新创建一个 StatefulSet 类型 nginx 应用,并添加上高可用 label;

  • 创建完应用后,我们停止 k8s-test-2 节点,可以看到在 2 分 54 秒前检测到 k8s-test-2 节点离线,2 分 19 秒前新 Pod 在 k8s-test 节点创建,也就是 1 分钟内新 Pod 被启动起来。

02

模拟存储网络故障

  • 首先,创建一个 StatefulSet 类型的应用(Postgresql 数据库),并为该 StatefulSet 的 Pod 开启 Pod 高可用;
  • 然后,我们新建一个容器应用,让应用每隔一秒往 Postgresql 数据库的 items 表中插入一条记录;
  • 最后,我们断开 k8s-test-3 节点与后端存储的网络,观察到 Postgresql 数据库 Pod 在 k8s-test-2 节点重建,查看 items 表记录,可以看到记录插入动作停止了 36 秒后恢复。

可以看到,使用 XSKY 高可用方案后,Pod 可以及时自动恢复,极大解决故障场景下的 Pod 高可用问题。产品支持节点故障、网络故障、卷 IO error、Pod 状态异常(CPU、内存、系统盘不足等引起)等异常场景切换 。

典型案例

在某新能源汽车企业云资源池建设项目中,采用前沿的数据库容器云 + XSKY 星飞分布式全闪块存储 + CNSP 创新方案,替代传统烟囱式的数据库物理机 + 集中式全闪存储模式。用 24 个容器云计算节点,成功承载集团及子公司各类业务中广泛应用的 MySQL 等新型数据库。这一方案不仅保障了数据库的性能和可靠性,还极大降低了硬件投入成本,大幅简化管理复杂度。

总结

XCNSP 为云原生应用提供全闪块、混闪块、混闪文件全产品支持,适用云原生应用不同需求。全闪块更是达到单卷 310 万 IOPS,帮助高性能应用的云原生改造。同时使用 XCNSP 平台,也创新性解决了云原生节点异常,挂载块卷的 Pod 业务无法快速自动恢复问题,让云原生应用更好的运行。

当前 XCNSP 产品已经在多个客户项目上落地,包括金融、能源、先进制造行业,我们也将持续投入,更加完善 XCNSP 从云原生到存储的管理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
19岁全红婵久违现身!瘦了一圈+下巴尖了 吃汉堡薯条火锅 喝冰可乐

19岁全红婵久违现身!瘦了一圈+下巴尖了 吃汉堡薯条火锅 喝冰可乐

阿废冷眼观察所
2026-06-25 15:15:43
癌症是基因注定的,躲也躲不掉?父母得了5种癌,或遗传给下一代

癌症是基因注定的,躲也躲不掉?父母得了5种癌,或遗传给下一代

39健康网
2026-06-25 08:30:42
1.3亿镑创纪录!曼城将再谈安德森转会

1.3亿镑创纪录!曼城将再谈安德森转会

坠入温柔晚风
2026-06-25 00:12:59
巴西3-0大胜,7分锁定小组榜首,却高兴不起来,决赛或将迎战日本

巴西3-0大胜,7分锁定小组榜首,却高兴不起来,决赛或将迎战日本

历史胶囊
2026-06-25 10:20:34
韩国队运气爆棚!拿第2,1/16决赛PK加拿大,孙兴慜进16强容易了

韩国队运气爆棚!拿第2,1/16决赛PK加拿大,孙兴慜进16强容易了

何老师呀
2026-06-25 07:11:51
湖南失联多日13岁男孩被找到:落入被草掩盖的坑洞,疑靠喝水存活,身体状况良好

湖南失联多日13岁男孩被找到:落入被草掩盖的坑洞,疑靠喝水存活,身体状况良好

大象新闻
2026-06-25 20:50:37
为省钱,日本711便利店等商家推出“无海苔饭团”,产品仅保留米饭和馅料,包装改为黑白灰三色,不再提供双层包装

为省钱,日本711便利店等商家推出“无海苔饭团”,产品仅保留米饭和馅料,包装改为黑白灰三色,不再提供双层包装

中国能源网
2026-06-25 18:46:04
看到一个黑影在横穿马路,本以为是只大狗……走近一看才发现:居然是半只鳄鱼!

看到一个黑影在横穿马路,本以为是只大狗……走近一看才发现:居然是半只鳄鱼!

爱宠物
2026-06-24 01:44:44
六根阴毛定死缓,男子蒙冤二十载出狱,杀害母子三人的真凶是谁?

六根阴毛定死缓,男子蒙冤二十载出狱,杀害母子三人的真凶是谁?

易玄
2026-06-25 11:51:23
麦当娜拒做“体面奶奶”,68岁偏要混夜店气死谁

麦当娜拒做“体面奶奶”,68岁偏要混夜店气死谁

影视情报室
2026-06-25 00:14:34
中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

职场资深秘书
2026-06-24 16:34:33
央视警告!日本囤弹药备战台海,要是非要打,中国就能一劳永逸了

央视警告!日本囤弹药备战台海,要是非要打,中国就能一劳永逸了

寄予的清风
2026-06-25 10:50:09
据爆料:听说某大厂西安研究所一个女员工,终身合同耗了三年不走,今年被hr带着保安抬出公司了。

据爆料:听说某大厂西安研究所一个女员工,终身合同耗了三年不走,今年被hr带着保安抬出公司了。

纯洁的微笑
2026-06-25 12:49:08
提前爆发?梅根与凯特王妃在英国撞期,两妯娌将在同一天亮相

提前爆发?梅根与凯特王妃在英国撞期,两妯娌将在同一天亮相

聪明的橙子hj
2026-06-24 15:31:42
中纪委再出大招!公务员这4类行为将被大数据盯死,沾上就完蛋!

中纪委再出大招!公务员这4类行为将被大数据盯死,沾上就完蛋!

职场资深秘书
2026-06-25 19:40:04
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

流苏晚晴
2026-06-13 18:21:18
何超盈罕见度假照曝光!闺蜜林心儿发合影,这次她终于点头了

何超盈罕见度假照曝光!闺蜜林心儿发合影,这次她终于点头了

川川八卦说
2026-06-24 11:53:50
事态再升级!一句话蒸发3000万票房,韩红晚节不保,冯小刚遭牵连

事态再升级!一句话蒸发3000万票房,韩红晚节不保,冯小刚遭牵连

秋姐居
2026-06-23 19:28:52
76岁希拉里传跨界绯闻?对象是49岁莱昂纳多,游艇同框是算计?

76岁希拉里传跨界绯闻?对象是49岁莱昂纳多,游艇同框是算计?

绿茵八卦君
2026-06-20 19:45:04
2026-06-26 01:43:00
XSKY星辰天合
XSKY星辰天合
面向 AI 时代的统一数据平台提供商
827文章数 120关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

佛得角震撼世界足坛 佛得角足协给中国男足支招

头条要闻

佛得角震撼世界足坛 佛得角足协给中国男足支招

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

健康
时尚
旅游
手机
家居

医生如何快速诊断脑梗和脑出血?

女人不管多大年纪,夏天都要准备一两条过膝裙,舒适又提气质

旅游要闻

人生第一次去巴黎,最难忘的竟然是扫墓

手机要闻

安卓首个液态玻璃!荣耀MagicOS 11上手实拍:效果可自由调节

家居要闻

绿意盎然 自然之境

无障碍浏览 进入关怀版