网易首页 > 网易号 > 正文 申请入驻

分布式存储架构发展及技术挑战

0
分享至

文档资料: wenku.itilzj.com

从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战 :

1.数据保存周期与服务器更新周期不匹配。大数据、人工智能等新兴业务催生出海量数据,大量数据需按照其生命周期策略(例如 8~10 年)进行保存。

2.性能可靠与资源利用率难以兼得。支撑业务的分布式存储系统大致可以分为性能型存储和容量型存储,它们均无法同时实现高性能可靠与高资源利用率。具体地,性能型存储主要运行数据库、虚拟化等关键业务,通常采用三副本或两副本并配合独立冗余磁盘阵列卡模式 ;这类方案虽兼顾了性能和可靠性,但其大约 30% 的空间利用率却是对存储资源的极大浪费。

容量型系统为了提升空间利用率,采用纠删码(Erasure Code,EC)方式,然而,EC计算过程中的读写、重构等会消耗大量网络资源,导致系统重构效率低下、重构时间长,给系统可靠性带来风险(如图 1 所示)。

3.新型分布式应用的极简高效共享存储诉求。

以无服务器(serverless)应用为代表的新型分布式应用在近些年涌现,这类应用从无状态化向有状态化扩展,比如数据库、消息总线等组件纷纷容器化,数据共享访问的诉求不断增多。与此同时,人工智能和机器学习等应用需要大量异构算力协同,甚至产生共享内存访问的诉求,它们关注高带宽、低时延的访问能力,仅需要轻量、便捷的共享存储系统即可,不需要搭载具有复杂企业特性的传统存储。

4.数据中心税导致数据密集型应用效率低下。

面向数据密集型场景,在基于以 CPU 为中心的服务器架构下,应用为获取数据所缴纳的“数据中心税”(datacenter tax)日益加重。例如,服务器内的 CPU为处理网络及存储 IO 请求,需要消耗高达 30% 的算力 [3] ;此外,由于通用 CPU 并不擅长数据处理运算,导致其能效比低下。

传统存算分离架构将算力资源和存储资源(机械硬盘、固态硬盘等)分离至彼此独立的计算域和存储域,并通过以太网或专用存储网络(例如光纤通道)将二者互连,实现了存储资源的灵活扩展和高效共享(如图 2 左侧所示);该架构主要为复杂的传统企业特性设计,难以应对上述挑战,为了让云和互联网存储域服务兼顾资源利用率、可靠性、性能、效率等众多诉求,亟须基于新型软硬件技术构建新型存算分离架构。

一、硬件技术趋势

面对数据中心在容量利用率、存力效率等方面的挑战,近年来,专用数据处理器、新型网络等技术快速发展,为数据中心基础设施的重构提供了技术基础。

首先,为取代服务器本地盘,很多厂商推出以太网闪存簇(Ethernet Bunch of Flash,EBOF)高性能盘框(例如,近期陆续发布的西数 OpenFlex、Vast Data Ceres 高性能盘框等)。这类盘框不再具有复杂企业特性,而是注重采用新型的数据访问标准,比如支持 NoF(NVM Express over Fabric)等接口,以提供高性能存储实现对本地盘的替换。NoF 协议由 NVM Express (NVMe)标准组织在 2016 年发布,提供了 NVMe 命令到多种网络传输协议的映射,使一台计算机能够访问另一台计算机的块存储设备。同时,一些研究机构进一步探索远程内存池化技术,例如,韩国 KAIST 实验室实现了基于 FPGA的 CXL(Compute Express Link)互连协议 ;CXL为英特尔于 2019 年 3 月在 Interconnect Day 2019 上推出的一种开放性互联协议,能够让 CPU 与 GPU、FPGA 或其他加速器之间实现高速高效互联,从而满足高性能异构计算的要求。

其次,业界涌现出越来越多的数据处理单元(Data Processing Unit,DPU)和基础设施处理单元(Infrastructure Processing Unit,IPU)专用芯片,在数据流处理路径上取代通用处理器,提升算力能效比。同时,基于可编程交换机的网存协同也是研究热点,例如在网数据缓存的 NetCache、KV-Direct,在网数据协调的 NetLock、SwitchTx,在网数据聚合的 SwitchML、NetEC,在网数据调度的 FLAIR、AlNiCo等。

最后,数据访问网络标准也在持续增强,比如CXL 协议新版本加强了内存池化方向的技术特性,同时吸收了 Gen-Z(由 AMD、ARM、HPE 等公司发起定义的面向内存语义的技术)、OpenCAP(Open Coherent Accelerator Processor Interface,最早由IBM 提出的异构计算接口)等技术的成果,正逐步成为业界主流高速互联标准。NVMe 2.0 也在向着语义统一、Fabric 统一和介质统一方向演进。

这些新型存储、计算和网络硬件为构建面向云和互联网场景的新型存算分离架构带来了诸多机遇,譬如使用 DPU 等专用芯片能够打破传统以CPU 为中心的服务器架构,由此提升数据密集型应用的效率。

二、新型存算分离架构的特征

随着远程直接内存访问(Remote Direct Memory Access,RDMA)、CXL、可编程网络设备、高性能NVMe SSD、持久性内存等新型硬件技术的发展,需要构建新型存算分离架构,以确保云和互联网存储域服务能够兼顾资源利用率、可靠性、性能、效率等众多诉求。相较于传统架构,新型存算分离架构最为显著的区别在于 :

(1)更为彻底的存算解耦,该架构不再局限于将 CPU 和外存解耦,而是彻底打破各类存算硬件资源的边界,将其组建为彼此独立的硬件资源池(例如处理器池、内存池、机械硬盘(HDD)/ 固态硬盘(SSD)池等),从真正意义上实现各类硬件的独立扩展及灵活共享 ;

(2)更为细粒度的处理分工,即打破了传统以通用 CPU 为中心的处理逻辑,使数据处理、聚合等原本 CPU 不擅长的任务被专用加速器、DPU 等替代,从全局角度实现硬件资源的最优组合,进而提供极致的能效比。

总结来说,新型存算分离架构具有如下特征 :

1.无盘化的服务器。新型存算分离架构将服务器本地盘拉远构成无盘化(diskless)服务器和远端存储池,同时还通过远程内存池扩展本地内存,实现了真正意义上的存算解耦,可极大提升存储资源利用率。业务使用时,可根据应用需求选择配置不同性能、容量的虚拟盘及池化内存空间,这样一方面可以避免由于不同服务器本地存储空间利用率过低导致超配造成的浪费 ;另一方面,当服务器出现故障或者更新换代时,也不影响数据的保存,不需要额外的数据迁移。

2.多样化的网络协议。连接计算和存储间的网络协议从当前的 IP 或光纤通道(Fibre Channel,FC)协议扩展到 CXL+NoF+IP 协议组合。CXL 协议使得网络时延降低到亚微秒级别,有助于内存型介质的池化 ;NoF 协议加速 SSD 池化 ;IP 协议可满足 HDD 等慢速介质访问诉求。通过这几类协议组合构建的高通量网络,满足了多种场景池化接入诉求。

3.专用化的数据处理器。数据存储、访问等操作不再由通用处理器负责,而是卸载到专用数据处理器。此外,特定的数据操作可由专用硬件加速器进行进一步加速,如纠删码、加密压缩、网络通信等。通过专用数据处理器,可以释放通用处理器算力,用于服务更适合的场景,显著提升系统整体能效比。

4.极高存力密度的存储系统。分离式存储系统(disaggregate storage)是新型架构的重要组件,作为持久化数据的底座,在存储介质的集约化管理基础上,结合芯片、介质的深度协同设计,整合当前系统、盘两级的空间管理,通过大比例纠删码算法减少冗余资源开销比例。此外,还可通过基于芯片加速的场景化数据缩减技术提供更多的数据可用空间。

三、面向云和互联网场景的存算分离架构

新型存算分离架构意在解决前文所提的当前架构面临的几大痛点挑战,通过将原有架构的多级分层资源进行彻底解耦池化和重组整合,形成新的三大简化分层 :存储模组、总线网络和算力模组,从而提供服务器本地存储拉远池化、新型网络灵活组装、以数据为中心的多元处理、高容量极简盘框等几大新兴能力。

1、存储模组

面向云和互联网数据中心,需要以更专业的存储能力重新定义云和互联网的存储架构。新型存算分离架构中,存储型模组主要以 EBOF、以太网内存簇(Ethernet Bunch of Memory,EBOM)、以太网磁盘簇(Ethernet Bunch of Disk,EBOD)等新型盘框形态存在,RAID/EC/ 压缩等传统存储能力下沉到新型盘框中,构成“盘即存储”的大盘技术,对外通过NoF 等高速共享网络提供块、文件等标准存储服务。这一类新型盘框将传统磁盘阵列的冗余池化技术和数据缩减技术进行了高度集约化和小型化。

云和互联网的多样业务主要分为三种典型的应用场景(如图 3 所示)。第一种场景是针对虚拟化业务,直接将数据中心存储域服务器的本地盘拉远,对分布式开源存储集群的物理硬盘层形成替代。第二种场景是为数据库、大数据服务等需要极热数据处理的业务提供大内存、键 - 值(Key-Value,KV)接口,加速数据处理效率 ;第三种场景是针对容器等新业务场景,为 Ceph、Lustre 等分布式应用直接提供文件语义,卸载本地数据布局,并支持将温热数据分级到更冷的 EBOD 等机械硬盘或磁带型存储模组中,提升整系统资源使用效率。

2、算力模组

当前,摩尔定律演进变缓,只有采用专用处理器才能进一步以异构方式发挥出下一阶段的算力。引入专用处理器后,算力池化是必然选择 ;否则,如果为每台服务器配置异构算力卡,不仅使整机功耗巨大,还会导致资源利用率十分低下。

以 DPU 为代表的专业数据处理器具备成本更低、功耗更低、即插即用、即换即用等独特优势,并且在运行状态下不与业务应用发生资源争抢,保证用户业务正常运行的同时也保障了基础设施的服务质量。

3、高通量数据总线

存算分离架构中,网络技术非常重要,它决定了系统的响应速度以及吞吐能力,也决定了系统资源池化的能力范围。过去 10 年,万兆 IP 网络促使 HDD 池化,基于 IP 网络发展了支持块、文件、对象共享的访问协议。当前,面向热数据处理,NVMe/RoCE(RDMA over Converged Ethernet,RDMA 融合以太网 ) 促 使 SSD 池 化 ;并 且,NVMe 协议快速发展使其开始收编烟囱式协议规范。下一步,面向极热数据处理,内存型网络(例如 CXL Fabric)将促使内存资源池化,为业务提供更大的共享内存空间(如图 4 所示)。

IT架构师/技术大咖的交流圈子,为您提供架构体系知识、技术文章、流行实践案例、解决方案等,行业大咖分享交流/同行经验分享互动,期待你的加入!扫码即可加入哦,随着材料不断增多社群会不定期涨价早加入更优惠

免责声明:

本公众号部分分享的资料来自网络收集和整理,所有文字和图片版权归属于原作者所有,且仅代表作者个人观点,与本公众号无关,文章仅供读者学习交流使用,并请自行核实相关内容,如文章内容涉及侵权,请联系后台管理员删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伤亡比例1比5!多布罗皮利亚被围俄军弹尽粮绝,大批士兵主动投降

伤亡比例1比5!多布罗皮利亚被围俄军弹尽粮绝,大批士兵主动投降

知兵
2025-09-14 22:02:52
被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

书雁飞史oh
2025-09-12 16:09:35
媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

直播吧
2025-09-14 17:03:06
省长讲第一课,广东全省市委书记、市长、县委书记、县长集中培训

省长讲第一课,广东全省市委书记、市长、县委书记、县长集中培训

新京报政事儿
2025-09-14 13:32:41
俄将在华发行债券?100多年前的沙俄,曾经在东北发行过纸质卢布

俄将在华发行债券?100多年前的沙俄,曾经在东北发行过纸质卢布

小莜读史
2025-09-14 14:44:36
西贝硬刚罗永浩,卫健委出手了!

西贝硬刚罗永浩,卫健委出手了!

梳子姐
2025-09-13 19:16:39
张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

霹雳炮
2025-09-11 23:13:49
上海下周初还是热,周四开始要降温了

上海下周初还是热,周四开始要降温了

澎湃新闻
2025-09-14 18:22:27
欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

文雅笔墨
2025-09-14 19:31:37
罗永浩向贾国龙重新开战后,深夜发文称希望与其当面直播对话

罗永浩向贾国龙重新开战后,深夜发文称希望与其当面直播对话

极目新闻
2025-09-15 02:05:07
国家点名!这10个地区,被委以重任

国家点名!这10个地区,被委以重任

国民经略
2025-09-12 11:42:38
王毅表态:战争解决不了问题、制裁只会使问题更复杂

王毅表态:战争解决不了问题、制裁只会使问题更复杂

政知新媒体
2025-09-14 12:58:15
山东一中学学生在食堂站着用餐遭质疑,校方回应:一直没座位,都是站着吃

山东一中学学生在食堂站着用餐遭质疑,校方回应:一直没座位,都是站着吃

新晚报
2025-09-13 16:35:47
不明飞行物被击落后续:海事局发通报显端倪,身份快真相大白了!

不明飞行物被击落后续:海事局发通报显端倪,身份快真相大白了!

科普100克克
2025-09-15 02:28:33
全数崩跌,5000万订单成为世界笑柄,订单营销玩不下去了!

全数崩跌,5000万订单成为世界笑柄,订单营销玩不下去了!

柏铭锐谈
2025-09-14 13:12:13
1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

象视汽车
2025-09-14 07:00:13
重磅消息!七国集团财政部长考虑对俄罗斯支持者征收关税!

重磅消息!七国集团财政部长考虑对俄罗斯支持者征收关税!

翻开历史和现实
2025-09-14 16:10:21
妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

现代快报
2025-09-14 15:13:20
长安首款固态电池来袭:充电10分钟续航1500km!网友:新能源天花板

长安首款固态电池来袭:充电10分钟续航1500km!网友:新能源天花板

刘旷
2025-09-14 15:21:12
9月开学后,整个教育方向都要变了。

9月开学后,整个教育方向都要变了。

玉辞心
2025-09-12 07:19:15
2025-09-15 08:04:49
IT架构师联盟 incentive-icons
IT架构师联盟
IT架构实战分享
796文章数 7668关注度
往期回顾 全部

科技要闻

AI眼镜能否成为下一代人机互动的超级入口?

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

房产
家居
游戏
旅游
公开课

房产要闻

「世界冠军×人居升阶」白鹅潭CLD封面,实力馥见人生新高度!

家居要闻

原木风格 温馨舒适氛围

PS商店现大量AI劣质游戏 玩家笑称谷歌商店有对手了

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版