网易首页 > 网易数码 > 正文

数据中心交换机横向虚拟化集群漫谈

0
分享至

(原标题:数据中心交换机横向虚拟化集群漫谈)

虚拟化技术在数据中心是个时髦词儿,有横向虚拟化、纵向虚拟化、一虚多虚拟化、NVO3虚拟化等等。今天重点跟大家聊聊横向虚拟化,以华为CloudEngine 12800系列为例,让朋友们了解一下此技术的由来和发展史,深入浅出地介绍下各种横向虚拟化技术的特点、以及各种场景下的选择策略。

横向虚拟化集群由来

在数据中心网络发展初期,没有专门的数据中心交换机,那咋办?先拿园区交换机顶着,使用最传统的VRRP+STP,凑合着用吧,就是下面这张经典的园区网络。



这个网络模型,透着浓浓的经典、可靠的园区味道。可时间久了,问题就来了:

 流量越来越大,STP阻断导致链路利用率低;

 非最短路径转发,树根存在带宽瓶颈,转发时延大;

 VRRP单活网关,备节点设备闲置;

 STP网络规模受限,收敛性能较差;

 管理节点多,逻辑拓扑复杂,维护麻烦。

这些问题带来横向虚拟化的诉求,框式交换机集群率先登场。

堆叠

典型的框式交换机堆叠,有CISCO的VSS(Virtual Switch System)、华为的CSS(Cluster Switch System)、H3C的IRF(Intelligent Resilient Framework)。VSS、CSS、IRF在本质上都是堆叠,只是穿了不同的马甲而已,当然各厂家也发展出一些差异,这是后话。

堆叠技术,本质上就是合并,管理平面、控制平面、转发平面的全面合并。堆叠系统的主控板,管理两台物理设备的所有线卡和网板,变成一个逻辑的大交换机。


但需要注意,堆叠目的不仅仅是为了变大,从网络角度看一下逻辑拓扑,一下变得"高富帅"!


"高富帅"的主要表现:

 几乎两倍交换能力的超级节点;

 二三层转发流量完全负载分担,充分利用所有链路;

 逻辑单节点,业务支持全面,网络方案设计简单;

 通过部署跨框link-agg,支持物理节点的故障保护;

 网元二合一,有利于网络管理和维护。

还有零零碎碎的好处也不少:

 最短路径转发,时延低;

 相对传统STP,可以组建更大的二层网络;

 link-agg的收敛性能,网络故障收敛块。

在堆叠系统中,堆叠链路的带宽相对于业务端口,带宽总是不够的。这就要求转发的业务流量尽量避免经过堆叠链路,这就是所谓的流量本地优先转发。


如上图所示,华为数据中心交换机堆叠系统,对三层ECMP、链路捆绑支持本地优先。本地优先转发节省了堆叠链路带宽,同时也达到减少转发时延的目的。

除了上述通用的堆叠技术,华为CloudEngine 12800系列数据中心高端交换机,还针对堆叠的可靠性,做了重大的体质性的优化。

堆叠的优化

可靠性优化(转控分离的堆叠)

转控分离的堆叠,也称为带外堆叠,这个优化主要目的是高可靠性。

业界大部分框式交换机的堆叠,堆叠成员间的控制通道和转发通道都使用一个通道。华为的CloudEngine 12800系列数据中心交换机独创性的开发了转控分离的堆叠系统。这里的"转"指的是业务数据转发通道;"控"指的是控制消息(也称为"信令")通道。

传统的框式堆叠系统,业务数据通道和控制消息通道都使用相同的物理通道,即堆叠链路。如下图所示:


这种堆叠系统,控制消息和数据混合在一起运行,如果堆叠通道的数据通信量大,则可能导致控制消息受到冲击而丢失,进而影响控制面的可靠性。严格来说,这种设计没有满足"数据、控制、管理平面分离"的设计要求。此外,堆叠系统的建立,依赖线卡的启动,导致软件复杂度的提高,以及影响堆叠的启动速度。

转控分离的堆叠系统,采用如下所示架构:


该硬件堆叠架构带来一系列可靠性的提升:

 控制消息通道和业务数据通道物理隔离,保证业务数据不影响控制消息;

 三重的双主故障防护,包括堆叠管理链路(4路)、堆叠转发链路(至少2路)、业务端口/管理端口DAD;

 堆叠系统建立,不再依赖线卡的启动,无软件时序依赖,简化软件实现,而简单意味着可靠;

 堆叠系统建立,不再等待线卡/网板的启动,缩短堆叠系统建立时间;

 控制消息通道路径短,故障点少,时延低。

堆叠改良的局限性

堆叠系统带来了前述系列的好处,但慢慢的,令人不爽的问题也逐渐暴露出来,这是由堆叠原理本质决定的。


如上图所示,两台交换机通过管理平面、控制平面、数据平面的紧耦合,形成逻辑上的一台交换机。这导致了如下三个风险或者问题。

 整系统级可靠性风险

对于普通的故障,堆叠系统可通过链路切换、主备板切换、 框切换等完成故障保护。但是由于整个系统的两台物理switch在软件(管理平面、控制平面)是紧耦合的,这就增大软件故障从一台switch扩散到另一台Switch的可能性。一旦出现这种类型的故障,将导致整个堆叠系统的故障,影响堆叠系统接入的所有业务。

 版本升级的业务中断时间长

由于堆叠本身承担了业务保护功能,因此当堆叠系统升级时,不能像VRRP的成员节点升级时由另外一个节点进行流量保护,中断时间比较长。

对此,各厂商开发出了两框RoundRobin和ISSU的升级方式,这些升级方式缩短了升级时的业务中断时间,但并不解决下面所说的升级风险,甚至因为技术复杂度、软件工程复杂度的提升,放大了升级风险。

   整系统升级风险

设备软件版本升级,即使采用最传统、简单的升级方式,也是一个带风险的网络操作。设备升级失败将导致该设备所带业务失效,这种情况下,要采用包括回退在内的一切手段尽快恢复业务。

堆叠系统由于成员交换机间的紧耦合,只能是两台设备一起升级,升级失败将导致堆叠系统下所有业务网络中断。而堆叠系统,在接入层往往承担服务器双归保护接入的角色、或者在汇聚承担高可靠性网关的角色,这意味着升级失败很可能导致整个业务的瘫痪。

Link-agg虚拟化(M-LAG)

横向虚拟化,从需求角度是为了满足接入层、汇聚层的二层跨设备冗余、汇聚层L3网关的跨设备冗余。那是否还有其他技术,支持横向虚拟化,又没有堆叠的哪些问题?

答案当然是有,华为CloudEngine系列数据中心交换机的M-LAG(Multichassis Link Aggregation Group)就支持这样的虚拟化技术。该技术只在两台设备的link-agg层面实现二层虚拟化,两台成员设备的管理和控制平面是独立的。

注:维基百科称此技术为MC-LAG(Multi-Chassis Link Aggregation Group),CISCO称之为vPC(Virtual Port-Channel)。下文都采用维基百科的术语,即简写为MC-LAG。


MC-LAG,支持的跨设备链路捆绑组网,支持Dual-Active的L3GW。在接入侧,从对端设备视角、服务器视角看,MC-LAG与堆叠类似。

但是,从三层网络角度看,MC-LAG的两个成员节点拥有自己独立的IP地址,两个节点有自己独立的管理和控制平面。从架构角度看,MC-LAG的两个成员设备仅存在数据面的耦合,以及协议面的轻量级耦合:


MC-LAG的架构,决定了此技术方案不存在堆叠难解决的三个问题:

那么,说了MC-LAG的这么多好处,是不是就没有缺点了?当然不是,寸有所长,尺有所短。最后一节比较堆叠与MC-LAG的优缺点,以及场景选择建议。

堆叠和MC-LAG的对比和选择建议

根据上面的对比表格,堆叠和MC-LAG各有优缺点。总的来说,对于网络设计/维护人员,堆叠胜在管理维护简单,MC-LAG胜在可靠性和低升级风险。

在数据中心网络方案设计时,需要权衡考虑,有如下策略可以选择:

 策略一:汇聚层优先考虑可靠性、升级方便性,选择M-LAG;接入层因为设备量大,优先考虑业务部署和维护方便性,选择堆叠。


 策略二:优先考虑可靠性、升级低风险,汇聚和接入都使用M-LAG。


 策略三:优先考虑业务部署和维护方便性,汇聚和接入都使用堆叠。

 

相关推荐
热点推荐
性能力与寿命关系被发现!男性40岁后,睾酮越高,死亡风险越低

性能力与寿命关系被发现!男性40岁后,睾酮越高,死亡风险越低

药师说健康
2025-12-05 09:47:10
泰国军方发言人:铲平所有电诈园区

泰国军方发言人:铲平所有电诈园区

Ck的蜜糖
2025-12-16 15:25:09
著名播音员钟瑞在加拿大病逝!丈夫宋世雄的三件礼物温暖她一生

著名播音员钟瑞在加拿大病逝!丈夫宋世雄的三件礼物温暖她一生

银河史记
2025-12-16 16:18:24
24岁美女被骗到缅北,经历两个月“双开门”折磨,被救已不成人形

24岁美女被骗到缅北,经历两个月“双开门”折磨,被救已不成人形

阿妹讲故事
2025-03-12 22:39:50
曝罗晋陪母亲去大孤山!母亲抱大树痛哭,一路上罗晋递纸巾、拍背

曝罗晋陪母亲去大孤山!母亲抱大树痛哭,一路上罗晋递纸巾、拍背

小徐讲八卦
2025-12-18 10:11:13
越南工厂连夜拆生产线!只因中国电价便宜到他们不敢报价

越南工厂连夜拆生产线!只因中国电价便宜到他们不敢报价

潮鹿逐梦
2025-12-17 14:33:19
人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

翰飞观事
2025-12-18 20:04:42
欧阳娜娜海边一张照冲上热搜:女孩最好的状态,藏在这三个字里!

欧阳娜娜海边一张照冲上热搜:女孩最好的状态,藏在这三个字里!

动物奇奇怪怪
2025-12-18 12:58:32
1953年志愿军司令部爆发激烈争吵,杨勇拍桌子要3个军,许世友当场怒斥:太过分!毛主席:给他打!

1953年志愿军司令部爆发激烈争吵,杨勇拍桌子要3个军,许世友当场怒斥:太过分!毛主席:给他打!

文史明鉴
2025-12-17 19:51:17
结束了!朱拉尼宣布重磅消息,叙利亚人狂欢:终于不用提心吊胆了

结束了!朱拉尼宣布重磅消息,叙利亚人狂欢:终于不用提心吊胆了

沈言论
2025-12-15 16:15:03
知名大学原党委书记,被“双开”!曾是院士有效候选人

知名大学原党委书记,被“双开”!曾是院士有效候选人

双一流高校
2025-12-18 18:10:10
再就业!曝前国安主帅有望回归,或执教前中超冠军球队

再就业!曝前国安主帅有望回归,或执教前中超冠军球队

体坛鉴春秋
2025-12-18 17:11:40
490架与1300架,中美重型战战斗机现状,中国空军不止数量领先

490架与1300架,中美重型战战斗机现状,中国空军不止数量领先

丹妮观
2025-12-17 17:03:52
汽油用量开始暴跌,数据出来很多人惊了!未来油价会大降吗?

汽油用量开始暴跌,数据出来很多人惊了!未来油价会大降吗?

沙雕小琳琳
2025-12-18 04:07:02
博主:U18国青边后卫邓捷夫加盟北京国安

博主:U18国青边后卫邓捷夫加盟北京国安

懂球帝
2025-12-18 19:28:23
“过去两年没收到过消息,她可能已经去世了”

“过去两年没收到过消息,她可能已经去世了”

观察者网
2025-12-15 21:17:04
从何时起,江西菜沦为了民工饮食的代名词

从何时起,江西菜沦为了民工饮食的代名词

食味艺文志
2025-12-18 17:11:05
2026年上半年,贵人主动出现,事业迎来跃迁期的三个星座

2026年上半年,贵人主动出现,事业迎来跃迁期的三个星座

小晴星座说
2025-12-18 19:39:12
男人忘不了的情人,通常是以下三种女人,第二种尤为痴情

男人忘不了的情人,通常是以下三种女人,第二种尤为痴情

叶飞飞情感屋
2025-12-18 17:59:27
河南美女“大晨”去世,年仅28岁,日常开奥迪,一口能喝三两白酒

河南美女“大晨”去世,年仅28岁,日常开奥迪,一口能喝三两白酒

宝哥精彩赛事
2025-12-16 08:40:55
2025-12-18 21:31:00

头条要闻

确认涉刑案 上海市中心西装男子突然当街下跪:对不起

头条要闻

确认涉刑案 上海市中心西装男子突然当街下跪:对不起

体育要闻

巴黎首夺世界级冠军 加冕6冠王比肩巴萨拜仁

娱乐要闻

丝芭放大招了!实名举报鞠婧祎经济犯罪

财经要闻

尹艳林:呼吁加快2.5亿新市民落户进程

科技要闻

2025新一代人工智能创业大赛

汽车要闻

在零下30℃的考场里 凡尔赛C5 X和508L拿到了"稳"的证明

态度原创

艺术
房产
教育
公开课
军事航空

艺术要闻

卡洛斯·杜兰:不只是萨金特的老师!

房产要闻

抢藏疯潮!封关时代,海口顶奢王炸压轴,传世资产即刻登场!

教育要闻

初升高|除了关注中考,对于绵阳学生,更重要的是……

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

福建舰入列后首过台海 台方谈为何"甲板上没有舰载机"

无障碍浏览 进入关怀版
×