智通财经APP获悉,东兴证券发布研报称,自2025年开始,超节点成为AI算力网络重要的技术创新方向。从AI基建竞争维度看,AI芯片厂商从芯片算力性能竞争延续至芯片+Scale up网络的双战场,自英伟达等芯片公司后,全球越来越多厂商加入超节点赛道竞争。当前全球超节点竞争格局尚未确立,基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商。
东兴证券主要观点如下:
目前英伟达超节点已经推出成熟方案
2024-2026年,英伟达陆续推出GH200 NVL72、GB200/GB300 NVL72、VR200 NVL72三代超节点。
Hopper架构开启超节点Scale up初步探索。GH200通过NVLink和NVLink-C2C(Chip-to-Chip)技术,使得每个GPU可以访问其他所有CPU和GPU芯片的内存,实现GPU与CPU内存统一编址。
Blackwell架构推动Scale up标准化。GB200 NVL72将Scale-up规模稳定在72 个 GPU/机柜,形成可复制标准化方案。NVL72由 18 个 Compute Tray(计算托架)和9个 Switch Tray(网络交换托架)构成。其中,Compute Tray是计算核心单元,负责提供强大的计算能力;Switch Tray是高速通信枢纽,用于实现GPU之间的高速数据交换。NVL72背板通过“NVLink5私有协议 + 铜线缆”将18个 Compute Tray中的72颗B200 GPU和9个Switch Tray中的18颗NVSwitch芯片进行满带宽全连接。
Rubin架构推动Scale up方案带宽倍增。2026年1月CES展会,英伟达发布Rubin架构VR200 NVL72。其中NVLink 6 Switch实现单GPU的互连带宽提升至3.6 TB/s,上代为1.8TB/s。Scale out方面,Spectrum-6交换机支持CPO(共封装光学)技术,将32个 1.6Tb/s硅光光学引擎与交换芯片直接封装集成。
在超节点方案上,英伟达处于领先优势
2024-2025年,英伟达陆续推出GH200 NVL72、GB200/ GB300 NVL72等成熟超节点解决方案。根据大摩预测,2025年英伟达 GB200/300 NVL72出货量约2800台。展望2026-2027年,英伟达计划推出 Vera Rubin NVL144和Rubin Ultra NVL576。互联GPU数将从72颗进一步向576颗发展。届时,英伟达将在新一代Kyber机架架构中引入NVLink Switch Blade(NVLink交换机刀片),通过PCB中板替代传统5000+根有源铜缆。可以看到,Rubin Ultra NVL576仍具有较强的工程创新能力。
英伟达超节点的优势建立在NVLink 和NVLink Switch
为实现AI训练集群高带宽与低延迟数据传输,NVLink重新设计通信架构,并引入一系列先进技术,包括网状拓扑、差分信号传输、流量调度信用机制、多Lane绑定技术、统一内存空间等。截止2025年,NVLink 5 Switch实现支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向),支持72 GPU全互联通信。在后续计划中,NVSwitch Gen6和Gen7的 GPU-to-GPU通信带宽继续升级为3.6TB/s。
但另一方面,Scale up 网络兴起源于满足大模型分布式训练和推理中的张量并行(TP)与专家并行(EP)。目前AI产业也在探索降低TP与EP规模的技术方案,从而降低Scale up网络规模的上限。Scale up网络的发展空间或限制英伟达在超节点领域的领先优势。为保持领先优势,实现Scale up网络和Scale out网络融合或将成为英伟达超节点新的发展趋势。
投资策略
自2025年开始,超节点成为AI算力网络重要的技术创新方向。从AI基建竞争维度,AI芯片厂商从芯片算力性能竞争延续至芯片+Scale up网络的双战场。因此,除了原先英伟达、华为、AMD以及谷歌等芯片公司,全球更多厂商加入超节点赛道的竞争,包括微软、Meta、Amazon、中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份(新华三)、沐曦股份、恒为科技等。
东兴证券认为,全球超节点竞争格局尚未确立。英伟达目前处于领先地位,建议关注英伟达超节点供应链,包括PCB背板、高速铜缆、光模块、供电与液冷系统等。其次,中国厂商在超节点与Scale up网络领域的参与度很高,或有国内厂商在超节点领域取得领先优势,建议关注发布国产超节点的云厂商、通信设备厂商与芯片厂商。最后,基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商。
风险提示
(1)LLM训练与推理技术路径变化;(2)超节点互联方案不确定性;(3)英伟达超节点出货量低于预期;(4)AI应用端增长不及预期。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.