网易首页 > 网易号 > 正文 申请入驻

英伟达性能怪兽,内部细节详解

0
分享至

来源:内容由半导体行业观察(ID:icbank)编译自theregister,谢谢。

如果您希望可以时常见面,欢迎标星收藏哦~

Nvidia 上个礼拜发布了迄今为止最强大的 DGX 服务器。120kW 机架规模系统使用 NVLink 将 72 个新型 Blackwell 加速器拼接在一起,形成一个本质上能够提供超过 1.4 exaFLOPS 性能的大型 GPU(无论如何,在 FP4 精度下)。

在这里,我们仔细研究机架规模系统,Nvidia 声称该系统可以支持大量训练工作量以及对高达 27 万亿个参数的模型进行推理,但目前还没有任何模型有这么大。

该系统被称为 DGX GB200 NVL72,是 Nvidia在 11 月份展示的基于 Grace-Hopper Superchip 的机架系统的演变。然而,这个处理器的 GPU 数量是其两倍多。

计算堆栈

虽然 1.36 公吨(3,000 磅)机架系统作为一个大型 GPU 进行销售,但它由 18 个 1U 计算节点组装而成,每个节点都配备了两个 Nvidia 的 2,700W Grace-Blackwell Superchips (GB200)。

大量部件使用 Nvidia 的 900GBps NVLink-C2C 互连将 72 核 Grace CPU 与一对顶级规格的 Blackwell GPU 结合在一起。

总体而言,每个 Superchip 均配备 864GB 内存(480GB LPDDR5x 和 384GB HBM3e),根据 Nvidia 的说法,可以推动 40 petaFLOPS 的稀疏 FP4 性能。这意味着每个计算节点能够产生 80 petaFLOPS 的人工智能计算,整个机架可以执行 1.44 exaFLOPS 的超低精度浮点数学运算。

系统前端是四个 InfiniBand NIC(请注意机箱面板左侧和中心的四个 QSFP-DD 笼),它们构成了计算网络。该系统还配备了 BlueField-3 DPU,我们被告知它负责处理与存储网络的通信。

除了几个管理端口之外,该机箱还具有四个小型 NVMe 存储盒。

凭借两个 GB200 超级芯片和五个 NIC,我们估计每个节点的功耗为 5.4kW 到 5.7kW。绝大多数热量将通过直接芯片 (DTC) 液体冷却方式带走。Nvidia 在 GTC 上展示的 DGX 系统没有冷板,但我们确实看到了合作伙伴供应商的几个原型系统,例如联想的这个系统。

然而,与我们从 HPE Cray 或联想的 Neptune 系列中看到的以液体冷却所有设备的一些以 HPC 为中心的节点不同,Nvidia 选择使用传统的 40mm 风扇来冷却 NIC 和系统存储等低功耗外围设备。

将它们缝合在一起

在他的主题演讲中,首席执行官兼皮夹克爱好者 Jensen Huang 将 NVL72 描述为一个大型 GPU。这是因为所有 18 个超密集计算节点都通过位于机架中间的九个 NVLink 交换机堆栈相互连接。

Nvidia 的 HGX 节点也使用了相同的技术来使其 8 个 GPU 发挥作用。但是,NVL72 中的 NVLink 开关并不是像下面所示的 Blackwell HGX 那样将 NVLink 开关烘焙到载板上,而是一个独立的设备。

这些交换机设备内部有一对 Nvidia 的 NVLink 7.2T ASIC,总共提供 144 100 GBps 链路。每个机架有 9 个 NVLink 交换机,可为机架中 72 个 GPU 中的每个 GPU 提供 1.8 TBps(18 个链路)的双向带宽。

NVLink 交换机和计算底座均插入盲插背板,并具有超过 2 英里(3.2 公里)的铜缆布线。透过机架的背面,您可以隐约看到一大束电缆,它们负责将 GPU 连接在一起,以便它们可以作为一个整体运行。

坚持使用铜缆而不是光纤的决定似乎是一个奇怪的选择,特别是考虑到我们正在讨论的带宽量,但显然支持光学所需的所有重定时器和收发器都会在系统已经巨大的基础上再增加 20kW电力消耗。

这可以解释为什么 NVLink 交换机底座位于两个计算组之间,因为这样做可以将电缆长度保持在最低限度。

电源、冷却和管理

在机架的最顶部,我们发现了几个 52 端口 Spectrum 交换机 — 48 个千兆位 RJ45 和四个 QSFP28 100Gbps 聚合端口。据我们所知,这些交换机用于管理和传输来自构成系统的各个计算节点、NVLink 交换机底座和电源架的流式遥测。

这些交换机的正下方是从 NVL72 前面可见的六个电源架中的第一个 - 三个位于机架顶部,三个位于底部。我们对它们了解不多,只知道它们负责为 120kW 机架提供电力。

根据我们的估计,六个 415V、60A PSU 就足以满足这一要求。不过,Nvidia 或其硬件合作伙伴可能已经在设计中内置了一定程度的冗余。这让我们相信它们的运行电流可能超过 60A。我们已向 Nvidia 询问有关电源架的更多详细信息;我们会让您知道我们的发现。

不管他们是怎么做的,电力都是由沿着机架背面延伸的超大规模直流母线提供的。如果仔细观察,您可以看到母线沿着机架中间延伸。

当然,冷却 120kW 的计算并不是小事。但随着芯片变得越来越热和计算需求不断增长,我们看到越来越多的比特仓(包括 Digital Realty 和 Equinix)扩大了对高密度 HPC 和 AI 部署的支持。

就 Nvidia 的 NVL72 而言,计算交换机和 NVLink 交换机均采用液体冷却。据 Huang 介绍,冷却剂以每秒 2 升的速度进入 25 摄氏度的机架,离开时温度升高 20 度。

横向扩展

如果 DGX GB200 NVL72 的 13.5 TB HBM3e 和 1.44 exaFLOPS 稀疏 FP4 还不够,那么可以将其中的 8 个网络连接在一起,形成一个具有 576 个 GPU 的大型 DGX Superpod。

果您需要更多计算来支持大型训练工作负载,则可以添加额外的 Superpod 以进一步扩展系统。这正是 Amazon Web Services 通过Project Ceiba所做的事情。这款 AI 超级计算机最初于 11 月宣布,现在使用 Nvidia 的 DGX GB200 NVL72 作为模板。据报道,完成后该机器将拥有 20,736 个 GB200 加速器。然而,该系统的独特之处在于,Ceiba 将使用 AWS 自主开发的 Elastic Fabric Adapter (EFA) 网络,而不是 Nvidia 的 InfiniBand 或以太网套件。

英伟达表示,其 Blackwell 部件,包括机架规模系统,将于今年晚些时候开始投放市场。

https://www.theregister.com/2024/03/21/nvidia_dgx_gb200_nvk72/?td=rt-9cs

点这里加关注,锁定更多原创内容

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3715期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马未都:我身价至少100亿,但这点钱,跟我母亲比,我就是个贫农

马未都:我身价至少100亿,但这点钱,跟我母亲比,我就是个贫农

忠于法纪
2026-01-15 22:08:28
中国福利彩票发行管理中心公布变更后的《中国福利彩票双色球游戏规则》

中国福利彩票发行管理中心公布变更后的《中国福利彩票双色球游戏规则》

界面新闻
2026-01-16 16:28:21
17日至21日我国将有寒潮和雨雪冰冻过程陕晋豫鲁鄂湘皖有暴雪 黄淮江淮江南等地有强降温

17日至21日我国将有寒潮和雨雪冰冻过程陕晋豫鲁鄂湘皖有暴雪 黄淮江淮江南等地有强降温

中国气象局
2026-01-15 17:08:22
WTT球星赛:8强大名单出炉6席,蒯曼3:1晋级,申裕斌朱芊曦被淘汰

WTT球星赛:8强大名单出炉6席,蒯曼3:1晋级,申裕斌朱芊曦被淘汰

林子说事
2026-01-16 11:10:25
黄健翔:乌兹别克实力很强;我们被动防守踢反击是无奈常态

黄健翔:乌兹别克实力很强;我们被动防守踢反击是无奈常态

懂球帝
2026-01-16 13:43:04
特朗普对华改口了!他对记者表示:中国可以向美国商品开放市场

特朗普对华改口了!他对记者表示:中国可以向美国商品开放市场

扶苏聊历史
2026-01-16 15:26:28
为救朱元璋他身中9箭,朱元璋直言:定不负你!27年后却将其抄家

为救朱元璋他身中9箭,朱元璋直言:定不负你!27年后却将其抄家

铭记历史呀
2026-01-16 15:15:59
当年我养猪供侄子上大学,他当上官再没回老家,直到我被村霸欺负

当年我养猪供侄子上大学,他当上官再没回老家,直到我被村霸欺负

五元讲堂
2025-08-21 15:12:14
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
特朗普下令对伊朗动武,不到24小时,接到一通电话后紧急叫停行动

特朗普下令对伊朗动武,不到24小时,接到一通电话后紧急叫停行动

三农老历
2026-01-16 16:54:21
1972年,毛主席当众指着她鼻子骂:你男人跟别人好了,你怎么不离婚?

1972年,毛主席当众指着她鼻子骂:你男人跟别人好了,你怎么不离婚?

寄史言志
2026-01-07 21:08:15
外媒:委内瑞拉政府和反对派代表将同时现身华盛顿

外媒:委内瑞拉政府和反对派代表将同时现身华盛顿

参考消息
2026-01-15 14:13:05
委内瑞拉和伊朗这一手“反水”直接给中国上了一堂最昂贵的战略课

委内瑞拉和伊朗这一手“反水”直接给中国上了一堂最昂贵的战略课

霹雳炮
2026-01-15 22:50:39
斯嘉丽·约翰逊全球票房冠军地位被取代

斯嘉丽·约翰逊全球票房冠军地位被取代

TVB的四小花
2026-01-16 10:01:16
中超劲旅官宣与5名球员续约,新赛季将冲击联赛冠军

中超劲旅官宣与5名球员续约,新赛季将冲击联赛冠军

中超伪球迷
2026-01-16 17:36:41
枭龙又火了!中国官宣战绩后六国排队下单,印媒直呼:绝对不可能

枭龙又火了!中国官宣战绩后六国排队下单,印媒直呼:绝对不可能

单手搓核弹
2026-01-16 15:39:26
越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

老杉说历史
2026-01-14 20:31:37
马杜罗被抓细节曝光,4厘米的偏移,让他没躲进近在咫尺的安全屋

马杜罗被抓细节曝光,4厘米的偏移,让他没躲进近在咫尺的安全屋

贱议你读史
2026-01-08 04:25:03
美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

乐天闲聊
2026-01-15 11:54:57
中国口岸,一满载6.9万吨巴西大豆的货轮被查出混入农药处理麦粒

中国口岸,一满载6.9万吨巴西大豆的货轮被查出混入农药处理麦粒

百态人间
2026-01-16 16:08:57
2026-01-16 19:12:49
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12705文章数 34762关注度
往期回顾 全部

数码要闻

苹果首款AI眼镜计划于二季度亮相:轻量化设计,无显示屏

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

关店102家贾国龙喊被污蔑 罗永浩回应

科技要闻

传小米传音Ovi四家手机厂下调全年出货预期

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

时尚
教育
旅游
数码
家居

年度最扎心电影,看得中年男女坐立难安

教育要闻

网络安全法实施!这五个专业人才身价暴涨,打响百万年薪抢人战

旅游要闻

《轧戏》热播带动文旅热 新世界庄园成上海文旅新标杆

数码要闻

华硕天选6 Pro锐龙版游戏本福利来袭,直降+国补入手仅需7649元

家居要闻

岁月柔情 现代品质轻奢

无障碍浏览 进入关怀版