网易首页 > 网易号 > 正文 申请入驻

ISC24 | NVIDIA Blackwell 平台推动科学计算突破发展

0
分享至

最新加速器和网络平台提升高级模拟、AI、量子计算、数据分析等方面的性能。



从量子计算到新药研发和聚变能源领域,随着加速计算和 AI 的进步,全球涌现了一项又一项重大突破,基于物理模拟的科学计算有望推进造福人类的各个领域大幅进步。

NVIDIA 在今年 3 月的 GTC 上发布了 NVIDIA Blackwell 平台,该平台可在万亿参数级大语言模型(LLM)上实现生成式 AI,而且其成本和能耗相较于 NVIDIA Hopper 架构最低可降至 1/25。

Blackwell 对 AI 工作负载具有重大的意义,其技术能力还将有助于推进包括传统的数值模拟在内的各类科学计算应用的探索工作。

加速计算和 AI 通过降低能源成本推动可持续计算。许多科学计算应用已从中受益。相较于基于传统 CPU 的系统和其他系统,天气模拟的成本和能耗分别降至其 1/200 和 1/300,数字孪生模拟的成本和能耗则分别降至其 1/65 和 1/58。

利用 Blackwell 实现

科学计算模拟性能倍增

科学计算和基于物理的模拟通常依赖于所谓的双精度格式或 FP64(浮点)来解决问题。Blackwell GPU 的 FP64 和 FP32 FMA(融合乘加)性能比 Hopper 高出 30% 。

基于物理的模拟对产品设计和开发至关重要。无论是飞机、火车,还是桥梁、半导体芯片和药品,在模拟中对产品进行测试和改进能够为研究人员和开发人员节省数十亿美元。

现今的专用集成电路(ASIC)几乎完全是在 CPU 上设计的,整个流程漫长且复杂,包括进行模拟分析以确定电压和电流。

但这种情况正在发生改变。比如,Cadence SpectreX 模拟器就是一个典型的模拟电路设计求解器。SpectreX 电路模拟在 Grace Blackwell 超级芯片(由 Blackwell GPU 和 Grace CPU 连接而成)上的运行速度预计可达到传统 CPU 的 13 倍。

此外,GPU 加速的计算流体动力学(CFD)已成为一种重要工具。工程师和设备设计师用它来预测各种设计的行为。Cadence Fidelity 在 NVIDIA 的 Grace Blackwell 系统上运行 CFD 模拟的速度预计比传统基于 CPU 系统快 22 倍,前所未有的流动细节都可被捕捉到。

在另一项应用中,Cadence Reality 的数字孪生软件被用于创建物理数据中心的虚拟复制品,包括其服务器、冷却系统、电源在内的所有组件。这种虚拟模型可以让工程师在现实世界中进行应用之前,就能够提前对各种配置和方案进行测试,从而节省时间和成本。

Cadence Reality 的优异之处在于其基于物理的算法可以模拟热量、气流和用电量对数据中心的影响。这有助于工程师和数据中心运营人员更有效地管理容量,预测潜在的运行问题,并做出明智的决策,通过优化数据中心的布局和运行,从而提高效率和容量利用率。借助 Blackwell GPU,这些模拟的运行速度预计比 CPU 快高达 30 倍,从而加快了完成时间并提高了能效。

AI 在科学计算中的应用

全新 Blackwell 加速器和网络平台将大幅提升模拟性能。

NVIDIA Grace Blackwell 开启了高性能计算(HPC)的新时代。其架构采用第二代 Transformer 引擎,经过优化,可加速 LLM 推理工作负载。

与上一代 Hopper 架构 GPU 相比,Blackwell 架构使资源密集型应用如 1.8 万亿参数的 GPT-MoE(生成式预训练转换器-专家混合)模型实现了 30 倍的提速,为 HPC 开辟了新的可能性。通过让 LLM 处理和解读海量科学数据,高性能计算应用可以更快获得有价值洞察,从而加速科学探索。

桑迪亚国家实验室正在构建一个适用于并行编程的 LLM 智能助手。传统的 AI 可以高效生成基本的串行计算代码,但当涉及到 HPC 应用的并行计算代码时,LLM 就会显得力不从心。桑迪亚的研究人员正在通过一个雄心勃勃的项目解决这个问题,他们准备用 Kokkos 自动生成并行代码。Kokkos 是一种由多国实验室设计的编程语言,专门用于在全球最强大超级计算机的数万个处理器上运行任务。

桑迪亚国家实验室正在使用一种被称为检索增强生成(RAG)的 AI 技术将信息检索能力与语言生成模型相结合。该项目团队正在创建一个 Kokkos 数据库,并利用 RAG 将其与 AI 模型集成。

初步结果十分喜人。桑迪亚国家实验室采用的不同 RAG 方法已经自主生成了用于并行计算应用的 Kokkos 代码。他们希望通过克服 AI 并行代码生成中的障碍,为全球领先的超级计算设施提供新的 HPC 可能性。

其他示例包括可再生能源研究、气候科学和新药研发。

推动量子计算的进步

量子计算为聚变能、气候研究、新药研发等领域带来了大幅加速。因此,研究人员正努力在基于 NVIDIA GPU 的系统和软件上模拟未来的量子计算机,以前所未有的速度开发和测试量子算法。

NVIDIA CUDA-Q 平台通过一个实现 CPU、GPU 和 QPU(量子处理器)协同工作的统一编程模型,实现量子计算机模拟和混合应用开发。

CUDA-Q 正在加快巴斯夫化学工作流、石溪大学高能和核物理学研究以及 NERSC 量子化学的模拟速度。

NVIDIA Blackwell 架构将助推量子模拟达到新高度。通过最新的 NVIDIA NVLink 多节点互连技术,可以更快地打通数据以提高量子模拟速度。

加快数据分析以推动科学突破

使用 RAPIDS 处理数据的方式在科学计算领域非常常见。Blackwell 加入了一个硬件解压缩引擎,能够对压缩数据进行解压缩,并加快在 RAPIDS 中的分析速度。

该解压缩引擎可将性能提升至 800GB/s,使 NVIDIA Grace Blackwell 在查询基准测试中的性能较 CPU(在 Sapphire Rapids 上)快 18 倍,较 NVIDIA Hopper Tensor Core GPU 快 6 倍。

凭借 8TB/s 的高内存带宽和 Grace CPU 高速 NVLink 片间(C2C)互连技术,该引擎可大幅提高数据传输速度,进而加快整个数据库查询过程。Blackwell 能够在数据分析和数据科学用例中发挥出卓越性能,从而加快数据洞察速度并降低成本。

NVIDIA 网络平台

为科学计算提供极致性能

NVIDIA Quantum-X800 InfiniBand 网络平台可为科学计算基础设施提供最高吞吐量。

该平台包含 NVIDIA Quantum Q3400 和 Q3200 交换机, 以及 NVIDIA ConnectX-8 SuperNIC,二者组合在带宽上可达上一代产品的两倍。Q3400 平台的带宽容量提高了 5 倍,并且借助 NVIDIA 的 SHARPv4(可扩展分层聚合和归约协议)技术实现了 14.4 Tflops 的网络计算能力,较上一代产品提高了 9 倍。

性能的飞跃和能效的提高,使科学计算的工作负载完成时间与能耗显著减少。

了解更多关于 NVIDIA Blackwell 的信息,请点击:https://www.nvidia.cn/data-center/technologies/blackwell-architecture/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
福建“高考状元”年薪154万,被公司辞退后,从顶楼天台一跃而下

福建“高考状元”年薪154万,被公司辞退后,从顶楼天台一跃而下

坦然风云
2024-06-01 12:50:17
财政破产,亡国之兆

财政破产,亡国之兆

求实处
2024-05-10 23:05:43
迪拜富豪宠物展,女人被当成牲畜,被宾客鞭打电击场面惨不忍睹!

迪拜富豪宠物展,女人被当成牲畜,被宾客鞭打电击场面惨不忍睹!

知心故事会
2023-06-04 18:25:24
27年前!多特上次夺欧冠是96/97赛季,你能认全那时多特首发吗?

27年前!多特上次夺欧冠是96/97赛季,你能认全那时多特首发吗?

直播吧
2024-06-01 16:43:08
紧急提醒全体股民!A股即将迎来超级大变盘,下周A股一定这样走!

紧急提醒全体股民!A股即将迎来超级大变盘,下周A股一定这样走!

静守时光落日
2024-06-01 12:50:23
TVB男星自爆儿子患罕见遗传病,直言难以接受,计划与太太再生一个

TVB男星自爆儿子患罕见遗传病,直言难以接受,计划与太太再生一个

TVB剧评社
2024-06-02 00:09:44
大陆中止ECFA关税减让后,台公布民调,称76%民众不认同九二共识

大陆中止ECFA关税减让后,台公布民调,称76%民众不认同九二共识

说天说地说实事
2024-06-01 07:51:39
我借调机关五年,加班时送保洁大姐一份外卖,晚上她悄悄来我宿舍,第二天我掀了领导桌子

我借调机关五年,加班时送保洁大姐一份外卖,晚上她悄悄来我宿舍,第二天我掀了领导桌子

职场火锅
2024-05-30 17:17:29
看过《瑷珲条约》全文,你有什么感想

看过《瑷珲条约》全文,你有什么感想

雷达夜
2024-05-28 23:07:27
特朗普扬言轰炸北京,中国国防部斥丧心病狂,话音刚落他就出事了

特朗普扬言轰炸北京,中国国防部斥丧心病狂,话音刚落他就出事了

小影的娱乐
2024-05-31 15:19:36
时隔18个月,中美防长面对面聊得怎样?

时隔18个月,中美防长面对面聊得怎样?

直新闻
2024-05-31 23:15:22
少妇离婚后,阴差阳错和妹夫住进情侣房,原来一切都是妹妹的阴谋

少妇离婚后,阴差阳错和妹夫住进情侣房,原来一切都是妹妹的阴谋

想养大熊猫
2024-05-13 12:01:26
再见波尔!挽救3个赛点出局,360度致谢球迷,激动落泪总结生涯

再见波尔!挽救3个赛点出局,360度致谢球迷,激动落泪总结生涯

乒谈
2024-06-01 22:34:40
大黄蜂攻势如潮!摩根吐槽:多特正在将皇马撕成碎片

大黄蜂攻势如潮!摩根吐槽:多特正在将皇马撕成碎片

直播吧
2024-06-02 03:47:16
担心技术被转移到中国 美国正减缓NVIDIA和AMD向中东出口AI芯片的速度

担心技术被转移到中国 美国正减缓NVIDIA和AMD向中东出口AI芯片的速度

cnBeta.COM
2024-05-31 08:45:04
股市大事件!高层终于下狠手,比央妈降息还有爆发力,下周要爆了

股市大事件!高层终于下狠手,比央妈降息还有爆发力,下周要爆了

静守时光落日
2024-06-01 01:18:18
将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

慎独赢
2024-05-24 13:05:54
湖南深挖彻查,蒋某方等18人被抓

湖南深挖彻查,蒋某方等18人被抓

大爱三湘
2024-06-01 22:23:09
1991年,中国总理奔赴远东招募苏联专家,从白俄罗斯淘回镇国神器

1991年,中国总理奔赴远东招募苏联专家,从白俄罗斯淘回镇国神器

干史人
2024-05-10 19:25:03
村支书禹作敏:想当副总理只接待正部级,93年使400警察不敢进村

村支书禹作敏:想当副总理只接待正部级,93年使400警察不敢进村

百年历史老号
2024-04-04 21:46:50
2024-06-02 03:54:44
NVIDIA英伟达中国
NVIDIA英伟达中国
英伟达(中国)官方账号
2373文章数 1274关注度
往期回顾 全部

科技要闻

余承东:不卷价格!雷军:将双班制生产!

头条要闻

小伙投资300万在瑞典开拉面馆生意火爆 1碗面卖100元

头条要闻

小伙投资300万在瑞典开拉面馆生意火爆 1碗面卖100元

体育要闻

女排最强2主攻合体 合砍40分打懵泰国

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

财经要闻

实锤!普华永道,危!

汽车要闻

吉利银河E5 Flyme Auto智能座舱首发

态度原创

本地
亲子
艺术
公开课
军事航空

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

亲子要闻

爬行垫突然倒下砸向哥哥,倒地瞬间弟弟冲上去了!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

公开课

近视只是视力差?小心并发症

军事要闻

拜登称以色列提出新的三阶段停火方案

无障碍浏览 进入关怀版