亚马逊网络服务(Amazon Web Services)宣布Hpc8a正式上市,这是其针对HPC(高性能计算)优化EC2基础设施的下一代产品。AWS声称,与前代Hpc7a相比,Hpc8a的性能提升高达40%,内存带宽提升42%,性价比提升25%。AWS表示,这些增益来自于解决了一些架构瓶颈,如内存吞吐量和节点间通信,以往这些瓶颈限制了云环境中某些HPC工作负载的性能。
![]()
云HPC通常最适合处理"易并行"工作负载,即那些可以清晰地分发到多个核心且节点间通信需求最少的工作负载。然而,像计算流体力学(CFD)或结构建模这样紧密耦合的MPI应用程序需要跨节点进行频繁数据交换,这使得网络延迟和一致性变得至关重要。当作业扩展到数百或数千个节点时,即使是微小的效率低下也会迅速降低性能并增加成本。
这种动态使得本地集群和超级计算机成为通信密集型HPC工作负载的首选环境。结果往往是在扩展效率与云基础设施的运营灵活性之间进行权衡。随着Hpc8a的推出,AWS正在缩小这种差距。
AWS表示,每个Hpc8a实例配备192个核心、768 GiB内存和300 Gbps的EFA(弹性 光纤适配器),专为处理强扩展MPI工作负载的带宽和同步需求而构建。Hpc8a基于第五代AMD EPYC处理器构建,加速频率可达4.5 GHz,在192核心节点上实现了更高的单核性能和更高的总吞吐量。
持续内存带宽和节点间通信是紧密耦合工作负载的限制因素,因此Hpc8a相比Hpc7a提升42%的内存带宽是一个显著的提升。为Hpc8a提供动力的AMD EPYC 9005系列处理器基于AMD的"Zen 5"微架构,于2024年10月正式发布。与上一代相比,该架构提供了更高的IPC(每时钟周期指令数),AMD声称企业级和云端工作负载的性能提升约17%,在HPC和AI场景下收益更大。
EPYC 9005系列还支持每插槽十二个DDR5内存通道,以及比上一代更高的内存速度。Hpc8a实例使用AWS第六代Nitro系统将网络、存储和虚拟化功能卸载到专用硬件上。通过减少主机CPU开销并最大限度地减少抖动,Nitro旨在在大规模MPI同步下提供更稳定的扩展行为。同步多线程(SMT)也被禁用,这一设计选择旨在为每个核心提供更一致的性能。
![]()
Hpc8a提供单一的96xlarge配置,采用与许多仿真工作负载相匹配的1:4核心内存比,并与AWS ParallelCluster和AWS Parallel Computing Service集成用于集群编排,以及Amazon FSx for Lustre用于高吞吐量并行存储。
早期客户基准测试表明,AWS引用的性能提升正在转化为生产工作负载中的可衡量改进。Rescale是一个跨多个行业支持CAE和多物理场仿真的云HPC平台,报告称与Hpc7a相比,CFD应用程序的速度提升高达52%,CAE工作负载的性能提升高达38%。根据该公司的说法,这些收益是由更高的内存带宽和改进的网络行为驱动的,在流体动力学、结构分析和其他仿真密集型用例中都观察到了这些收益。
气象建模组织也报告了可衡量的性能改进。Spire利用其卫星星座的数据运行高分辨率大气模型,在过渡到Hpc8a后引用了1.5倍的性能提升,称额外的吞吐量使其能够从复杂的大气数据集中更快地生成预报。同样,Weathernews报告称,与Hpc7a相比,其基于天气研究与预报模型的生产工作负载性能提高了34%。在预报环境中,增量性能改进可以直接影响模型周转时间和更新频率,从而产生更及时的任务关键型天气信息预报。
在工业仿真背景下,三菱重工报告称,用于对蒸汽轮机空气动力学进行建模的CFD工作负载加速了36%。该公司指出,性能增加使其能够在现有时间限制内探索更高保真度的物理模型并扩展设计研究的范围。
虽然Hpc8a显然并没有消除云基础设施与专用超级计算机之间的结构差异,但它反映了持续减少约束云中通信密集型工作负载的技术障碍的努力。每核性能的提升、持续内存带宽的改进和节点间网络连接的提升都有助于使更多紧密耦合的应用程序在云中高效扩展。
![]()
"我清楚地记得,当时甚至有人提出要求苛刻的HPC工作负载可以在云中运行的想法时,人们都表示难以置信。" AWS副总裁兼首席传道者Jeff Barr在LinkedIn帖子中表示。"幸运的是,那个时代已经过去。AWS云现在提供EC2实例,拥有大量内存、内存带宽、计算能力和网络带宽,以及文件系统和其他存储,非常适合这些HPC工作负载。"
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.