文/Matt Kimball
当地时间周一,AMD新推出了Milan-X CPU和MI200系列GPU,以扩展其在高性能计算机群(HPC)领域的能力。Milan-X结合了封装和独特的3D叠加,实现了AMD所称的高性能计算机群负载的显著性能提升。与此同时,MI200是一款新的GPU设计,能与英伟达的A100 GPU直接竞争,而后者是高性能计算机群的主力。AMD的这些新产品对公司意味着什么?更重要的是,这对IT消费者意味着什么?
超级计算是对服务器的最终性能测试。它是一个宽泛的术语,指的是利用大量资源进行计算密集型和数据密集型处理的工作负载/应用程序。天气建模、崩溃模拟、药物和疫苗开发,以及金融交易预测等都是超级计算领域中高性能计算机群的例子。
超级计算能测试系统的设计极限,而这体现在性能维度上。因此,当像Top500这样的组织发布世界上最强大超级计算机的榜单时,这对所有相关方来说都是一件大事,不管是CPU、GPU,还是服务器平台。在过去的几年里,AMD在Top500和Green500的榜单中一直处于颠覆性地位,这两个榜单分别衡量了全球顶级超级计算机的原始计算能力和效能功耗比。
在超级计算机榜单上,AMD的计算能力排在第48位之后,看起来不怎么样?但想想这个,前48位中有45个都是自2020年以来新进入榜单的,而在2021年新推出的48款系统中,AMD的产品被用在了其中的24款中。
对于AMD和EPYC来说,Green500的榜单更令人印象深刻。榜单上的前10大超级计算机中有8个采用了EPYC,同时它们也采用了英伟达的A100 GPU。在2021年新推出的48款系统中,EPYC占了24款,英特尔Xeon则占了22款。而且,几乎所有的EPYC都使用了64核CPU,这代表了很大的原始计算能力。相比之下,基于Xeon的系统主要在24核范围内。
通过Milan-X,AMD引入了一种新的3D技术,直接将缓存层置于计算复杂系统之上,并将其恰当地命名为3D-V缓存。这与使用焊接技术的现有3D堆栈技术不同,与其相比,新技术将互联密度提高了15倍,能源效率提高了3倍,而与2D技术相比,互联密度则提高了200倍。AMD称,Milan-X将在现有Milan的目标工作负载的基础上实现50%的性能上传。
这是AMD讲述的一个令人印象深刻的故事。但是对于部署这类集群和计算网络的组织来说,是否部署一种CPU类型取决于性能。这通常是一个对原始性能的度量指标,而有时则采用效能功耗比指标。通过Milan,AMD已经展示出了令人印象深刻的数据,其在性能表现上比一个有着类似配置的英特尔CPU高出了40%。
除了规格和基准测试结果之外,AMD在关于Milan-X的公告中有两点令人鼓舞:易于采用和生态系统支持。Milan-X是对现有Milan的接口兼容升级,这意味着IT组织可以简单地通过更换CPU和刷新BIOS来享受Milan-X的好处。这个新的CPU需要资格认证吗?有人认为需要,但考虑到体系结构的一致性,这个过程应该能得到最大程度的简化。此外,Milan-X不需要对软件或操作系统进行更改或重构。
AMD似乎也在Milan-X的生态系统支持方面做得很好。通过确保完全支持各自工作负载类别中的领先的ISV参与者,AMD让IT部门相信,快速且无障碍地获得显著性能的路径不仅仅是一些市场承诺。
自从推出EPYC以来,AMD已经证明了自己在数据中心领域的实力。对部署EPYC有任何犹豫的组织都是落后于时代的组织。Milan-X的推出表明,该公司正在明智地投资那些它认为有机会增强其已经强大的领导地位的领域。
除了Milan-X,MI200也引起了外界关注,因为AMD似乎把竞争目标直接瞄准了英伟达的A100 GPU。
AMD的数据肯定支持其关于高性能计算机群和AI(特别是AI训练)的性能优势的说法。浮点和BFloat的性能优势是显著的,特别是与Milan-X的CPU配对时。
在AMD看来,MI200设计中的关键创新体现在了其性能的提升上。第二代矩阵核心横跨两个AMD的CDNA芯片,并由八个堆栈的高带宽内存(HBM)和连贯的CPU-GPU互连,这简直就是为内存和计算密集型工作负载量身定制的。
为了构建和扩展Instinct的软件生态系统,AMD正在对抗强大的CUDA。但是,前者采取了正确的方法,执行得当,并在这个不会一夜之间发生转变的领域表现出了耐心。这体现在了其最新发布的ROCm 5.0。由于ROCm 4.0专注于交付和巩固已经可以生产的HPC和ML堆栈,所以ROCm 5.0希望可以在此基础上进行新的构建。
AMD正悄悄地确立起其在数据中心性能方面的领导地位。最初,它在云服务提供商(CSP)领域取得了巨大成功,随后又在高性能计算机群市场取得了几次胜利。
AMD已经采取了两项重大举措,这将加速其服务器市场份额的增长。第一个是在几个季度前引入的“F”系列EPYC处理器,目标是主流企业工作负载,如数据库。如果其定位和进入市场的努力得到支持,这些CPU将使AMD及其硬件合作伙伴获得显著的收益。
第二步则是推出Milan-X和Instinct MI200系列,仅靠其性能本身就应该能提升EPYC的采用。
高性能计算机群市场不仅有利可图,而且是主流服务器应用的试验场,再加上其在云计算领域的成功,如果AMD能正确地发挥其在数据中心方面的营销手段,EPYC的前途将是无限的。
Matt Kimball是福布斯撰稿人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.