IT之家 1 月 26 日消息,AMD 上周正式发布了 ROCm 开源软件堆栈的 7.2.0 版本。这一版本新增了对多款新硬件的正式支持,并优化了 Instinct MI350 系列与 MI300X 显卡加速器的 AI 表现。
![]()
具体来看,ROCm 现已正式支持 AMD Radeon AI PRO R9600D、Radeon RX 9060 XT LP、Radeon RX 7700 三款独立显卡和最近推出的锐龙 AI 400 系列处理器。
同时,这一版本在 Instinct MI355X 上显著提升了 Meta Llama 3.1 405B 模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量提升和延迟降低;优化了 Llama 3 70B 和 Llama 2 70B 在 MI355X、MI350X 上的性能;在 MI300X 上优化智谱 GLM-4.6 的 GEMM 算子性能和 DeepSeek 的 DeepEP 开源通信库表现。
ROCm 7.2.0 还包含其它一系列改进,包括提升 HIP 运行时性能、新增对多 GPU 节点的节点电源管理等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.