![]()
华为在深圳的合作伙伴大会上甩出一张Atlas 350加速卡,搭载全新昇腾950PR处理器。官方标称FP4算力1.56 PFLOPS,这个数字被华为拿来直接对标Nvidia H20——号称是后者的2.87倍。
![]()
FP4这种低精度格式Hopper架构原生不支持,所以2.87倍这个倍数很难较真。但华为抢了个先手:Atlas 350是第一款专门优化FP4的国产加速卡,同样硬件能塞下更大的模型,显存压力直接砍半。换句话说,这是在用精度换空间的路子上,比老黄先跑了一步。
![]()
显存配置也挺凶。112GB的HiBL 1.0高带宽内存,带宽拉到1.4TB/s,128字节颗粒度。华为说小操作场景的访存效率能翻四倍,多模态生成和推理任务算是被它盯上了。
昇腾950PR相比前代910系列改了微架构,内存访问更快,编程模式也更灵活。不过这些"灵活"到底能让开发者少写多少行代码,现场没给demo,只有一页PPT的参数表。
「Atlas 350为高效多模态生成和推理任务而设计。」华为在材料里这么写。有参会者拍了照片发在脉脉上,评论区第一条是:"参数没输过,生态没赢过。"
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.