文/观察者网 吕栋
当地时间3月2日,世界移动通信大会(MWC26)将在西班牙巴塞罗那开幕。观察者网从现场了解到,华为将首次在海外展示最新的Atlas 950 SuperPoD,以及TaiShan 950 SuperPoD等多个型号的超节点产品和解决方案,并强调坚持开源开放,打造坚实的算力底座,为世界提供新选择。
Atlas 950超节点首次出现在2025年的华为全联接大会上。
当时,华为轮值董事长徐直军介绍了昇腾950DT芯片,它更注重推理Decode阶段和训练场景。而Atlas 950超节点最大支持8192张昇腾950DT卡通过“灵衢”全光互联,这将是昇腾384超节点的20多倍。它的算力规模也将明显提升,其中FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。这个数字意味着,Atlas 950一个产品的总互联带宽,已经是今天全球互联网峰值带宽的10倍有余。
从算力规模、互联带宽等指标看,Atlas 950在未来多年都将是全球最强的超节点。相比英伟达在2026年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即便与英伟达计划2027年上市的NVL576相比,Atlas 950超节点在各方面依然是领先的。
![]()
华为在MWC2026现场展示超节点
坦白来讲,昇腾芯片受限于制程,单卡指标将长期处于追赶的状态。那Atlas 950超越英伟达,就是单纯堆8192张芯片这么简单吗?观察者网之前也报道过,堆卡是提升国产算力规模的办法,但仅靠粗暴堆卡并不一定有好的效果。大模型参数规模已迈入万亿级时代,传统服务器堆叠的模式,面临集群规模越大,算力利用率越低,训练中断越频繁的困境。
超节点就是为解决传统计算集群面临的多重挑战而生。它从传统以CPU为中心的架构,变成了全平等互联,无论是CPU、NPU还是内存单元,都不用再经过CPU,而是能平等互联,提高通信效率,同时连接计算单元的“高速公路”也发生了变化,由全新的协议和总线能力来支撑设备间互联。一个真正的超节点,应该具备超大带宽、超低时延和内存统一编址等关键特点,实现逻辑上像一台计算机一样学习、思考和工作。
因此在开放的新型互联协议灵衢(UnifiedBus)支撑下,Atlas 950不仅是算力规模和内存容量提升,同时内存访问速度、互联带宽等能力也明显增强。相比昇腾384超节点,Atlas 950的训练性能提升17倍,达到4.91M TPS。通过支持FP4数据格式,Atlas 950的推理性能提升26.5倍,达到19.6M TPS。
根据观察者网了解,Atlas 950超节点预计将在今年上半年在国内发布,并在四季度上市。而这次在巴塞罗那亮相的除了Atlas 950,还有Atlas 850E超节点,但具体规格尚未公布。
与此同时,华为这次在巴塞罗那还将展示TaiShan 950 SuperPoD,以及TaiShan 500、TaiShan 200等系列新一代通算服务器,满足客户高、中、低算力选择。其中TaiShan 950是全球首个通算超节点。徐直军曾表示,TaiShan 950加上分布式GaussDB数据库,能帮助金融系统破解核心难题,将成为各类大型机、小型机的终结者,彻底取代各种应用场景的大型机和小型机以及Oracle的Exadata数据库服务器。
超节点足够强大,但支撑其运行的不只有芯片、光模块等硬件,还有大量软件生态,比如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等等。华为表示,将始终坚持技术创新,开源开放,构筑坚实的算力底座,共建开放共赢的计算产业生态,为世界提供新选择。
本文系观察者网独家稿件,未经授权,不得转载。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.