满配8192张昇腾卡，华为首次在海外展示全球最强超节点|内存|服务器|英伟达|新模型|知名企业|atlas

满配8192张昇腾卡，华为首次在海外展示全球最强超节点

2026-03-01 18:14:11　来源: 观察者网

上海举报

分享至

文/观察者网吕栋

当地时间3月2日，世界移动通信大会（MWC26）将在西班牙巴塞罗那开幕。观察者网从现场了解到，华为将首次在海外展示最新的Atlas 950 SuperPoD，以及TaiShan 950 SuperPoD等多个型号的超节点产品和解决方案，并强调坚持开源开放，打造坚实的算力底座，为世界提供新选择。

Atlas 950超节点首次出现在2025年的华为全联接大会上。

当时，华为轮值董事长徐直军介绍了昇腾950DT芯片，它更注重推理Decode阶段和训练场景。而Atlas 950超节点最大支持8192张昇腾950DT卡通过“灵衢”全光互联，这将是昇腾384超节点的20多倍。它的算力规模也将明显提升，其中FP8算力达到8E FLOPS，FP4算力达到16E FLOPS，互联带宽达到16PB/s。这个数字意味着，Atlas 950一个产品的总互联带宽，已经是今天全球互联网峰值带宽的10倍有余。

从算力规模、互联带宽等指标看，Atlas 950在未来多年都将是全球最强的超节点。相比英伟达在2026年下半年上市的NVL144，Atlas 950超节点卡的规模是其56.8倍，总算力是其6.7倍，内存容量是其15倍，达到1152TB；互联带宽是其62倍，达到16.3PB/s。即便与英伟达计划2027年上市的NVL576相比，Atlas 950超节点在各方面依然是领先的。

华为在MWC2026现场展示超节点

坦白来讲，昇腾芯片受限于制程，单卡指标将长期处于追赶的状态。那Atlas 950超越英伟达，就是单纯堆8192张芯片这么简单吗？观察者网之前也报道过，堆卡是提升国产算力规模的办法，但仅靠粗暴堆卡并不一定有好的效果。大模型参数规模已迈入万亿级时代，传统服务器堆叠的模式，面临集群规模越大，算力利用率越低，训练中断越频繁的困境。

超节点就是为解决传统计算集群面临的多重挑战而生。它从传统以CPU为中心的架构，变成了全平等互联，无论是CPU、NPU还是内存单元，都不用再经过CPU，而是能平等互联，提高通信效率，同时连接计算单元的“高速公路”也发生了变化，由全新的协议和总线能力来支撑设备间互联。一个真正的超节点，应该具备超大带宽、超低时延和内存统一编址等关键特点，实现逻辑上像一台计算机一样学习、思考和工作。

因此在开放的新型互联协议灵衢（UnifiedBus）支撑下，Atlas 950不仅是算力规模和内存容量提升，同时内存访问速度、互联带宽等能力也明显增强。相比昇腾384超节点，Atlas 950的训练性能提升17倍，达到4.91M TPS。通过支持FP4数据格式，Atlas 950的推理性能提升26.5倍，达到19.6M TPS。

根据观察者网了解，Atlas 950超节点预计将在今年上半年在国内发布，并在四季度上市。而这次在巴塞罗那亮相的除了Atlas 950，还有Atlas 850E超节点，但具体规格尚未公布。

与此同时，华为这次在巴塞罗那还将展示TaiShan 950 SuperPoD，以及TaiShan 500、TaiShan 200等系列新一代通算服务器，满足客户高、中、低算力选择。其中TaiShan 950是全球首个通算超节点。徐直军曾表示，TaiShan 950加上分布式GaussDB数据库，能帮助金融系统破解核心难题，将成为各类大型机、小型机的终结者，彻底取代各种应用场景的大型机和小型机以及Oracle的Exadata数据库服务器。

超节点足够强大，但支撑其运行的不只有芯片、光模块等硬件，还有大量软件生态，比如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等等。华为表示，将始终坚持技术创新，开源开放，构筑坚实的算力底座，共建开放共赢的计算产业生态，为世界提供新选择。

本文系观察者网独家稿件，未经授权，不得转载。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.