天津智博会开展第一天,华为和中科曙光展区被围得水泄不通。
昇腾384超节点,国产算力第一个吃螃蟹的,384张NPU跨16机柜打通,300PFlops算力,生态成熟度摆在那儿,去年帮不少企业解了燃眉之急。但坦白讲,多机柜部署的空间和成本,中小企业真扛不住。
然后隔壁中科曙光把scaleX万卡超集群真机一摆,画风就变了。
一个数就够:单机柜640张加速卡。华为那边单机柜32张。密度差20倍!
翻译成人话:同样万卡规模,华为需要26组384各自为战,单是计算柜就得300多个,跨组互联还要额外解决通信栈和光模块的规模化难题。曙光这边,16个机柜搞定,原生RDMA网络把通信效率再拉高18%。
这就是代际差——不是在跑分上差几个点,是在系统架构层面换了一套玩法。
华为走的是垂直整合,生态护城河极深,这没问题。但曙光的玩法意味着什么?不锁死任何品牌AI加速卡,多厂商混合部署,供应链弹性拉满。在当前芯片供应环境下,这比任何跑分都更有现实杀伤力。
更关键的是成本。scaleX的万卡超集群,算力密度暴增的直接结果就是部署成本断崖式下降——以前上千万的项目,现在几百万就能跑。这是把AI训推门槛从头部大厂拉到了中小企业够得着的位置。
华为把超节点这条路走通了,功不可没。但曙光用一套重新设计过的系统架构告诉行业:超节点可以不用堆机柜,万卡集群可以不用盖新机房。
国产算力两条路,一条求深,一条求广。各有各的战场,但历史无数次证明,“群众路线”一定会走得更远。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.