网易首页 > 网易号 > 正文 申请入驻

华为超节点赶超英伟达:驾驭“光”很关键

0
分享至

文 观察者网 吕栋

2025年以来,超节点(SuperPod)作为新的AI算力基础设施,不断成为行业焦点。观察者网也曾深度报道过华为的昇腾384超节点,它通过高速互联总线将384颗昇腾芯片连接起来,在超节点算力规模、网络互联带宽、内存总带宽等多个指标上,赶超了国外厂商的旗舰系统。

但当时一些讨论认为,华为是靠堆砌了384颗芯片,才超越了英伟达72颗芯片,而后很多厂商也跟进了超节点的概念。一时间,算力行业掀起了建设超节点的热潮。那回到最初的问题,超节点就是单纯的堆芯片吗?华为是通过暴力堆砌芯片赶超英伟达的吗?超节点和传统的计算集群区别在哪?


关于这些行业热点话题,华为计算产品线营销运作部部长张爱军近日在一场媒体沙龙上对观察者网等媒体做了详解。他首先认为,今天的算力需求远未被满足,无论是大模型进入到生产系统中,还是在toC消费端,token消耗的数量都在指数级增长,未来中国每日token消耗量可能突破千万亿。

在一些观点看来,算力缺口大可以通过大量建设服务器集群堆卡来解决。这么说听起来有一定道理,但真实情况远没有这么简单。根据Meta公布的论文,万卡集群训练时算力利用率仅约38%,粗暴堆卡可能会造成62%的算力浪费,并且模型训练会3个小时中断一次。

这是因为,集群网络通信已成为当前大模型训练和推理的最大挑战。以DeepSeek这种混合专家模型(MoE)为例,每个“专家”如果不能有效沟通,NPU就会由于没有足够数据计算而闲置,进而形成1+1<2的结果。换句话说,如果384颗昇腾芯片简单叠加,计算效果就会和普通服务器集群一样效率低下。

超节点就在这种情况下应运而生,它不是修补式改进,而是对传统计算架构进行重构。张爱军对观察者网表示,超节点从传统以CPU为中心的架构,变成了全平等互联,无论是CPU、NPU还是内存单元,都不用再经过CPU,而是可以平等互联,提高通信效率,同时连接计算单元的“高速公路”也发生了变化,由全新的协议和总线能力来支撑设备间互联。


现在市面上的超节点越来越多,但并没有统一标准,而张爱军认为,真正的超节点须具备三个关键特点:一是带宽够大,核心要让计算不用等待通信;二是有足够低的时延,传统集群很难做到时延降低;三是形成有效的、逻辑上的单一系统,关键在于内存能不能统一编址。利用这些技术,超节点可以让DeepSeek的256个“专家”分布到每个计算单元上,提升吞吐效率。

“为什么要有统一内存编址的技术才能真正称得上超节点?”他进一步对观察者网解释称,传统集群的信息传递,跟现实生活中寄快递的方式比较像,需要做相应的转换才能找到下单地址。而超节点希望像在图书馆里检索书籍一样,提前进行书籍编址,能快速找到,而且可以变成资源池。如果没有统一内存编址,就不能做到内存的池化。如果没有内存池化,计算单元之间的数据快速交换很难做到。如果不能快速交换数据,计算效率是很难提升的。这是为什么说做不到统一内存编址,超节点是很难真正高效地运行起来的原因之一。”


一句话总结,超节点相比传统集群最大的优势,是计算效率的显著提升。以芯片制程为例,在摩尔定律放缓的情况下,7纳米到3纳米,可能每代性能提升不超过20%。而超节点可以将模型算力利用率从30%提升到45%,相当于提升了50%,通过资源的高效调度,在一定程度上可以弥补芯片工艺代差。

但打造一个真正的超节点远没有那么容易。关注技术细节的人可能会发现,华为的昇腾384超节点是由12个计算柜和4个总线柜构成,体积庞大,而英伟达NVL72系统只有一个机柜,为什么英伟达不连接更多机柜,进而连接更多芯片?

核心在于超节点架构不同,英伟达采用的全铜线架构,传递的是电信号,而华为将光通信技术应用于超节点,采用超高速光模块连接。“如果用电的方式,高速信号基本只能在一个机柜里两到五米传送,这也是为什么很多业界的超节点只能在一个机柜里面提供。为什么华为可以跳出单个机柜限制,规模商用384个芯片互联,未来可以支持8192个芯片互联,核心是我们用了光的技术。”张爱军对观察者网表示。

但“光”并不好驾驭。光模块成本高,也比较娇惯,如果有灰尘,有各种各样的温度变化,容易发生闪断、系统不稳定,要做的像电一样可靠,像光一样长度,难度很大。

“我们是怎么做到的?一句话,系统化创新,华为可以做自己的芯片,有自己光的器件能力,有自己的底层协议,在过去光通信上构建了工程能力,我们做到了借助全光互联提供超节点。为什么其它厂商做不到?就是因为他们或许掌握了某些单点技术,但很难像华为一样有系统化能力,这也得益于过去华为一直在通信领域深厚的积累。过去20年,我们在光上面是全球第一的技术积累。”张爱军对观察者网说道。

华为不仅在做智算超节点,也在发展通算超节点。去年的华为全联接大会上,华为轮值董事长徐直军发布了基于鲲鹏950处理器的TaiShan 950超节点,这是全球首个通用计算超节点,将在2026年一季度上市。他当时表示,TaiShan 950加上分布式GaussDB数据库,将彻底取代各种应用场景的大型机和小型机,以及Oracle的Exadata数据库服务器。


“大家过去买服务器,主要关注CPU的主频和核数。但今天大量的场景通过调整主频和核数是难以解决的,核心原因是因为摩尔定律已经走到头了,物理的效能很难,堆再多的核、提升再高的主频,很难把计算效能提升上去。有一条新路,通过通信的能力把多核能够连接起来,形成有效的业务系统,同样给通用计算提供相应的能力。核心和智算是一样的,提供超大带宽、超低时延、进行统一内存编址。”张爱军说道。

在华为的思考中,无论是智算还是通算超节点,乃至像Atlas 950 SuperCluster这样数十万卡的巨型超节点集群,核心是要让大量服务器像一台计算机一样工作,由此华为构建了新型互联协议灵衢UB(UnifiedBus),并将灵衢2.0规范开放。

“灵衢是构建超节点的核心能力,华为把它完全开放出来,让业界所有的人都可以获取到这个技术。基础协议有600页,是所有厂商中提供的最详细、最完整的能力。通过对灵衢2.0协议的开放,产业界伙伴能够借助这个技术打造自己的超节点。我们希望与产业界共创,能够形成一个繁荣的产业生态,希望这些新的能力、新的技术不仅仅华为在使用,而是整个产业链一起来构建。”张爱军表示。


超节点足够火热,但支撑其运行的不只有芯片、光模块等硬件,还有大量软件生态,比如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等等。

生态需要产业共建,华为一直坚持软件开源开放。张爱军表示,“目前鲲鹏注册开发者有380万,昇腾有将近400万开发者。2025年8月,我们把CANN完全开源开放,openEuler也是业界第一个面向超节点的开源操作系统。特别是CANN,我们从最底层的运营时,到开发语言、模版库算子库等,完整地开源给产业界,现在已经有很多开发者基于昇腾CANN的能力,自己开发算子,来面向它的业务场景进行创新。AI 时代的迭代速度远超以往,单打独斗很难跟上节奏,协同共创、开放共生才能共赢未来。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演员吴启华卖肖像权拍AI电影,称完全不用亲自拍摄,“终于又重温一次当男主的滋味”,并大方表示酬劳不错

演员吴启华卖肖像权拍AI电影,称完全不用亲自拍摄,“终于又重温一次当男主的滋味”,并大方表示酬劳不错

洪观新闻
2026-06-29 14:52:15
世界杯:加拿大1-0南非首进16强 欧斯塔基奥92分钟贴地斩绝杀

世界杯:加拿大1-0南非首进16强 欧斯塔基奥92分钟贴地斩绝杀

狍子歪解体坛
2026-06-29 04:58:03
北京市率先建立平台经济“破卷向善”协商对话机制,围绕餐饮外卖商家降本增利开展协商

北京市率先建立平台经济“破卷向善”协商对话机制,围绕餐饮外卖商家降本增利开展协商

界面新闻
2026-06-29 15:10:22
日本球迷挑衅!巴西网友回击:向全世界科普日本二战罪行+731恶行

日本球迷挑衅!巴西网友回击:向全世界科普日本二战罪行+731恶行

念洲
2026-06-29 20:03:58
9名游客在福建仙游一峡谷发生意外,多部门到场救援,已确认5人身亡4人平安;事发地并非景区,此前已设置警示牌劝阻游客进入

9名游客在福建仙游一峡谷发生意外,多部门到场救援,已确认5人身亡4人平安;事发地并非景区,此前已设置警示牌劝阻游客进入

大风新闻
2026-06-29 15:41:04
上海球迷穿日本队球衣庆祝!上海市足协:足球无国界 球迷有祖国

上海球迷穿日本队球衣庆祝!上海市足协:足球无国界 球迷有祖国

念洲
2026-06-29 06:50:42
乌克兰36岁国防部长费多罗夫专访:人工智能和无人机正在重塑现代战场

乌克兰36岁国防部长费多罗夫专访:人工智能和无人机正在重塑现代战场

爆角追踪
2026-06-29 17:31:33
罗体:贝克汉姆成补水暂停主角,世界杯广告狂吸1900万镑

罗体:贝克汉姆成补水暂停主角,世界杯广告狂吸1900万镑

懂球帝
2026-06-29 19:24:16
法拉利被孩子当滑梯玩后续,车主:维修费14360元必须照价赔偿

法拉利被孩子当滑梯玩后续,车主:维修费14360元必须照价赔偿

映射生活的身影
2026-06-29 16:14:33
李连杰首度公开回应不管前妻两女儿:她们曾被送回北京由奶奶带大,但利智给前妻女儿买房留钱到100岁

李连杰首度公开回应不管前妻两女儿:她们曾被送回北京由奶奶带大,但利智给前妻女儿买房留钱到100岁

背包旅行
2026-06-29 15:13:56
女子在餐厅情不自禁亲热,男友抓扯上衣险些走光,全程画面流出

女子在餐厅情不自禁亲热,男友抓扯上衣险些走光,全程画面流出

李晚书
2026-06-29 11:34:44
长鑫存储,利空来了?

长鑫存储,利空来了?

博闻财经
2026-06-29 20:12:42
1分35秒念完稿子就跑!洪明甫半夜开辞职发布会 民众暴怒:侮辱人

1分35秒念完稿子就跑!洪明甫半夜开辞职发布会 民众暴怒:侮辱人

风过乡
2026-06-29 07:59:07
克里姆林宫突传噩耗,普京的“接班人”离世,50年老友为何走散?

克里姆林宫突传噩耗,普京的“接班人”离世,50年老友为何走散?

流史岁月
2026-06-29 16:23:01
扎心的问题:这个社会那么多人失业、没工作,他们是怎么活下去的

扎心的问题:这个社会那么多人失业、没工作,他们是怎么活下去的

慧翔百科
2026-06-29 11:30:42
没有预告,卢卡申科突然访华,普京有心无力,白俄只有中国能救?

没有预告,卢卡申科突然访华,普京有心无力,白俄只有中国能救?

徐竦解说
2026-06-29 21:48:00
突发!世界杯疑现假球 FIFA被呼吁调查,细节曝光,网友:不惊讶

突发!世界杯疑现假球 FIFA被呼吁调查,细节曝光,网友:不惊讶

西昆仑Bruce
2026-06-29 19:44:45
博主称车载螺纹接口是华为口,已申请专利,小米被迫使用,未来政策收紧,还要交专利费!网友:节奏带得飞起

博主称车载螺纹接口是华为口,已申请专利,小米被迫使用,未来政策收紧,还要交专利费!网友:节奏带得飞起

大白聊IT
2026-06-29 17:52:55
为什么中国人不反感纳粹德国,德国军官亲自上前线牺牲在抗日战场

为什么中国人不反感纳粹德国,德国军官亲自上前线牺牲在抗日战场

兵卒史
2026-06-29 01:11:02
多次表态“台湾属于中国” 的梅朗雄再次硬气发声,将第四次竞选法国总统

多次表态“台湾属于中国” 的梅朗雄再次硬气发声,将第四次竞选法国总统

文汇报
2026-06-29 16:54:19
2026-06-30 00:31:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
144207文章数 1850871关注度
往期回顾 全部

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

财经要闻

万达广场批量易主 多位投资人正式入局

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

时尚
本地
教育
公开课
军事航空

杨紫,视后!

本地新闻

贵州小城的新目标:举办“村超”世界杯!

教育要闻

“六大”扩容“十三大”,到底谁才是真正隐藏的实力派?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京最新发声:俄罗斯正处于命运攸关之际

无障碍浏览 进入关怀版