网易首页 > 网易号 > 正文 申请入驻

中美算力,都迎超节点

0
分享至

AI算力竞争的焦点,正在从单卡转向超节点。超节点是AI时代的核心计算单元,正在成为衡量token生产力的核心指标,也检验着从芯片、内存、通信到供电与冷却的全栈协同创新。中国在AI竞赛中从美国技术栈解耦,“”的路径,不仅必要,而且正在变得可行。

在上周的乌镇互联网大会上,曙光ScaleX640超节点登台亮相。这是今年继华为昇腾384与128之后,又一款国产的百卡级的超节点技术栈,而且单一机柜互联规模越来越大。此外,中兴、浪潮与新华三也在跟进。

超节点的出现与演进,是对大模型技术趋势的响应。扩展定律驱动的参数指数增长、从训练到推理的场景泛化、以及向多模态与智能体的跃迁,正在共同施压AI基础设施。除了提升单卡性能,要更有效地兑现token经济学,就需要“大规模、高带宽、低时延”的超节点架构。

对中国算力生态而言尤其如此。在算力有限与成本敏感环境中,万亿参数MOE是中国大模型厂商的默认主流方案,专家越来越稀疏,专家间通信越来越频繁。Kimi K2与Qwen3‑Max总参数规模已经超越万亿,其他厂商也将在接下去几个月的模型迭代中接近这一规模;稀疏模型的专家(Expert)规模也在快速膨胀,Qwen3-Next足足512个专家。按照官方说法,相比传统方案,最新的曙光ScaleX640超节点,可实现万亿参数MoE大模型在训练与推理场景,获得30%-40%的性能提升。

超节点是一个行业概念,口径不一,而非严格的技术标准。业内根据互联拓扑的带宽密度与拓扑直径,将算力耦合程度划分为Node、Pod与Cluster等多个层级。部分厂商将单一机柜的互联称为SuperNode,跨机柜的互联称为SuperPod。英伟达往往将单机柜称为Rack-Scale,谷歌则称之为Cube。

中国正在寻求单柜算力密度的突破。在目前已公开的超节点中,曙光ScaleX640实现了单柜640卡超高速总线纵向互连,相对领先。它还能通过“一拖二”高密架构设计,组成千卡级计算单元,最终可保障10万卡级超大规模集群扩展部署。同样实现单柜百卡互联,集群十万卡互联的,还有阿里巴巴的磐久超节点(SuperNode)。它单柜最大支持2组纵向扩展,共128个GPU,并支持10万卡稳定互联的灵骏集群。阿里巴巴的下一步是512颗AI芯片的纵向扩展,全光互连。曙光ScaleX640与磐久128都采用了正交架构设计,高密度集成,有助于降低信号衰减与时延。

目前,英伟达在售最先进超节点为GB300 NVL72,即72个B300在Oberon机柜内部纵向互联,可横向扩展为576卡互联,并可部署为数十万卡集群。但英伟达也将基于最新的kyber机架,提升单柜密度。在最近的GTC上,黄仁勋透露会在明年推出Vera Rubin NVL144,后年推出Rubin Ultra NVL576。

谷歌与亚马逊的超节点,单柜算力密度膨胀速度不如英伟达。谷歌即将上市的最新Ironwood,单一SuperPod最多可通过OCS(光学电路交换机)容纳9216颗芯片,还能横向扩展到数十个SuperPod。不过,它单一机柜通过ICI(高速芯片间互连)互联的TPU为64块。亚马逊的Trainium2 UltraServer,为64卡纵向互联,完整集群可部署40万颗Trainium2;市场预估下一代的Trainium3 UltraServer可以达到单柜128卡规模。

通信巨头华为,更接近于谷歌与亚马逊的模式。目前,根据华为Atlas 900超节点(Superpod)——大家常听到的CloudMatrix384是华为云基于该超节点构建的云服务实例——的用户指南,它由12个计算柜和4个总线柜组成,单一计算柜4个计算节点共32卡,还“可构建16万卡超算集群,满足十万亿参数级大模型训练需求,突破传统架构扩展极限。”

Atlas 900SuperPoD 计算柜逻辑组网


依托于昇腾单卡算力性能的逐步追赶,以及灵衢(UnifiedBus)互联协议链接,保持低延迟的全局通信,徐直军称华为的“在未来多年都将是全球最强算力的超节点”。

明年四季度,华为Atlas 950超节点预期上市,柜内正交架构,柜间全光互联,支持单机柜64卡(128个计算柜),共8192张Ascend 950芯片。相比英伟达同期超节点新品,它的总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍;它还可以进一步构建50万卡集群。到2027年四季度,将是支持15488张昇腾卡的Atlas 960超节点,其中单机柜88卡(176个计算柜),总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。


但无论如何,各家巨头的超节点,单柜算力密度与整体算力规模都在大幅提升。为了让电力适配算力的扩展,国内外算力巨头都在提出400伏到800伏的高压直流,(SST)。这些技术选择也将深刻重塑整个配电架构,进而影响超节点竞争格局。

中国的超节点方案的演进方向,不仅受到技术路径的推动,也受到产业结构的影响。

英伟达是明显的垂直整合模式,其核心是通过对整个技术栈的端到端控制,实现最优的性能和效率;这也能将用户锁定在自己的封闭生态内,增加用户迁移成本,并压榨出更高的利润率。谷歌也是典型的垂直整合模式,但它的TPU目前仍然更多内部采用。

而AMD以及亚马逊等超大规模用户,则往往采取“协议开放”的模式,AMD带头创建了UAlink联盟,博通则推动OpenAI加入基于以太网(Ethernet)纵向扩展(Scale-Up)网络方案的ESUN联盟。这种模式的核心挑战在于生态系统的碎片化和性能优化的难度。

而对于中国而言,开源开放与协同创新,是产业结构决定的现实路径。无论是阿里巴巴、华为还是中科曙光,中国的超节点方案,正在走向芯片、内存、通信到供电与冷却的全栈协同创新,这与这与模型—芯片的协同设计逻辑一致。事实上,超节点很难是单一巨头的单打独斗。就连封闭生态的英伟达,也在走向有限合作。至少,配电不是黄仁勋的专业领域。今年,在COMPUTEX上,他宣布成立800V高压直流(HVDC)供电供应商联盟。

中国虽然在半导体制造链条上填补了多个关键空白,但单卡性能仍与全球领先产品存在“纳米级”差距,且国内 GPU 厂商多点并行、市场高度碎片化,难以依赖单一芯片形成规模优势。一方面,这要求国内为数众多的开发者与研究者能够低门槛地加速融入接入国产算力生态,;另一方面,也要通过开放兼容的结构层,消除供应链的不确定性。

在摆脱对英伟达依赖的过程中,为了减少迁移成本,尽管阿里巴巴、华为还是中科曙光,在垂直自研领域积累相对雄厚,都拥有自己的CPU与GPU产品线,但都坚持旗下超节点相关技术栈的开源开放。

今年9月,中科曙光联合20家供应链企业共同发布的“AI计算开放架构”,即曙光ScaleX640超节点的前身,在硬件层面支持多品牌加速卡,软件层面兼容主流计算生态;在华为全联接大会2025上,华为宣布CANN编译器、虚拟指令集接口与灵衢2.0技术规范开放,Mind系列应用使能套件及工具链全面开源;在云栖大会上,阿里云展示的磐久服务器,支持第三方芯片,包括兼容海光K100、燧原S60等主流国产GPU以及飞腾S500c、海光C86-3G等主流国产CPU——只要它们乐意适配Alink。

中国开源模型正在征服硅谷的AI应用企业,也在全球南方加速渗透,牵引着中国完整的AI技术栈的边际外溢。也许中国的超节点暂时无法进入欧美市场,但随着AI全球竞争从前沿大模型与先进AI芯片,转向更为商品化的token生产力的竞争,中国的超节点产品也将出海赢得自己的一席之地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曾琦早期上电视节目被扒,主持核心和下乡会诊,面对镜头笑容满面

曾琦早期上电视节目被扒,主持核心和下乡会诊,面对镜头笑容满面

你食不食油饼
2025-11-09 11:58:02
14分逆转!杜兰特31+7 申京23+11+7,火箭力克雄鹿,字母哥37+8

14分逆转!杜兰特31+7 申京23+11+7,火箭力克雄鹿,字母哥37+8

易说篮球
2025-11-10 08:19:36
陈志根本不是重点,别再盯着他的下落了

陈志根本不是重点,别再盯着他的下落了

麦大人
2025-11-03 15:37:57
现在中央第一才女,颜值不输中央所有女主持人!

现在中央第一才女,颜值不输中央所有女主持人!

乡野小珥
2025-11-09 12:27:34
2米28张子宇被禁止扣篮?宫鲁鸣却为何力挺:女篮实战扣第一人!

2米28张子宇被禁止扣篮?宫鲁鸣却为何力挺:女篮实战扣第一人!

篮球快餐车
2025-11-10 06:53:03
欲哭无泪!跌到脚踝了,南京一楼盘从9万跌到2万,学区房不吃香了

欲哭无泪!跌到脚踝了,南京一楼盘从9万跌到2万,学区房不吃香了

火山诗话
2025-11-10 08:39:37
余华:我们对人性最大误会,是以为只要是人,都会有点人性和良心

余华:我们对人性最大误会,是以为只要是人,都会有点人性和良心

杏花烟雨江南的碧园
2025-10-10 14:00:03
11.10日早评|做好准备!周末突发重磅!A股要爆?

11.10日早评|做好准备!周末突发重磅!A股要爆?

龙行天下虎
2025-11-10 03:12:02
59岁的罗马里奥已与22岁女友分手,巴媒:他又有了新约会对象

59岁的罗马里奥已与22岁女友分手,巴媒:他又有了新约会对象

懂球帝
2025-11-09 19:34:10
俄罗斯为啥不担心芯片制造光刻机问题?除中国,其他国家都不担心

俄罗斯为啥不担心芯片制造光刻机问题?除中国,其他国家都不担心

百态人间
2025-10-31 05:35:02
河北小伙娶小12岁乌克兰绝色美女,结婚11年后,妻子出轨波兰农民

河北小伙娶小12岁乌克兰绝色美女,结婚11年后,妻子出轨波兰农民

青史楼兰
2025-09-16 10:44:15
何赛飞用肥皂卸妆,62岁无皱纹,教科书式“打脸”精致女星

何赛飞用肥皂卸妆,62岁无皱纹,教科书式“打脸”精致女星

娱乐圈十三太保
2025-10-27 17:41:15
湖南曾医生穿吊带衣走红,单店销量18万件,17分钟不雅视频讲了啥

湖南曾医生穿吊带衣走红,单店销量18万件,17分钟不雅视频讲了啥

汉史趣闻
2025-11-09 18:17:17
昨日 哈马斯扣押11年后 以色列军官哈达尔·戈德林的遗体终于回家了

昨日 哈马斯扣押11年后 以色列军官哈达尔·戈德林的遗体终于回家了

阿芒娱乐说
2025-11-10 08:02:09
痛心!又一博士离世!年仅32岁,无父母,跟爷奶生活,即将结婚

痛心!又一博士离世!年仅32岁,无父母,跟爷奶生活,即将结婚

前沿天地
2025-11-10 05:59:29
二战时,德国为什么送中国40万套装备?要走了垂涎已久的三样东西

二战时,德国为什么送中国40万套装备?要走了垂涎已久的三样东西

别人都叫我阿腈
2025-11-09 10:27:25
演员于适任中国骑射运动中心执行主任,曾在《封神三部曲》饰演姬发

演员于适任中国骑射运动中心执行主任,曾在《封神三部曲》饰演姬发

澎湃新闻
2025-11-09 16:58:35
42岁佟丽娅男友被公开,两人牵手超甜蜜,丫丫看到镜头立马甩开手

42岁佟丽娅男友被公开,两人牵手超甜蜜,丫丫看到镜头立马甩开手

夜深爱杂谈
2025-11-09 20:55:54
我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

五元讲堂
2025-11-05 10:35:02
三连胜登顶!劳塔罗队史第四射手,国米用最霸气方式回击所有质疑

三连胜登顶!劳塔罗队史第四射手,国米用最霸气方式回击所有质疑

体坛老球迷
2025-11-10 08:40:53
2025-11-10 09:19:00
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
241文章数 52关注度
往期回顾 全部

科技要闻

他们,害怕“双11”

头条要闻

男子50多万买66台苹果手机放平台出租 如今钱机都没了

头条要闻

男子50多万买66台苹果手机放平台出租 如今钱机都没了

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

俄罗斯大幅加税 中国汽车出口骤降58%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

教育
本地
家居
手机
公开课

教育要闻

学校管理的“四梁八柱”

本地新闻

这届干饭人,已经把博物馆吃成了食堂

家居要闻

现代自由 功能美学居所

手机要闻

iPhone可能获得这5项卫星连接功能

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版