网易首页 > 网易号 > 正文 申请入驻

“超节点”火了,AI算力有救了

0
分享至

21世纪经济报道记者孔海丽

近期,“超节点”在AI圈成为当红热词。

半个月之内,业界陆续推出了多款超节点方案,字节、阿里、腾讯的新一代服务器均将采用超节点设计,旨在突破单机性能瓶颈,满足激增的大模型应用需求。浪潮信息也于近日官宣了其超节点AI服务器——“元脑SD200”。

所谓超节点,英文名为SuperPod,最早由英伟达提出,是一种通过系统级架构创新,将大量计算芯片紧密耦合为单一高速互连域的技术。与简单堆砌多个集群不同的是,超节点是系统不断Scale Up的最优解。

厂商们向超节点涌入,将算力困境的解决方案从单点突破带向系统级重构,他们的探索有望推动AI产业突破算力瓶颈,解决当下最棘手的问题。

Scale Up成为突破算力瓶颈的必然选择

随着AI技术的飞速发展,大模型参数规模已突破万亿级别,如DeepSeek、Qwen、Kimi等开源模型的涌现,显著降低了技术门槛,推动了“智能平权”。然而,模型规模的膨胀也带来了前所未有的算力挑战。

更大规模(万亿参数)、更长上下文演进的发展趋势,导致推理时KV Cache需求剧增,远超当前单颗AI芯片乃至主流多卡服务器的承载极限。

同时,Agentic AI具备自主决策、连续任务执行、多模态交互等核心能力,Agent推理过程需要生成比传统模型多100倍的Token。

此外,Agent中的大模型输出往往是下一步的输入,要求推理速度越快越好,当前主流大模型API普遍拥有50-100 Tokens/s的推理速度,这对显存带宽提出了更高的要求。

构建更大规模的GPU集群有两种路径,分别是Scale Out和Scale Up,前者指的是横向扩展,增加节点的数量,Scale Up是纵向扩展,增加单节点的资源数量。

据中国科学院物理所介绍,每台服务器里,多塞几块GPU,这就是Scale Up。这时,一台服务器就是一个节点。通过网络,将多台电脑(节点)连接起来,这就是Scale Out。

对于单台服务器来说,受限于空间、功耗和散热,能塞入的GPU数量是有限的,一般也就8卡、12卡。塞入这么多块GPU,还要考虑服务器的内部通信能力是否能够支持。如果GPU互连存在瓶颈,那么就达不到Scale Up的预期效果。

单纯堆砌硬件不仅成本高昂,且难以实现线性性能提升,算力利用率低下。要想解决算力难题,依靠单芯片或小规模集群的性能提升已难以为继。

面对单点算力、显存的天花板,构建大规模Scale Up系统,通过并行计算技术(如专家并行、张量并行)将模型权重与KV Cache拆分到多个AI芯片上协同工作,是解决万亿参数模型推理挑战的唯一可行路径。

对模型进行更大尺度的拆分,可以进一步降低单芯片负载,释放空间容纳更多KV Cache,从而提升系统并发数与推理速度,实现降本提速。

浪潮信息副总经理赵帅接受采访时表示,我们需要构建大规模、高集成度的Scale Up系统,通过紧密耦合大量的AI芯片形成单一高速互连域,才能汇聚起超大显存池以承载模型,并通过优化互连拓扑与协议实现芯片间超低延迟、高带宽通信,从而满足万亿模型推理“放得下、算得快”的极致要求。

超节点这种加强版的Scale Up,在性能、成本、组网、运维等方面,有其巨大优势。

“超节点架构本质上也是系统化思维的产物。”赵帅说,超节点不是某一个点的突破,而是在现有技术、生态和成本约束下,从系统层面去打破芯片本身的性能边界,最大化用户价值。

超节点开放架构的生态价值

浪潮信息的“元脑SD200”超节点属于开放架构,以开放系统设计向上扩展支持64路本土GPU芯片,可以实现单机内运行超万亿参数大模型,支持多个领先大模型机内同时运行,也可以实现多智能体实时协作与按需调用,目前已经商用。

具体来看,在应用架构层面,浪潮信息基于Open Fabric Switch,构建了3D Mesh系统架构,实现了单机64路本土GPU芯片的高速互连。

同时,他们通过远端的GPU虚拟映射技术,突破了多Host交换域的统一编址难题,让显存的统一地址空间直接扩增了8倍。

由此,单机可以提供最大4TB的统一显存,和64GB的统一内存。这为万亿超长序列模型提供了充足的KV Cache空间。

超节点不只要求硬件能力,更考验软硬协同能力。

“超节点是一个软硬件协同系统,而不是一个纯硬件。”赵帅表示,多年来,从实验室到应用,再到用户POC的过程,浪潮信息围绕万亿参数大模型计算密集、通信敏感的特性,构建起了一整套软硬协同优化的系统方案。

在系统层面,元脑SD200对于全规约(All Reduce)、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

“开放架构”是赵帅强调的另一个关键词,他表示,基于开放架构设计的超节点,能够支持多样化芯片、开放AI框架及主流开发工具,在保障高性能、低延迟的同时,实现跨平台的良好兼容与灵活扩展,推动AI基础设施真正走向开放、可持续的发展路径。

开源开放,是中国AI产业的标志之一。当前,中国开源大模型已在全球范围内展现显著领先性,特别是以DeepSeek、Qwen、Kimi、GLM等为代表的新一代开源大模型浪潮,其意义已超越单一技术突破,正深刻重塑AI产业格局与发展路径。

超节点技术的兴起,则标志着服务器产业从单机竞争迈入了系统级能力重构的新阶段。

这不仅带来了算力的跃升,更对底层硬件、技术标准和产业协作模式提出了全面升级的要求。

赵帅表示,浪潮信息也希望通过开源开放生态链条的构建,促进标准统一和深化产业协作,最终驱动整个产业链的创新融合发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
红楼梦:秦可卿为何不反抗公公贾珍?一个耳熟能详的绰号里有答案

红楼梦:秦可卿为何不反抗公公贾珍?一个耳熟能详的绰号里有答案

谈史论天地
2026-02-01 10:55:06
具俊晔登上韩国电视台,对着大S墓碑跪地磕头,女主持几度泪奔!

具俊晔登上韩国电视台,对着大S墓碑跪地磕头,女主持几度泪奔!

古希腊掌管月桂的神
2026-01-31 10:17:21
中国芯片英雄,被美国囚禁9年后终于回家!他反手把苹果告上法庭

中国芯片英雄,被美国囚禁9年后终于回家!他反手把苹果告上法庭

胖哥不胡说
2026-01-24 18:45:24
63岁穆帅大雨中仰天长叹:泥泞菜地中23脚射门 0-0闷平+差榜首9分

63岁穆帅大雨中仰天长叹:泥泞菜地中23脚射门 0-0闷平+差榜首9分

风过乡
2026-02-02 06:56:49
春运抢票高峰“上线”!记者探访12306售票监控中心

春运抢票高峰“上线”!记者探访12306售票监控中心

上观新闻
2026-02-02 07:25:31
33岁田志希生下女儿!丈夫骚扰女球员被禁赛10年 她已原谅+没离婚

33岁田志希生下女儿!丈夫骚扰女球员被禁赛10年 她已原谅+没离婚

念洲
2026-02-02 06:59:37
美国评1979年中越战争:打了28天,中国军队出现了很多问题

美国评1979年中越战争:打了28天,中国军队出现了很多问题

小豫讲故事
2026-01-31 06:00:10
伊朗最高领袖哈梅内伊:如果美国挑起战争,这次冲突将不再局限于一地;美方发布“林肯”号航母在阿拉伯海接受补给视频

伊朗最高领袖哈梅内伊:如果美国挑起战争,这次冲突将不再局限于一地;美方发布“林肯”号航母在阿拉伯海接受补给视频

每日经济新闻
2026-02-01 21:46:27
暴跌的黄金短期会反弹吗?

暴跌的黄金短期会反弹吗?

每日经济新闻
2026-02-02 08:51:27
绍伊古访华争分夺秒,谈好后马上给普京复命,中俄都已准备好了

绍伊古访华争分夺秒,谈好后马上给普京复命,中俄都已准备好了

头条爆料007
2026-02-02 06:10:13
钱再多有啥用?22岁的谷爱凌近况被曝光,还是踏上了樊振东的老路

钱再多有啥用?22岁的谷爱凌近况被曝光,还是踏上了樊振东的老路

揽星河的笔记
2026-01-31 23:33:28
注意!广东一地新发现120多例艾滋感病例...

注意!广东一地新发现120多例艾滋感病例...

澄海圈
2026-02-01 23:09:18
大S纪念雕像揭幕,周渝民、言承旭等好友到场,孩子未出席。

大S纪念雕像揭幕,周渝民、言承旭等好友到场,孩子未出席。

话娱论影
2026-02-02 14:52:46
谌贻琴将访问西班牙并出席米兰冬奥会开幕式

谌贻琴将访问西班牙并出席米兰冬奥会开幕式

环球网资讯
2026-02-02 15:15:11
马刺双杀魔术升西部第二:文班25+8+4+5帽 完胜班凯罗19+10

马刺双杀魔术升西部第二:文班25+8+4+5帽 完胜班凯罗19+10

醉卧浮生
2026-02-02 12:30:01
莫迪也上了爱泼斯坦文件,情节有点尬…印方火速否认

莫迪也上了爱泼斯坦文件,情节有点尬…印方火速否认

观察者网
2026-02-01 20:37:25
张怡宁嫁比自己大20岁的徐威,最终难逃残酷现实的命运

张怡宁嫁比自己大20岁的徐威,最终难逃残酷现实的命运

老吴教育课堂
2026-02-01 15:20:00
懵了!白银重挫14%,现货黄金逼近4400美元

懵了!白银重挫14%,现货黄金逼近4400美元

中国基金报
2026-02-02 15:31:44
中央定调:房地产完全明牌了!

中央定调:房地产完全明牌了!

巢客HOME
2026-02-02 05:50:03
突发!阿森纳或压哨签中场补窟窿!枪手要冲冠不敢赌

突发!阿森纳或压哨签中场补窟窿!枪手要冲冠不敢赌

奶盖熊本熊
2026-02-02 08:05:59
2026-02-02 17:23:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
231723文章数 743651关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

媒体:美用一次军事打击摧毁伊朗政权可能性已大幅降低

头条要闻

媒体:美用一次军事打击摧毁伊朗政权可能性已大幅降低

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

商品期货暴跌 全球股市遭遇"黑色星期一"

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

本地
游戏
亲子
时尚
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

《巫师4》追求真实的灵感源自"无冕之王"!玩家享福了

亲子要闻

“史上最严”婴配液态乳新规出炉!贴牌玩家或被直接清退

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版