网易首页 > 网易号 > 正文 申请入驻

浪潮信息发布超节点元脑SD200,面向超万亿参数模型创新架构设计

0
分享至

“回归本源,无论是芯片厂商还是系统厂商,只要能够满足应用需求,能够服务好客户,最后都会成为成功的超节点产品。”浪潮信息副总经理赵帅表示。

8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计聚合64路本土GPU芯片。元脑SD200可单机运行1.2万亿参数Kimi K2模型,并支持DeepSeek、Qwen、Kimi、GLM等模型同时运行和多智能体实时协作与按需调用,目前已率先实现商用。

(来源:资料图)

全球前沿大模型迈入万亿参数阶段,算力系统架构迎来新挑战

在2025开放计算技术大会上,赵帅以《开放加速创新,共赢万亿大模型AI时代》为题发表演讲,指出当前混合专家模型的高效架构正在驱动大模型参数规模持续扩展,国内外前沿大模型参数量都已发展到万亿阶段,给算力系统架构带来新的挑战。

首先,模型参数量和序列长度的增加,尤其是序列长度的增长,会导致键值缓存(KV cache)激增,远超传统AI服务器的显存能力极限,需要构建具有更大显存空间的计算系统承载,解决模型“放得下”的问题。

其次,随着万亿模型成为主流,参数需要分布到更多卡上进行并行计算,原本发生在节点内的通信模式需要转移到跨机通信中,这会导致跨机通信量大幅增长。如果仅以传统的横向扩展(Scale out)互连方式进行通信,将会带来极大的通信时间占比。因此,对于万亿大模型推理,不仅要构建更大的显存空间,还要实现卡间超低延迟的互连,构建更大的纵向扩展(Scale up)高速互连域,解决模型“算得快”的问题。

另外,当下我们正从生成式AI走向代理式AI。与传统大模型不同,代理式AI具备自主推理与决策能力,可通过思维链分解问题、制定计划并执行任务。然而,单一模型的能力存在局限性,如擅长数据分析的模型可能缺乏常识判断。所以,在构建AI智能体时,通过多个不同大模型的能力专长协同来处理复杂任务,成为新的应用范式——当多个万亿级模型需要实时协作时,传统计算架构已经完全无法应对。

超节点AI服务器元脑SD200,用软硬协同系统创新突破芯片性能边界

面对上述挑战,浪潮信息基于其在算力系统领域的技术积累,通过硬件架构与系统软件的协同创新,开发了面向万亿参数大模型的超节点AI服务器元脑SD200。

从架构上看,元脑SD200基于自研开放总线交换技术,首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连。通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,基于百纳秒级的超低延迟链路,构建64卡大高速互连域统一原生内存语义通信。

采用多主机三维网格系统架构,实现64卡统一高速互联域构建的背后,涉及多方面技术突破。

第一,传统架构多局限于单机8卡的全互联模式,而三维网格系统架构通过自研的开放总线交换(Open fabric Switch)技术,将GPU互连从单机扩展到多机跨节点域的互连,实现了更大规模的算力聚合基础。

第二,通过类似于GPU虚拟映射的技术,让64个GPU处于一个统一的地址空间,满足了大模型分布式计算对显存的核心需求。

第三,基于百纳秒级的超低延迟物理链路,它可以实现64卡大高速互连域的原生内存语义通信,在推理常用的小数据包场景上,能力提升非常明显。同时,通过开发Smart Fabric Manager系统,实现路由自动构建与最优路由选择,从底层硬件到上层软件全方位降低延迟,显著提升系统性能扩展性与吞吐效率。

赵帅指出,产业突破需聚焦系统全局而非单一环节,要在技术、生态、成本与性能的约束下,以应用为导向、系统为核心,为用户创造价值。

目前,在大系统构建的技术路径选择上,存在Scale out和Scale up两种方向。而浪潮信息将实践与思考重点放在后者,主要是出于对大模型应用需求的考虑。大模型推理对延迟要求极高,而Scale up能通过原生内存语义等技术实现最低延迟,以更好地满足这一核心需求。

从系统上看,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约(All Reduce)、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时,保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

从性能表现上看,元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,元脑SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。

(来源:资料图)

那么,浪潮信息是如何实现超节点中的软硬协同呢?

赵帅指出,浪潮信息在超节点系统多年的研发、落地及客户概念验证实践中,深刻认识到软件在复杂超节点系统中的关键作用。随着系统复杂度提升和Scale up链路复杂化,需要更加细致的监控和管理,同时还要在上层实现适配创新架构的应用框架。

注重解决客户痛点,目前已率先实现商用

目前,元脑SD200已率先实现商用。

之所以能成为最快商用的超节点系统,主要原因包括以下几个方面。

其一,在融合架构技术上十余年的沉淀。自2010年起,浪潮信息持续推进融合架构演进,从最初的供电、散热等非IT资源的整合,到存储、网络等资源池化,再到最新融合架构3.0系统实现了计算、存储、内存、异构加速等核心IT资源彻底解耦和池化。这沉淀下来的芯片共享内存数据、统一编址技术、池化、资源动态调度等技术,在今天的超节点系统中得以延续和应用,显著提升了系统的适配速度与商用效率。

其二,在软硬件协同能力上的积累。浪潮信息并非纯硬件厂商,其从2021年起就深耕大模型研究,在模型优化、训练推理效率提升等方面经验深厚,尤其是在软硬件协同定义上的积累,为PD分离框架、Smart Fabric Manager等技术的快速落地提供支撑,助力产品快速商用。

其三,针对客户痛点,采用成熟可落地的技术。例如,采用风冷散热,企业无需改造机房,即可灵活部署;在互连方案上,则选择了更为成熟稳健的全铜电互连,提升了系统稳定性,同时降低了终端用户的运维复杂度和成本。

当下来看,浪潮信息超节点面向的客户是否出现新增量?公司的差异化优势又体现在哪里?

赵帅指出,元脑SD200的客户群聚焦于前沿大模型领域,既包括从非大模型业务转向大模型、从中小规模模型升级至万亿级模型的客户,也涵盖新入局的尝试者,越来越多的客户对全栈赋能的需求强烈。基于此,该公司通过提供端到端方案,助力实现大模型部署与性能提升。

浪潮信息更重视客户需求,通过选对方向、做好服务,来满足客户实际应用需求。

那么,支持四大开源模型和多智能体协同的元脑SD200,又是如何确保客户在应用时能拥有更好的体验?

赵帅表示:“我们在做系统时,不仅仅是只满足当前的应用需求。”

元脑SD200在满足超万亿参数大模型需求的基础上,会保持适度前瞻性。也就是说,要在保证客户应用性价比的情况下,覆盖未来2万亿、3万亿参数规模的大模型。而系统4TB大显存也能充分容纳多个万亿模型,且各模型独立运行,以避免资源争抢。

大模型参数量的不断提升,对算力基础设施的建设提出了更高要求,而浪潮信息通过开放系统架构创新,来支撑AI大模型算力的高效释放,为开源大模型的落地提供关键支持。正如赵帅所言:“我们要用开放架构的算力创新,来加速开源模型的智能平权。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
蛊惑人心 结局:留下悬念

蛊惑人心 结局:留下悬念

金昔说故事
2026-03-26 19:50:53
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
生死皆是命数!网友:注定你要活,就会用各种方式把你拉离危险

生死皆是命数!网友:注定你要活,就会用各种方式把你拉离危险

夜深爱杂谈
2026-03-26 20:25:44
连续9场遭雪藏!失意神射离开辽宁仍未受重用 还能翻身吗?

连续9场遭雪藏!失意神射离开辽宁仍未受重用 还能翻身吗?

体娱天下
2026-03-26 15:27:26
又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

张鼋卤说体育
2026-02-07 12:45:26
一觉醒来天塌了!美国突然发现,命脉被中国控制,这仗还怎么打?

一觉醒来天塌了!美国突然发现,命脉被中国控制,这仗还怎么打?

谷盟a
2026-03-24 13:43:01
3月26日人民币对美元中间价调贬145个基点

3月26日人民币对美元中间价调贬145个基点

证券时报
2026-03-26 09:34:06
曼联5出3进,中场推倒重来!2人合同到期 2人铁心想走 3天才锁定

曼联5出3进,中场推倒重来!2人合同到期 2人铁心想走 3天才锁定

万花筒体育球球
2026-03-25 19:02:23
这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

阿龙美食记
2026-03-24 21:52:23
忍了9年,中国终于对欧美航空霸权掀桌子!C919用硬实力杀出重围

忍了9年,中国终于对欧美航空霸权掀桌子!C919用硬实力杀出重围

朝子亥
2026-03-26 23:35:03
稀土贸易战:WTO判中国输,美西方终成输家

稀土贸易战:WTO判中国输,美西方终成输家

遁走的两轮
2026-03-15 03:13:32
巴基斯坦外长说美伊正进行间接谈判

巴基斯坦外长说美伊正进行间接谈判

新华社
2026-03-26 18:55:07
金智媛现身宝格丽米兰大秀站C位,刘亦菲惨沦配角,尴尬表情曝光

金智媛现身宝格丽米兰大秀站C位,刘亦菲惨沦配角,尴尬表情曝光

流云随风去远方
2026-03-26 18:36:05
郜林:来铭途一个月没开过会;当总经理和踢球不同

郜林:来铭途一个月没开过会;当总经理和踢球不同

懂球帝
2026-03-26 22:00:56
我谈了5个对象都被我爸搅黄,直到他住进ICU,我才明白谁是外人

我谈了5个对象都被我爸搅黄,直到他住进ICU,我才明白谁是外人

木子言故事
2026-03-26 09:35:08
华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

智东西
2026-03-26 20:49:23
伊朗的第一次回球:以攻代守,极限反拉

伊朗的第一次回球:以攻代守,极限反拉

西楼饮月
2026-03-26 21:28:25
已被禁赛4年 俄罗斯不后悔未加入亚足联 主帅:就5队能打难获进步

已被禁赛4年 俄罗斯不后悔未加入亚足联 主帅:就5队能打难获进步

我爱英超
2026-03-26 18:25:55
美方就伊朗将领遇袭事件发声 公开呼吁伊方人员撤离岗位

美方就伊朗将领遇袭事件发声 公开呼吁伊方人员撤离岗位

老马拉车莫少装
2026-03-27 00:00:56
2026-03-27 01:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16491文章数 514798关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
本地
亲子
游戏
房产

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

亲子要闻

看看把孩子吓得哈哈哈

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

无障碍浏览 进入关怀版