网易首页 > 网易号 > 正文 申请入驻

单机支持超万亿参数模型!浪潮信息发布超节点,给开源AI打造开放底座

0
分享至

在刚刚过去的7月份,国产模型迎来一波重磅开源。与以往不同的是,本次国内大模型玩家们开源模型的参数量成倍增长,达到数千亿乃至万亿级别。这不仅显著提升了国产模型的能力上限,也为各行业智能化转型提供了新一代强大的智能基座。

然而,随着模型体量不断攀升,对应的基础设施正面临前所未有的挑战。传统集群架构在通信效率、I/O性能和系统扩展性等方面逐渐暴露出瓶颈,已难以满足当前开源模型的部署需求。

在这样的背景下,各类“超节点”方案应运而生。作为面向大模型的新一代基础设施架构,超节点通过在单系统内部集成更多GPU资源,并显著优化节点间的通信性能,有效突破了传统架构在大规模分布式计算中的性能瓶颈。

昨日,浪潮信息正式发布了其面向万亿参数大模型的超节点AI服务器——“元脑SD200”。得益于浪潮信息自研的多主机低延迟内存语义通信架构,SD200在单机内集成64路加速计算芯片,单机支持DeepSeek、Qwen、Kimi、GLM四大国产顶级开源模型同时运行,以及多智能体实时协作与按需调用。

浪潮信息一直是开放计算生态的积极推动者,本次其此次推出的超节点方案采用了OCM+OAM的开放架构设计,兼容多款本土GPU芯片与大部分主流AI框架,目前已率先实现商用。

在国产开源模型奋力追赶智能上限之际,浪潮信息的开放超节点,有望成为承载万亿参数模型的重要底座之一。

一、厂商竞相追逐超节点,开放架构需求凸显

在探讨“超节点”对行业所带来的深远影响之前,我们有必要先厘清这一技术诞生的背景。

首先,模型规模的持续膨胀正在逼近现有硬件的承载极限。大模型加速迈向万亿参数规模,同时上下文长度不断扩展,直接推高了推理过程中的键值缓存(KV Cache)需求。显存与带宽,正成为压在AI基础设施之上的两座大山。

与此同时,随着大模型加速进入千行百业,推理型负载成为主流计算模式,而推理是一种高度通信敏感的计算过程。以Qwen3-235B模型为例,若要实现100 tokens/s的解码速度,单个token需完成多达188次的All-to-All通信,且每次通信的延迟必须控制在53微秒以内。

更不容忽视的是,Agentic AI的兴起正在进一步拉高对计算系统的需求。具备自主规划、多模态感知与连续执行能力的智能体,在执行任务时生成的token数量往往是传统模型的数十倍甚至上百倍,动辄需要处理数十万乃至数百万token。

算力基础设施面临的上述三大关键挑战,使其走到升级重构的临界点。为了支撑万亿参数级模型的高效运行,构建高度集成、低延迟、高带宽的Scale-Up(纵向扩展)系统,即通过构建一个更大的高速互连域、形成“超节点”,成为现实的技术选择。

通过构建超低延迟的统一显存空间,Scale-Up系统能将万亿级模型参数及激增的KV Cache整体容纳于单一高速互连域内,保障了多芯片间高效协同执行,显著减少跨节点通信开销,从而大幅提升吞吐速度并降低通信延迟,实现降本增效。

AI算力需求侧的变化,正驱动供给侧的厂商们争相布局前沿的Scale Up方案。2024年,英伟达在GTC大会上提出SuperPod的概念;今年,国内厂商的方案更是将超节点引入大众视野。

当前,业界在超节点技术方案的选择上,存在多种路径。在浪潮信息看来,超节点要根据客户应用需求来选择技术路线,要给客户提供更多算力方案的选择,核心策略是“开放架构”。

基于开放架构设计的超节点,能够支持多样化芯片、开放AI框架及主流开发工具,在保障高性能、低延迟的同时,实现跨平台的良好兼容与灵活扩展,推动AI基础设施真正走向开放、可持续的发展路径。

二、单机运行四大开源模型,全面支持主流框架

昨日,浪潮信息在2025开放计算技术大会上正式发布元脑SD200超节点AI服务器。作为开放计算领域的重要风向标,该大会一向聚焦推动算力基础设施的开放与协同,而SD200正是这一理念的典型体现。

SD200基于OCM(开放算力模组)与OAM(开放加速模块)两大架构打造。OCM标准由中国电子技术标准化研究院发起,浪潮信息、百度等18家算力产业上下游企业共同参与编制。

该架构围绕CPU和内存进行解耦设计,具备高度模块化与标准化优势,支持系统供电、管理、风扇等组件的独立升级与更换,大幅提升了服务器的灵活性与可维护性。同时,OCM支持“一机多芯”,可快速适配Intel、AMD、ARM等多种计算平台。

OAM则由开放计算项目(OCP)社区推动,是专为高性能计算与AI加速场景设计的开放模块标准。

该架构统一了加速卡的尺寸、电气接口和散热设计,使来自不同厂商的GPU、NPU等AI加速器可在同一系统中协同运行,并通过高速互联技术实现加速卡之间的低延迟直连,有效满足大模型训练与推理对带宽的极致要求。

浪潮信息将OCM与OAM架构有机融合,为业界提供了一种开放的超节点技术架构。

不过,光有“开放”的特性,仍不足以让一款开放超节点方案获得广泛采用,性能同样至关重要。

在开放计算技术大会现场,浪潮信息副总经理赵帅晒出了SD200超节点在真实部署环境下实现的性能。在经过软硬件的系统协同优化后,SD200超节点满机运行DeepSeek R1全参模型推理性能提升比为370%,满机运行Kimi K2全参模型推理性能提升比为170%

SD200超节点配备高达4TB的显存,能够同时容纳DeepSeek、Qwen、Kimi、GLM等多个旗舰级开源模型。赵帅称,这样的显存配置具备前瞻性,不仅可满足当前万亿级模型的部署需求,甚至为未来可能出现的2万亿、3万亿参数模型预留了充足空间。

然而,在打造这一方案时,浪潮信息并未一味追求技术堆叠,而是更注重实际落地的可行性。正如浪潮信息赵帅在发布会后与智东西等媒体交流时所提到的——客户的核心诉求是“能否快速部署、快速上业务、上应用”。

基于这一判断,SD200在使用便利性上进行了优化设计。例如,采用风冷散热,企业无需改造机房,即可灵活部署;在互连方案上,则选择了更为成熟稳健的全铜电互连,提升了系统稳定性,同时降低了终端用户的运维复杂度和成本。

此外,SD200超节点还全面兼容当前主流的开源大模型计算框架(如PyTorch,已支持2200+算子),可实现新模型的无缝迁移与“Day 0”上线,为企业构建AI应用提供了即开即用的基础平台。

三、软硬协同优化实现性能突破,揭秘开放超节点背后创新

这样一套开放超节点方案背后,是浪潮信息在融合架构和软硬件协同方面长达十余年的深厚积累。

赵帅分享道,自2010年起,浪潮信息持续推进融合架构演进,从最初的供电、散热等非IT资源的整合,到存储、网络等资源池化,再到最新融合架构3.0系统实现了计算、存储、内存、异构加速等核心IT资源彻底解耦和池化。

这沉淀下来的芯片共享内存数据、统一编址技术、池化、资源动态调度等技术,在今天的超节点系统中得以延续和应用,显著提升了系统的适配速度与商用效率。

此外,浪潮信息并非单纯的硬件厂商,其在大模型领域同样具备深度布局——早在2021年即发布首个中文巨量模型“源1.0”,其参数规模达2457亿,并持续在模型训练、推理优化和软硬件协同方面积累经验。这些能力也为SD200这样的超节点方案提供了坚实基础。

为突破万亿大模型的带来的显存压力,SD200超节点基于浪潮信息自主研发的开放总线交换(Open Fabric Switch)技术,首创多主机三维网格系统架构(3D Mesh)。在这一架构下,64颗本土GPU能够以高速、低延迟的方式实现互连。

更进一步,SD200通过GPU虚拟映射等底层创新,解决了多主机环境下统一编址的难题,将显存统一地址空间扩增8倍,显存容量达4TB,配合64TB系统内存,为超大模型提供了充足的KV缓存资源。

这意味着,不论是在模型训练还是推理过程中,开发者都能像调用单机GPU一样,灵活调度整个系统中的算力与显存资源,极大简化了工程复杂度。实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

在系统层面,浪潮信息围绕万亿参数大模型计算密集、通信敏感的特性,构建起一整套软硬协同优化的系统方案,将64卡超节点的算力潜能释放到极致。

一方面,浪潮信息开发了智能总线管理系统,可实现超节点64卡全局最优路由的自动创建与管理。该系统不仅支持灵活拓扑切换,还能根据业务负载动态进行资源切分与调度,为不同类型的大模型任务提供定制化的算力编排能力。

针对All Reduce、All Gather等典型通信算子的不同数据包规模,系统设计了细粒度、多层级的通信策略,进一步压缩通信路径的延迟。

此外,SD200还引入了开放的PD分离框架,将预填充-解码(Prefill-Decoder)环节解耦,支持异步KV Cache高效传输,并允许针对不同模型并行需求制定差异化策略,兼顾性能与兼容性。这一设计不仅提升了系统性能,也保障了对多元算力架构的适配能力,加强了计算与通信之间的协同优化。

通过软硬协同系统创新,SD200成功实现了纵向扩展,帮助本土AI芯片突破了性能边界,在大模型场景中展示出优异的性能表现。

结语:开放超节点,带动产业链协同创新

在赵帅的分享中,智东西感受到了浪潮信息对“以应用为导向”的坚持。作为系统厂商,他们与终端客户的距离更近,也更能体会到实际应用场景的痛点。也因此,赵帅称,超节点架构本质上是系统化思维的产物,它不是某一个点的突破,而是在现有技术、生态和成本约束下,从系统层面去打破芯片本身的性能边界,最大化用户价值。

超节点的发展也为中国本土产业链提供了发展机遇——高速连接器、线缆、板材、电源等上下游产业链厂商,都有望这个过程中找到属于自己的突破点。这不仅能加速成本下降和技术普惠,更推动了智能基础设施的“平权化”。

放眼未来,赵帅认为,AI数据中心正从“机柜级密度革命”迈向“数据中心级系统工程挑战”,算力密度将持续攀升,能源供给、冷却方式和系统管理也随之进入全面革新期。

从芯片到架构,从系统到生态,技术演进注定不会是一条单线道路,而是多路径的协同创新。在这场关于未来的集体奔赴中,唯有持续开放、拥抱合作,才能构筑真正普惠、可持续的智能算力基石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
掘金队戈登因伤缺席打森林狼的第3场比赛,佩顿·沃特森仍将缺阵

掘金队戈登因伤缺席打森林狼的第3场比赛,佩顿·沃特森仍将缺阵

好火子
2026-04-23 23:54:54
黄瓜是糖尿病的“催命符”?血糖要想稳定不飙,该吃的是这3物

黄瓜是糖尿病的“催命符”?血糖要想稳定不飙,该吃的是这3物

芹姐说生活
2026-04-22 23:48:54
古籍记载龙长虎短手相 无名指更长之人晚年多有四种人生结局

古籍记载龙长虎短手相 无名指更长之人晚年多有四种人生结局

唠叨说历史
2026-03-31 14:25:43
泽连斯基喊话:美国已将重心转向中东,深陷伊朗问题,我认为重要的是,不要忘记乌克兰

泽连斯基喊话:美国已将重心转向中东,深陷伊朗问题,我认为重要的是,不要忘记乌克兰

极目新闻
2026-04-23 13:14:04
山东一男婴日夜啼哭,母亲掀开被子后,将月嫂当场掐死

山东一男婴日夜啼哭,母亲掀开被子后,将月嫂当场掐死

罪案洞察者
2025-03-31 09:35:41
祭拜鬼社当天,日本发出崩溃预警,美欧视而不见,中国不再伸援手

祭拜鬼社当天,日本发出崩溃预警,美欧视而不见,中国不再伸援手

泄气得爱
2026-04-22 21:51:34
朝鲜第一“妖女”张绿水:宴会上与国王当众行事,一生比荒淫扎心

朝鲜第一“妖女”张绿水:宴会上与国王当众行事,一生比荒淫扎心

普览
2026-04-22 19:54:19
人形机器人量产元年开启!这10家核心供应链龙头最受益(附名单)

人形机器人量产元年开启!这10家核心供应链龙头最受益(附名单)

小白鸽财经
2026-04-21 20:30:03
情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

李晚书
2026-04-10 17:13:10
日本专家表示:如果中日战真的发生了,日本老百姓根本不需要害怕

日本专家表示:如果中日战真的发生了,日本老百姓根本不需要害怕

安安说
2026-04-23 11:40:47
从机器人到AI:2026年科技投资的两大主线,10只核心标的值得收藏

从机器人到AI:2026年科技投资的两大主线,10只核心标的值得收藏

小白鸽财经
2026-04-21 20:30:03
复杂的黎巴嫩,走投无路的真主党

复杂的黎巴嫩,走投无路的真主党

寰宇大观察
2026-04-17 17:36:11
最后1天,特朗普碰上硬茬!伊朗亮出全球通缉犯,随时准备反击

最后1天,特朗普碰上硬茬!伊朗亮出全球通缉犯,随时准备反击

暗香暗香
2026-04-24 02:45:56
“崩牙驹左右手”潮州明离世!晚年生活悲惨,令人心痛

“崩牙驹左右手”潮州明离世!晚年生活悲惨,令人心痛

吃瓜局
2026-04-23 15:31:30
受贿数额特别巨大 中央纪委国家监委驻证监会纪检监察组原组长王会民被提起公诉

受贿数额特别巨大 中央纪委国家监委驻证监会纪检监察组原组长王会民被提起公诉

新京报
2026-04-23 10:20:16
人民日报发文,揭张桂梅真实现状,卸任华坪女高校长传闻早有真相

人民日报发文,揭张桂梅真实现状,卸任华坪女高校长传闻早有真相

时光流转追梦人
2026-04-23 20:29:42
字母哥:梅罗、乔詹都是GOAT;C罗更自律所以我更倾向他

字母哥:梅罗、乔詹都是GOAT;C罗更自律所以我更倾向他

懂球帝
2026-04-23 12:48:07
“钟声”把话说的很直白,中国不会拉菲律宾一把,马科斯该死心了

“钟声”把话说的很直白,中国不会拉菲律宾一把,马科斯该死心了

依偎在角落
2026-04-22 22:31:55
2:0后暴雷!两大主将带伤!赢球夜,卫冕危机来了?

2:0后暴雷!两大主将带伤!赢球夜,卫冕危机来了?

篮球盛世
2026-04-23 17:17:15
赖清德窜访无果而终,侯友宜不再掩饰,黄国昌强硬郑丽文亮明态度

赖清德窜访无果而终,侯友宜不再掩饰,黄国昌强硬郑丽文亮明态度

一簌月光
2026-04-24 04:48:31
2026-04-24 05:47:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11676文章数 117037关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

时尚
游戏
旅游
亲子
军事航空

李昀锐:林深见木

任天堂NS2销量4倍碾压PS5!差距悬殊 索尼难挽颓势

旅游要闻

来广州,分享10亿元“中国旅游日”专属优惠福利

亲子要闻

新华读报|打乒乓球有助提高儿童注意力

军事要闻

人民海军成立77周年 主力舰艇亮相上海

无障碍浏览 进入关怀版