网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

浪潮信息发布新一代AI超节点，支持四大国产开源模型同时运行

2025-08-11 15:08:21　来源: 量子位

北京举报

0

分享至

克雷西发自凹非寺
量子位 | 公众号 QbitAI

从DeepSeek R1到Kimi K2，从Qwen到GLM，国产开源模型不仅在Hugging Face热度榜等榜单上频频霸榜，更在推理能力、长文本处理、多模态理解等关键指标上持续刷新纪录。

性能飞跃的背后是参数规模的急剧膨胀，当前主流开源模型的参数量已经突破万亿大关，DeepSeek-R1、Kimi-K2等模型动辄需要数TB的显存空间。

更重要的是，随着Agentic AI（代理式人工智能）成为新范式，多模型协同和复杂推理链带来计算与通信需求的爆炸式增长。

面对这一挑战，浪潮信息发布了面向万亿参数大模型的超节点AI服务器“元脑SD200”。

它可以在单机内同时运行DeepSeek R1、Kimi K2等四大国产开源模型，支持超万亿参数大模型推理以及多智能体实时协作。

并且在实际测试中，其64卡整机推理性能实现了超线性扩展，是真正意义上的算力聚合突破。

64张卡，1个超节点

元脑SD200将64张卡融合成一个统一内存、统一编址的超节点，把“整机域”的边界重新划定在了多主机之上。

它以3D Mesh开放架构为骨架，底层由自研的Open Fabric Switch贯通，将分散在多台主机里的本土GPU拉进同一个高速互连域。

在这个统一域里，通过远端GPU虚拟映射技术，实现对64卡的统一编址，一次性把地址空间扩增到原来的8倍，整机实现4TB显存与64TB内存的超大资源池，为长上下文与海量KV Cache提供了充足的空间。

并且元脑SD200中的计算与数据在原生内存语义下对齐，实现了百纳秒量级的低延迟通信，在小数据包通信这一推理常态场景里，端到端时延优于业界主流方案。

这直接支撑起了元脑SD200单机承载超大模型的能力——在同一台“超节点”里，SD200可运行超万亿参数规模的大模型。

除了硬件架构设计，元脑SD200也实现了系统与框架的协同优化，其中内置的Smart Fabric Manager会根据负载特征自动构建全局最优路由，把拓扑选择、拥塞规避与算子模式的策略联动起来，尽量把通信成本锁在“局部最短路径”上。

此外，元脑SD200支持开放的PD分离框架，可以把大模型推理的Prefill与Decode解耦并行，能够实现更高效的推理效率，使计算系统的算力性能得到充分发挥。

软件生态层面，它兼容PyTorch、vllm、SGLang等主流计算框架，可以快速迁移既有模型与智能体工作流，无需从头改写代码。

得益于软硬协同优化，当64卡一同上阵进行全参推理时，元脑SD200对DeepSeek R1的推理性能实现了约3.7倍的超线性扩展，满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。

总之，元脑SD200容量够大、延迟够低、栈足够开放，既能顶住万亿级模型的密集推理，也能支撑多智能体的高并发交互。

Agentic AI时代，Infra面临新需求

除了规模越来越大，推理能力越来越强，大模型也正在经历从单纯的文本生成到多模态、智能体的范式转变。

并且智能体AI不再是单一模型的独立运行，而是需要通过多模型协同和复杂推理链来完成任务。

一个典型的智能体任务可能需要调用代码生成模型、逻辑推理模型、知识检索模型等多个专业模型，它们之间需要实时交互、相互验证、协同决策。

这种新范式下，推理过程需要生成比传统模型多近百倍的token，计算量和通信量都呈现爆炸式增长，给整个系统架构带来根本性困境。

当参数规模快速突破万亿级别，模型必须拆分到几十甚至上百张卡上时，原本在单机内部的高速通信变成了跨机的网络传输，通信就成为了更严峻的挑战。

传统的InfiniBand网络虽然带宽可观，但在处理推理过程中大量的小数据包时，延迟问题变得极为突出。每一次跨机通信都可能带来额外延迟，而在需要频繁同步的推理过程中，这些延迟会累积成严重的性能瓶颈。

智能体的多模型实时交互需求更是雪上加霜——当多个万亿级模型需要实时协作时，传统架构已经完全无法应对。

元脑SD200超节点的3D Mesh架构正是在这种背景下应运而生。它通过将多个主机的GPU资源整合成一个统一的计算域，从根本上解决了显存容量和通信延迟的双重困境。

远端GPU虚拟映射技术，让分布在不同主机上的GPU能够像在同一主机内一样高效协作，8倍的地址空间扩增确保了即使是数万亿参数的模型也能完整加载和高效运行。

随着摩尔定律的放缓，硅基芯片面临物理极限，继续追求单芯片性能的大幅提升，将变得越来越困难和昂贵。

Scale Out虽然在扩展性上看似无限，但其固有的高延迟问题在面对万亿模型的高频通信需求时显得力不从心。

因此，Scale Up成为了必然的选择，元脑SD200也正是选择Scale Up路径，通过原生内存语义实现百纳秒级低延迟。

浪潮信息副总经理赵帅指出，“超节点本质上是系统化思维的产物，它不是某一个点的突破，而是在现有技术、生态和成本约束下，从系统层面去最大化用户价值”，即在当前高速信号传输的物理限制下，需要在有限的物理空间内聚集尽可能多的计算资源。

元脑SD200通过创新的系统化设计，在单机内实现了64路GPU的高速互联，实现了超低延迟通信，这是对物理定律和工程实践的有效平衡。

推动“开源开放”生态链条

除了优异的性能表现，元脑SD200从设计之初就全面采用了开放架构。整个系统基于OCM（开放算力模组）与OAM（开放加速模块）两大架构打造。

OCM标准由中国电子技术标准化研究院发起，浪潮信息、百度等18家算力产业上下游企业共同参与编制。

该架构围绕支持“一机多芯”设计，可快速适配Intel、AMD、ARM等多种计算平台。

OAM则由开放计算项目（OCP）社区推动，是专为高性能计算与AI加速场景设计的开放模块标准。

该架构统一了加速卡的尺寸、电气接口和散热设计，使来自不同厂商的GPU、NPU等AI加速器可在同一系统中协同运行。

通过高速互联技术，来自不同厂商的加速卡不仅能够兼容运行，更能实现低延迟直连，有效满足大模型训练与推理对带宽的极致要求。

浪潮信息将OCM与OAM架构有机融合，为业界提供了一种开放的超节点技术架构，使得上游算力厂商都有机会参与超节点共建，下游用户也拥有更多的算力选择。

浪潮信息选择开放架构不仅是技术选择，更是产业战略。

这种开放性为用户提供了多元化的选择自由——通过提供多种算力方案，从应用角度给客户更多选择。

另一个价值是低迁移成本，元脑SD200提供了算子级别的全面支持，基于PyTorch等主流框架开发的模型可以直接在其上运行，无需重新开发或大规模改造。

元脑SD200的目标，是让更多企业能够用得起、用得好超节点系统，真正实现智能平权。

元脑SD200通过开放架构与开源模型的深度结合，不仅为万亿参数大模型提供了可靠的基础设施支撑，更推动了“智能平权”的加速落地。

通过开放促进创新，通过创新推动系统性能提升，通过规模化降低成本，浪潮信息正在让更多企业和开发者能够便捷利用顶尖AI技术，共享智能时代的发展红利。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

国产GPU组了个开源局，把SGLang等核心开发者都摇来了！

量子位 2026-05-14 17:49:23
0 跟贴 0
AI相对论②丨智驾进入数据驱动时代，能落地的L3必须具备L4能力

每日经济新闻 2026-05-13 12:29:08
0 跟贴 0

天下苦CUDA久矣，又一国产方案上桌了

量子位 2026-01-30 21:59:52
6 跟贴 6

8个AI顶流科学家，300亿估值：他们要让AI自我进化

DeepTech深科技 2026-05-14 17:51:57
0 跟贴 0
联发科天玑开发者大会：全栈升级AI与游戏技术，开启全场景智能体化

通信世界 2026-05-14 15:30:10
0 跟贴 0

对话上交大程远：AI的终局不在云端，而在“感算一体”的物理世界

DeepTech深科技 2026-05-01 18:05:24
0 跟贴 0

AI智能体不是越多越强：信息冗余构成了LLM Agent Scaling的瓶颈

机器之心Pro 2026-02-27 14:45:03
0 跟贴 0
马斯克承认落后，xAI推出首款编程智能体，剑指行业顶流Claude Code

华尔街见闻官方 2026-05-15 05:46:52
0 跟贴 0

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
Hassabis狂赞！谷歌爆改50年鼠标，指哪AI打哪，连提示词都省了

新智元 2026-05-15 08:08:24
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

机器之心Pro 2026-05-14 16:03:08
0 跟贴 0
不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

新智元 2026-05-14 13:08:29
26 跟贴 26
离开Meta后，田渊栋刚刚官宣创业了

机器之心Pro 2026-05-14 09:38:28
0 跟贴 0
15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案

机器之心Pro 2025-12-23 12:52:34
0 跟贴 0
CVPR 2026 | 从视觉Token内在变化量出发，实现VLM无损加速1.87倍

机器之心Pro 2026-03-16 11:56:33
0 跟贴 0
AI 不只会回答，还能自己干活？Agent 智能体一次讲透

新词元 2026-05-14 23:05:42
5 跟贴 5
PackingStar双智能体博弈，攻克14维难题

量子位 2026-02-16 13:12:43
0 跟贴 0
智能体从「单兵作战」到「精锐团队」 -2

机器之心Pro 2026-04-28 16:56:00
0 跟贴 0
孩子沉迷手机、厌学怎么办？华师大升级智能体“专家式”助力家长解难题

上观新闻 2026-05-14 19:08:04
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
师傅在河里打捞废铁，结果吸到了钢架构柱子上，技术不到位

卡卡爱生活 2026-05-13 10:34:23
40 跟贴 40
陕西移动咸阳分公司用满格信号护航残疾人就业“双向奔赴”

西北信息报 2026-05-14 16:40:08
0 跟贴 0
古巴宣布燃油储备耗尽全国电网进入"危急状态"

澎湃新闻 2026-05-14 19:20:31
5775 跟贴 5775
人们可以把意识上传到云端服务器，实现赛博永生！！

痞子说动物 2026-05-12 16:53:01
1 跟贴 1
女子发视频告诫网友，扫共享单车时用单车软件扫，千万不要用微信、支付宝扫

南昌晚报 2026-05-14 09:16:45
0 跟贴 0
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2879 跟贴 2879
颠覆认知！物理学家发现新粒子，我们对宇宙的理解全错了

和海看日出 2026-05-14 08:11:15
2 跟贴 2
李想首度回应造芯！弃用传统GPU路线，200人团队苦干四年

车东西 2026-05-12 20:46:16
4 跟贴 4
女人修车问豆包，老板用魔法打败魔法，人工智能终究打败了人工

笑出猪叫研究所 2026-05-12 17:39:51
17 跟贴 17
俄总统新闻秘书：只要美国不再把经贸合作与乌克兰问题挂钩，俄愿同美开展商业往来

极目新闻 2026-05-14 09:58:58
2108 跟贴 2108
“小马云”范小勤成年后直播首秀，在线人数突破7万，礼物刷屏

星视频 2026-05-14 15:29:30
372 跟贴 372
豹5/豹8闪充版上市，底层硬件升级，颠覆传统越野车？

苑叔聊车官方账号 2026-05-14 10:57:48
6 跟贴 6
大轮盘带动弹簧往复运动，看似永动机，实则巧妙机械模型

木子奇趣 2026-05-13 10:48:00
4 跟贴 4
苏联科技树点歪？俄罗斯芯片不惧封锁，背后藏着什么秘密武器

聚焦瞬间 2026-05-15 02:45:35
0 跟贴 0
北京之行心情不错，国际足联秘书长到访工体

北京日报客户端 2026-05-14 18:55:29
1235 跟贴 1235
武功山景区遭“臭屁虫”围攻？有游客调侃“张嘴能吃饱”，景区提醒：可自备防虫药物

潇湘晨报 2026-05-14 17:33:19
579 跟贴 579
AI热潮催生2026最大IPO！“英伟达挑战者”Cerebras首秀盘中翻倍高涨

华尔街见闻官方 2026-05-15 05:03:51
0 跟贴 0
李晨独自居住在北京，智能生活软件一窍不通，出门依旧招手拦车

小风侃娱 2026-05-14 09:21:36
1 跟贴 1
重大突破！全球最大规格，在武汉诞生

湖北省人民政府网 2026-05-14 09:33:09
194 跟贴 194

忍了大半年，闻泰科技终于亮剑：荷兰政府抢走的，连本带利赔80亿

忍了大半年，闻泰科技终于亮剑：荷兰政府抢走的，连本带利赔80亿

知法而形

2026-05-14 12:02:59

4-3晋级！3-2逆天改命，东部最大黑马诞生，2换1交易赚大了

4-3晋级！3-2逆天改命，东部最大黑马诞生，2换1交易赚大了

生活新鲜市

2026-05-14 19:10:52

千万网友组成最悲壮调查兵团，全死在了各大地图APP的假公厕门前

千万网友组成最悲壮调查兵团，全死在了各大地图APP的假公厕门前

情报姬

2026-05-13 23:05:41

梅洛尼追悔莫及！疏远中国四年后，意大利将成欧元区最大债务国

梅洛尼追悔莫及！疏远中国四年后，意大利将成欧元区最大债务国

情系雨樱花叶

2026-05-14 20:39:22

好牛逼的状元！29岁带队进西决，30岁带队进东决，31岁带队进东决

好牛逼的状元！29岁带队进西决，30岁带队进东决，31岁带队进东决

球毛鬼胎

2026-05-12 11:24:51

涉嫌发布虚假广告深圳闪魔数码科技集团被罚1000元

涉嫌发布虚假广告深圳闪魔数码科技集团被罚1000元

信网

2026-05-14 14:02:27

特朗普爱吃的两道中国菜，好多老外都猜不到

特朗普爱吃的两道中国菜，好多老外都猜不到

阿莱美食汇

2026-05-15 00:03:02

大疆多款产品降价，Pocket3至高直降1400元，Pocket4仍无现货

大疆多款产品降价，Pocket3至高直降1400元，Pocket4仍无现货

鲁中晨报

2026-05-13 16:06:55

清华系团队出手！一张 4090 即可「爆改」，1.3B小钢炮震撼开源

清华系团队出手！一张 4090 即可「爆改」，1.3B小钢炮震撼开源

新智元

2026-05-13 12:11:23

大s悲剧即将重演？45岁小沈阳身体亮起红灯，给所有明星提了醒

大s悲剧即将重演？45岁小沈阳身体亮起红灯，给所有明星提了醒

草莓解说体育

2026-05-15 04:13:39

记者曝布莱克·莱弗利采访黑幕：怕被封杀不敢反抗

记者曝布莱克·莱弗利采访黑幕：怕被封杀不敢反抗

娱圈观察员

2026-05-14 07:29:51

20多年前陈红在陈凯歌家拍照，她躺在沙发上的样子，堪称人间尤物！

20多年前陈红在陈凯歌家拍照，她躺在沙发上的样子，堪称人间尤物！

感觉会火

2026-04-28 21:18:46

江西举报恩人沈女士已社死，正脸照曝光，大叔岗位被调，景区回应

江西举报恩人沈女士已社死，正脸照曝光，大叔岗位被调，景区回应

水泥土的搞笑

2026-05-14 19:34:54

阿森纳迷惑操作！19 岁天才刚坐稳主力，就要被 7000万先生挤走？

阿森纳迷惑操作！19 岁天才刚坐稳主力，就要被 7000万先生挤走？

奶盖熊本熊

2026-05-15 01:10:37

何穗这些年变化也太大了，今昔对比，简直不敢相信竟是同一个人

何穗这些年变化也太大了，今昔对比，简直不敢相信竟是同一个人

草莓信箱

2026-05-14 10:04:37

全网炸锅！49岁马伊琍突然官宣，文章携新欢亮相终获圆满？

全网炸锅！49岁马伊琍突然官宣，文章携新欢亮相终获圆满？

动物奇奇怪怪

2026-05-15 01:31:32

国家阶级固化完成：这世界上不可能再有国家可以取代中美了！

国家阶级固化完成：这世界上不可能再有国家可以取代中美了！

天老爷

2026-05-08 15:50:54

上海泡沫最严重的3个地方！不是陆家嘴，刚需买完直接亏掉首付

上海泡沫最严重的3个地方！不是陆家嘴，刚需买完直接亏掉首付

科学发掘

2026-05-14 16:50:00

骑士加时逆转3-2活塞：哈登30+8+6比肩詹姆斯坎宁安39+7+9

骑士加时逆转3-2活塞：哈登30+8+6比肩詹姆斯坎宁安39+7+9

醉卧浮生

2026-05-14 11:07:28

苏超争冠大戏：凯尔特人读秒点球绝杀，将与哈茨上演末轮生死战

苏超争冠大戏：凯尔特人读秒点球绝杀，将与哈茨上演末轮生死战

星耀国际足坛

2026-05-14 15:37:44

追踪人工智能动态

12625文章数 176463关注度

往期回顾全部

科技要闻

两年联姻一地鸡毛，传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山，和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸！全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕启境GT7内饰发布

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

游戏

手机

旅游

艺术

专家揭秘干细胞回输的安全风险

万字解析：大叔萝莉的组合为什么经久不衰？"/> 主站商城论坛自运营登录注册万字解析：大叔萝莉的组合为什么经久不衰？神堡薛师傅 2026-0...

手机要闻

英特尔试产苹果部分A/M系列芯片台积电独家代工地位或就此松动

旅游要闻

三亚亿恒夜市“五一”期间接待游客超8万人次助力 “夜经济”增长

艺术要闻

花园里，花丛中

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版