网易首页 > 网易号 > 正文 申请入驻

国产原生RDMA网络scaleFabric发布 填补大规模智算互联空白

0
分享至

3月12日,中科曙光宣布实现国产高端原生RDMA(远程直接内存访问)技术重大突破,正式发布首款全栈自研400G无损高速网络scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP(芯片设计中用于实现高速串行数据传输的核心硬件模块)、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了一条高带宽、低时延、真无损、超可靠的“算力大动脉”。据发布会披露,该产品已实现量产现货供应,具备全场景即插即用的落地能力。

中科曙光scaleFabric发布会现场 郭博昊/摄

高端智算互联待破局

随着AI大模型训练与高通量推理计算需求持续扩大,万卡级乃至更大规模的算力集群正成为主流形态。研究表明,在大规模分布式训练中,网络通信耗时占比已达到30—50%,网络性能直接影响算力系统的整体效率。

在大规模智算集群领域,RDMA网络已成为算力中心的基本需求,凭借零丢包、高带宽、低延迟等特征,可极大提升通信效率。其中,InfiniBand(无限带宽技术,简称IB)凭借低时延与原生无损传输能力,在全球顶级超算与AI集群中被广泛采用。根据TOP500榜单,目前全球约60%的高性能计算系统采用InfiniBand网络架构。

长期以来,从高速SerDesIP、核心芯片到IB网卡、IB交换机等设备,InfiniBand相关产业链基本被海外厂商垄断。随着AI算力需求快速增长及数据中心网络持续演进,自主高性能RDMA网络正成为产业关注焦点。

中科曙光高级副总裁李斌在发布会上直言,“计算决定了计算系统性能的上限,但是如果是网络系统拉垮的话,有可能会把整个性能下限归零了”。中国工程院院士邬贺铨表示,高速网络作为算力基础设施的关键核心技术,其自主可控性直接关系到国家算力基础设施的安全与发展质量。

国产原生RDMA问世

scaleFabric是国内首款原生无损RDMA高速网络,面向超大规模智算集群设计,从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件均实现自主研发,构建起从硬件到软件的完整技术体系。

此次发布的scaleFabric400系列网络产品技术规格全面对标英伟达NDR,部分指标实现赶超。性能方面,scaleFabric400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展。这一性能组合,可充分满足万卡级AI训练集群对高带宽、低时延网络的极致需求。

稳定性与扩展能力上,产品采用基于信用的无损流控机制,从根源规避拥塞丢包风险,链路故障恢复时间小于1毫秒,已支撑近万卡集群持续稳定运行验证超10个月。与英伟达NDR相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。

同时,产品完成了与IB生态的全面兼容,中科曙光高速网络互联产品部总工程师万伟介绍,各类HPC(高性能计算)和AI大模型训练应用无需修改代码即可直接迁移,运维管理习惯也可无缝衔接,大幅降低了用户的迁移门槛。

在大规模AI训练系统中,网络互联能力已成为影响算力利用率的关键变量。scaleFabric的发布,标志着国产智算网络在高端RDMA领域实现重大突破。

万卡集群率先验证

在实际应用层面,scaleFabric目前已部署于国家超算互联网郑州核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡。万伟介绍,该网络系统仅用36小时便完成三套万卡级集群的网络部署上线,目前累计服务1万个客户、支撑超10项万作业稳定运行。李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态也正在加速形成。

针对超大规模集群的运维挑战,中科曙光高端计算总工程师解西国介绍,scaleFabric配套了覆盖网络配置、上线筛查、监控管理、故障处理全流程的运维能力,六大核心能力实现了从被动响应到主动感知、从手动管理到智能运维的升级,为十万卡级集群的稳定运行提供了全链路保障。

目前,scaleFabric已完成多领域的落地验证与实测优化。中科院计算技术研究所研究员王展团队实测显示,scaleFabric的单QP(通信队列)通信性能、交换机转发延迟均达到很高水平,可支撑科学智能领域的高精度模拟需求;科大讯飞也正与中科曙光深化合作,推动scaleFabric在讯飞星火大模型训练与推理场景的适配落地,助力国产智算生态完善。

依托在高性能计算、存储与网络领域的长期技术积累,中科曙光已逐步形成“算—存—网”协同发展的完整算力底座能力,为大规模AI基础设施提供系统级支撑。随着政府工作报告提出持续推进“人工智能+”,算力基础设施正进入新一轮升级周期。国产原生RDMA网络的落地,意味着我国在智算互联这一关键环节开始形成自主技术路径,补齐了我国智算基础设施中的关键一环。

技术突破之外,国产高速网络的生态共建也同步启动。发布会同期,光合组织高性能计算专委会AIDC高速网络工作组正式成立,联合了科大讯飞、联想开天、中兴通讯等数十家产业链上下游企业,将共同推动国产高速网络的技术标准、生态适配与产业落地。李斌表示,曙光将秉持极致开放的态度,与产业链上下游伙伴在标准、接口、协议、商业模式等方面开展全方位合作,共同把国产高速网络的生态做实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北大超240,清华超220,浙大超3200,C9在浙江指

北大超240,清华超220,浙大超3200,C9在浙江指

史海流年号
2026-06-26 08:05:10
谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了

安安说
2026-05-31 10:53:31
沾沾喜气!2026河南高分考生诞生,高考718分,来自一所县级高中

沾沾喜气!2026河南高分考生诞生,高考718分,来自一所县级高中

凯旋学长
2026-06-25 21:25:11
一场1-0大冷!世界杯已有13队出线,亚洲至今0队,韩国意外掉第3

一场1-0大冷!世界杯已有13队出线,亚洲至今0队,韩国意外掉第3

侃球熊弟
2026-06-25 10:57:35
C罗多项数据压倒梅西,若能世界杯逆袭夺冠,历史地位将后来居上

C罗多项数据压倒梅西,若能世界杯逆袭夺冠,历史地位将后来居上

徐竦解说
2026-06-26 08:51:36
太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

水晶的视界
2024-12-05 06:00:12
刻意穿的简朴,奈何先天条件太出众

刻意穿的简朴,奈何先天条件太出众

飛尚日记
2026-06-26 06:56:00
高考出分后,他发帖求助:中流985还是再战一年?

高考出分后,他发帖求助:中流985还是再战一年?

娱圈观察员
2026-06-24 00:11:16
金正恩宣布消息,美日集体沉默,韩专家:若开战,朝鲜能帮中俄忙

金正恩宣布消息,美日集体沉默,韩专家:若开战,朝鲜能帮中俄忙

谛听骨语本尊
2026-06-25 14:35:27
陈家四兄弟分属国共两军,有人当将军有当元帅,可他们从没红过脸

陈家四兄弟分属国共两军,有人当将军有当元帅,可他们从没红过脸

莹莹的历史说
2026-06-14 00:31:52
美伊趋稳,特朗普将目光转向朝鲜半岛?

美伊趋稳,特朗普将目光转向朝鲜半岛?

上观新闻
2026-06-24 21:57:36
英媒曝中国富人集体逃离新加坡!网上疯传:中国不给脸,新加坡就是个县?

英媒曝中国富人集体逃离新加坡!网上疯传:中国不给脸,新加坡就是个县?

新加坡眼
2026-06-25 22:25:51
36岁男篮名宿:娶1米83美女,儿女双全,退役后当老板已财富自由

36岁男篮名宿:娶1米83美女,儿女双全,退役后当老板已财富自由

白面书誏
2026-06-25 15:16:22
朝鲜增兵3000,白俄火箭炮瞄准基辅!乌克兰同时惹上两个硬茬

朝鲜增兵3000,白俄火箭炮瞄准基辅!乌克兰同时惹上两个硬茬

零洛浮华
2026-06-24 18:24:10
伊朗没有赢下一场全面战争,却替中国废掉了美国一张最狠的牌

伊朗没有赢下一场全面战争,却替中国废掉了美国一张最狠的牌

贱议你读史
2026-06-24 19:35:03
湖人愿意先签后换送走詹姆斯送至骑士,开启休赛期连锁操作

湖人愿意先签后换送走詹姆斯送至骑士,开启休赛期连锁操作

夜白侃球
2026-06-25 10:06:15
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
带状疱疹疫苗又立大功?打完不仅防“缠腰龙”,痴呆风险也降了!

带状疱疹疫苗又立大功?打完不仅防“缠腰龙”,痴呆风险也降了!

爱医斯坦
2026-06-23 17:15:46
Anthropic Claude 付费用户激增 正面挑战 ChatGPT 消费级霸主地位

Anthropic Claude 付费用户激增 正面挑战 ChatGPT 消费级霸主地位

cnBeta.COM
2026-06-26 09:30:04
掀俄罗斯天灵盖的男人:罗伯特·布罗夫迪(马贾尔)

掀俄罗斯天灵盖的男人:罗伯特·布罗夫迪(马贾尔)

取经的兵
2026-06-22 10:40:50
2026-06-26 10:15:00
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
933108文章数 239289关注度
往期回顾 全部

科技要闻

美国政府要求OpenAI分批发布GPT-5.6

头条要闻

牛弹琴:委内瑞拉强震或致10万人死亡 美欧被指负主责

头条要闻

牛弹琴:委内瑞拉强震或致10万人死亡 美欧被指负主责

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

悬在科技头上的达摩克利斯之剑

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

数码
亲子
时尚
公开课
军事航空

数码要闻

苹果或于今年推出搭载M5 Ultra芯片的新款Mac Studio 最高支持768GB统一内存

亲子要闻

胆囊摘除后出现这五个后遗症

本科毕业后,我花15万上大专

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:驶离指定航线船舶不享有安全保障

无障碍浏览 进入关怀版