网易首页 > 网易号 > 正文 申请入驻

中科曙光发了个“标配版”超节点,AI推理算力的未来形态?

0
分享至

OpenClaw突然爆火,既是AI Agent赛道的一次必然出圈,也是AI推理算力市场的一场压力测试。

在2026年中关村论坛上,中科曙发布了世界首个无线缆箱式超节点scaleX40,在此之前,超节点是动辄数百卡甚至千卡规模的庞然大物,包括中科曙光发布的scaleX640、英伟达的NVL72、华为的昇腾384等。

这些顶级超节点专为超大规模模型训练而生,性能强悍,但部署门槛极高,定制化机柜、复杂的线缆连接、专业的运维团队,动辄数千万甚至上亿的投资,让它们注定只能服务于少数头部玩家,譬如互联网巨头或者大型央国企等。

在超节点的“反面”,是推理市场上传统且主流的8卡GPU服务器。这类产品部署灵活、成本可控,但在面对快速升级的AI推理算力需求时,性能显得有些不足。

"8卡机在当前来看已经远远落伍了,即便是把互联规模扩展到16卡,仍然满足不了模型推理服务发展的步伐。"中科曙光高级副总裁李斌表示,"支撑AI发展的算力基础设施,逐渐从原来的'算力工厂'变成了'Token工厂'。算力系统的主要服务对象,已经从过去支撑模型训练为主,转变到现在以服务于推理为主。"

在训练时代,评价算力系统的核心指标是有多少算力;而在推理时代,更关键的指标变成了"能以多经济的成本产出Token"。


图片来自AI生成

AI需求分化,推理算力远未满足

从当前市场需求来看,AI算力结构正在发生分层变化。根据行业机构预测,全球AI基础设施投入仍将保持较快增长,但新增需求正逐步从超大规模集群,转向企业级和行业应用场景。

在这一趋势下,算力配置的重点不再单纯追求规模上限,而是更加关注性能、成本与灵活性的平衡。业内普遍共识,几十卡规模已足够满足大多数行业场景模型训练、推理及开发测试的算力需求,这也是兼顾效率与投入的最大公约数区间。

但是,AI应用层的需求演化太快,包括像OpenClaw为代表的AI Agent的爆火,在改变传统行业应用的同时,对当下算力供给侧也带来了系统重构的需求。

第一是通信的瓶颈,现在MoE模型让通信成为提升算力利用率的核心卡点,尤其是专家分布的不确定性,导致大量跨卡、跨机通信,直接击穿了传统8卡服务器的算力架构。

第二是显存的瓶颈,上下文窗口持续扩展,OpenClaw所需的长上下文记忆能力,也让大显存、KV Cache的需求日渐激增,这同样是传统8卡服务器难以突破的局限。

第三是算力利用率的瓶颈,算力利用率和推理落地成本近乎反比,传统集群普遍存在算力利用率不足的问题,核心挑战不是单纯堆硬件,而是通过硬件架构创新,搭配配套系统工程、优化工程的协同发力,实现系统效能和有效算力的双重提升。

第四则是生态的瓶颈,国产算力生态体系复杂、厂商众多、产业链漫长,产业协作难度不小,这就需要借助开放计算架构,打通芯片、模型、应用等全产业链上下游,打造开放易用、开箱即用、经济普惠的算力底座。

中科曙光希望用40卡的“标配”超节点回应市场。"40卡这个甜点区,是我们跟各种客户调研摸索出来的。"中科曙光副总裁李柳表示,当前主流模型的参数规模和使用场景,32-40卡已经能够覆盖大多数行业需求,同时又能兼顾成本与性能的平衡。


scaleX40单节点集成40张GPU,总算力超过28PFLOPS(FP8精度),HBM显存容量超过5TB,访存带宽超过80TB/s。系统可靠性提升至99.99%。

scaleX40的规模配置,既具备支持大模型训练和推理的能力,又不会带来过重的投入压力,它向下可兼顾32卡,满足中小规模训练、推理和开发测试;向上,它可以通过扩展,组成更大规模集群。

李斌算了一笔账:"传统5台8卡机器叠加各类成本的投入,与scaleX40基本相当,但scaleX40可以将训练性能提升120%,推理性能最高提升至330%。"

从DeepSeek到OpenClaw,新的算力转折点

"Token需要算力来做产出,但评价的维度和指标变得更多了。"李斌认为,"对于普通用户,关注的是响应速度,问了一个问题,它能不能很快反馈回来;对于算力系统的运营者,要考虑能同时支撑多少用户的并发访问,同时满足基本的使用体验。"

智源研究院AI框架研发部门负责人敖玉龙也提出,"未来对算力供给方来说,关键指标是如何将算力转换成有效的Token,而不是无效的Token。谁能把这个成本降下去,谁才是真正的赢家。"

scaleX40的设计围绕这些新需求展开。144G大显存支持长上下文窗口,多级KV Cache缓存机制满足推理场景的大显存需求,40卡高带宽域的一级互联将专家通信的out-to-out流量收揽在单个节点内。这些特性都是在控制成本的前提下,最大化单位算力的Token产出效率。

无线缆箱式设计也是scaleX40一个很大的差异化。传统超节点的一个核心痛点在于部署复杂度。以英伟达NVL72为例,其采用铜缆连接方案,机柜之间需要大量的线缆互联,不仅对机房环境要求苛刻,部署周期长,而且后期运维的故障率也居高不下。

scaleX40的解法和英伟达于今年GTC大会公布的最新解决方案相似,通过总线技术实现Scale-up扩展,计算节点与交换节点采用无线缆正交架构直接对插。

这一设计带来了多重收益,首先,总线技术性能达到传统NDR网络的10倍以上,支持内存语义和显存统一编址;其次,一层组网将P2P单向时延降至百纳秒以内,相比二层组网时延降低30%以上,故障率降低30%-50%。

其次,scaleX40采用标准19英寸箱式设计,单机高度仅16U,可以直接放入主流机柜,兼容现有数据中心环境,无需额外改造。

"过去很多产品要么柜子比较大,要么非标准化,要么机房改造非常复杂。"李柳说道,"scaleX40可以放在标准机柜里面,接标准机房的供电和冷却设备,部署和使用门槛大大降低。"

中国电信研究院智算网络技术负责人王子潇也表示:"以超节点形态提供推理服务,性能比传统单机8卡提升约2.6倍。超节点的‘开箱即用’能力显著增强,Scale-out网络的配置复杂度有数量级降低,对于整个行业规模化应用非常有意义。"

更深层来看,scaleX40的发布也折射出国产算力生态的成熟。从芯片到系统软件,从存储到网络,从算子库到通信库,一条完整的产业链正在形成。正如李斌所言:"我们在整个国内计算AI生态里,从芯片到系统软件,到上层模型和应用,在做垂直的跨层协同,通过垂直方向的耦合和协同去发挥更好的效率。"

当超节点开始以更简单的方式被部署和使用,当千行百业都能以合理的成本获得高端算力能力,中国AI的规模化应用,或许才真正迈出了关键一步。(本文作者 | 张帅,编辑 | 杨林)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
迟重瑞灵堂哭到崩溃,继子很冷漠不戴白花,陈丽华葬礼藏何隐情?

迟重瑞灵堂哭到崩溃,继子很冷漠不戴白花,陈丽华葬礼藏何隐情?

云舟史策
2026-04-11 07:44:48
101球,拜仁追平自己保持的单赛季德甲进球纪录

101球,拜仁追平自己保持的单赛季德甲进球纪录

懂球帝
2026-04-12 01:15:07
马筱梅带娃回京,张兰推掉工作在家等汪宝,汪小菲亲自为顾客上菜

马筱梅带娃回京,张兰推掉工作在家等汪宝,汪小菲亲自为顾客上菜

一盅情怀
2026-04-11 09:06:32
刘嘉玲对张兰家事一门清,现场只字不提马筱梅,一直劝好友爱自己

刘嘉玲对张兰家事一门清,现场只字不提马筱梅,一直劝好友爱自己

离离言几许
2026-04-11 13:49:47
亚锦赛:连爆大冷世界第1凤凰组合与第2第3都出局,决赛对阵出炉

亚锦赛:连爆大冷世界第1凤凰组合与第2第3都出局,决赛对阵出炉

求球不落谛
2026-04-11 13:23:02
“留学回来,15次相亲失败”,杭州女孩被拆穿:连繁殖能力都没有

“留学回来,15次相亲失败”,杭州女孩被拆穿:连繁殖能力都没有

千言娱乐记
2026-04-09 09:17:50
陪睡3年被公开羞辱!买超翻脸和邵晴切割,张嘉倪离婚翻盘成赢家

陪睡3年被公开羞辱!买超翻脸和邵晴切割,张嘉倪离婚翻盘成赢家

精彩背后的故事
2026-04-10 16:35:55
是前世记忆还是平行宇宙?牛启文的经历,让专家也感到费解

是前世记忆还是平行宇宙?牛启文的经历,让专家也感到费解

郁郁乎文
2025-02-13 21:50:34
王楚然化身纯欲尤物,白色吊带下这若隐若现的曲线谁顶得住?

王楚然化身纯欲尤物,白色吊带下这若隐若现的曲线谁顶得住?

娱乐领航家
2026-04-11 22:30:03
英媒爆料:两大突发状况出现,让大陆放弃2027武统转向和谈

英媒爆料:两大突发状况出现,让大陆放弃2027武统转向和谈

荷兰豆爱健康
2026-04-11 18:39:15
他以为中国军队会顾忌国际观感而不敢动手,结果成了级别最高俘虏

他以为中国军队会顾忌国际观感而不敢动手,结果成了级别最高俘虏

古书记史
2026-04-10 23:51:43
哲凯赖什2026年已打入11球,英超球员中仅次于若昂-佩德罗

哲凯赖什2026年已打入11球,英超球员中仅次于若昂-佩德罗

懂球帝
2026-04-11 20:58:05
这四种病都不是病?而是年龄到了!过度治疗反而伤身,坦然接受

这四种病都不是病?而是年龄到了!过度治疗反而伤身,坦然接受

医学科普汇
2026-04-10 20:15:11
别盯李小冉的脸了,她的背才是真正的人间清醒

别盯李小冉的脸了,她的背才是真正的人间清醒

陈意小可爱
2026-04-11 15:35:20
华为王者归来!Mate 80系列销量突破500万台:最强Mate卖疯了

华为王者归来!Mate 80系列销量突破500万台:最强Mate卖疯了

快科技
2026-04-11 22:43:35
千万粉丝网红晒剃光头视频感动全网

千万粉丝网红晒剃光头视频感动全网

新民周刊
2026-04-11 18:14:45
西方集体撤退!中国死磕,为什么全世界,就中国在拼命搞核聚变?

西方集体撤退!中国死磕,为什么全世界,就中国在拼命搞核聚变?

夏至陌离殇
2026-04-10 17:50:24
穆里尼奥:我想继续执教本菲卡,没必要总是重复来重复去

穆里尼奥:我想继续执教本菲卡,没必要总是重复来重复去

懂球帝
2026-04-11 22:35:36
情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

李晚书
2026-04-10 17:13:10
赖清德收到了“参会通知”,一看身份栏那行标注当场破防:不去!

赖清德收到了“参会通知”,一看身份栏那行标注当场破防:不去!

时尚的弄潮
2026-04-11 20:23:00
2026-04-12 01:32:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
132104文章数 862090关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

时尚
本地
旅游
手机
军事航空

普通人穿衣其实很简单!构造腰线、一衣多穿,大方舒适又自然

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

旅游要闻

[视频]多元业态融合 打造文旅消费新热点

手机要闻

全球首款阔折叠卖爆!华为Pura X一年出货量超150万台

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版