![]()
本文系深度思辨性内容,旨在促进技术认知深化与行业理性探讨
前言
每半年发布一次的全球TOP500超算榜单,素来被视作世界高性能计算发展脉搏的精准刻度。
2026年德国ISC国际超算大会公布的最新榜单,带来一个颠覆既有认知的重大转折——国家超级计算深圳中心自主研发的“灵晟”系统,以2.19EFlops的稳定双精度浮点运算能力,强势跃居全球榜首。
这是中国超算时隔九年再度问鼎世界第一,其深远价值远超名次更迭本身——它标志着全球首台完全基于自主CPU指令集架构实现E级突破的超级计算机正式诞生,在欧美长期主导的技术范式之外,开辟出一条可验证、可持续、全栈可控的新路径。
![]()
![]()
E级竞赛的两条赛道
近年来全球冲刺E级超算的主流力量,几乎不约而同地选择了同一套技术组合:通用CPU搭配专用GPU加速器的异构混合架构。
逻辑极为清晰:TOP500排名所依据的核心基准HPL测试,本质是求解超大规模稠密线性方程组,对双精度浮点吞吐能力具有极致依赖。
GPU凭借天然的大规模并行处理优势,通过密集堆叠计算单元即可快速拉升理论峰值性能,冲榜响应速度快、路径确定性强。美国Frontier、El Capitan系统,以及欧洲JUPITER Booster项目,均沿袭这一成熟范式。
久而久之,“无GPU难达E级”的思维定势已在业内悄然固化。
![]()
然而亮眼的理论分数之下,潜藏着被广泛默许却鲜少公开剖析的结构性瓶颈:异构架构虽能堆出惊人峰值,但CPU与GPU之间频繁的数据迁移过程会引入显著通信延迟与带宽瓶颈;当应用于真实科研负载时,实际有效算力常徘徊在峰值的55%至65%区间。
更关键的是,当前主流GPU厂商战略重心全面转向AI训练与推理市场,持续削减面向高精度科学计算的双精度硬件研发投入,导致该类性能提升曲线已明显趋缓。
整个产业由此陷入一种深层悖论:既高度依赖GPU实现E级跃迁,又实质性受制于GPU演进节奏的单点约束。
![]()
“灵晟”反其道而行之,坚持纯CPU原生架构路线,却实现了超越异构方案的实际效能表现。
整套系统未集成任何外部协处理器或加速卡,而是依托千万量级国产通用CPU核心的高效协同调度;
通过在芯片内部集成自研高带宽内存控制器,从物理层面根除跨芯片数据搬运带来的功耗与延迟损耗;
再辅以全自研的低延迟高速互连网络,将十万节点集群内的端到端通信延迟压缩至微秒级水准。
最终实测HPL效率高达82.3%,相较当前主流异构平台平均高出18个百分点以上,真正实现“用更低纸面峰值,兑现更高可用算力”的工程突破。
![]()
![]()
自主绝非一日之功
外界常将此次登顶解读为“突然爆发”,实则这背后是一条长达十余年的扎实攀登轨迹。
早在2016年,“神威·太湖之光”即以全国产申威众核处理器首次登顶TOP500,有力证实了脱离进口芯片亦可构建世界级超算系统的可行性。
但受限于众核架构的编程模型复杂性与通用软件生态适配难度,该平台更多服务于特定领域的大规模并行仿真任务,尚不足以支撑覆盖气象、能源、材料、生物医药等全谱系科研与工业计算需求。
![]()
随后数年不断升级的出口管制措施,确实在短期内加剧了产业链压力,却也彻底终结了“引进替代优于自主创新”的观望心态。
过去几年间中国超算虽在公开榜单中低调蛰伏,并非技术停滞,而是整个基础软硬件体系正经历一场静默而系统的攻坚:通用CPU微架构持续迭代升级,片上/板级/系统级高速互连技术接连取得关键突破,国产操作系统与编译器工具链完成多轮深度优化,就连高带宽内存封装、全浸没式液冷散热模组等配套环节,也都实现了从追赶到并跑乃至局部领先的跨越。
![]()
这并非某支科研团队的孤峰突起,而是国家超算基础设施多年技术沉淀的集中喷发。
从天河系列积累的千万核心资源动态调度经验,到神威系列验证的全国产芯片工程化落地能力,再到今日“灵晟”所代表的全栈通用高性能计算体系成型,每一步演进都具备清晰的技术继承性与逻辑连贯性。
此次选择正式亮相并登顶榜单,本质上意味着整套自主可控算力基座已进入高度稳健阶段——即便面临更为严苛的外部技术围堵环境,其底层根基依然坚不可摧。
![]()
![]()
算力终局在赛场外
需要清醒认识到,HPL基准测试仅是进入超算竞技场的通行证,而非衡量系统终极价值的标尺。
超算领域公认一条铁律:TOP500反映的是理论算力天花板,而戈登贝尔奖所表彰的,才是真正驱动重大科学发现与工程突破的实战能力。后者聚焦于利用超算解决人类前沿难题的实际成果,权威性与含金量远超单纯性能比拼。
此前国产超算已多次斩获该奖项,在全球气候变化建模、强震动力学模拟、星系形成演化仿真等方向持续产出具有国际影响力的原创成果。
![]()
在正式列入TOP500榜单之前,“灵晟”系统已在多个国家战略科技领域完成规模化部署与验证。
气象预报方面,已实现水平分辨率达1公里的全球大气数值模拟,极端天气事件预警提前量较上一代系统提升3至4倍,为防灾减灾赢得关键响应时间窗口;
能源勘探领域,国产自主油气地震成像软件完成全栈迁移后,核心逆时偏移模块实测性能反超同类进口GPU加速方案,一举打破海外高端算力与专业软件双重绑定困局;
新材料与新药研发方向,亿级原子尺度的第一性原理电子结构计算、万亿分子库级别的高通量虚拟筛选任务均已常态化运行,有望将传统研发周期缩短40%以上。
![]()
相比榜单第一的荣誉头衔,更具里程碑意义的是国产高性能计算生态体系的实质性成型。
以往大量科研与工业级应用软件仅支持x86或CUDA生态,致使国产超算长期面临“有算力、无应用”的尴尬局面。
如今从底层固件、操作系统内核、编译运行环境,到中间件服务、领域专用框架,直至顶层行业应用软件,全链条适配工作正加速贯通,算力正稳步转化为真实的科研生产力与产业竞争力。
![]()
此次登顶,与其说是单一性能指标的胜利,不如说是一次技术发展道路的庄严确认。
曾几何时,全球高端超算的技术标准制定权、核心IP专利池、关键元器件供应链,几乎全部由欧美主导,技术封锁意图明确指向将中国锁定在全球价值链中低端位置。
现实给出的答案却是:封锁无法遏制真正的创新动能,反而倒逼出一套更加完整、更具韧性、完全自主的高性能计算技术体系。
![]()
世界第一从来不是终点,而是中国自主算力发展的全新起点。
当一座完全掌握在自己手中的顶级算力底座稳固建成,它所能托举的,将是气候预测精度的跃升、清洁能源开发的提速、新型功能材料的涌现、原创药物研发的加速——无数关乎国计民生与科技前沿的关键突破。
这份不仰赖他人、靠自身力量蹚出来的技术底气,才是中国超算献给未来最厚重、最持久的战略资产。
![]()
若您已耐心读完此文,诚邀您轻点关注按钮,既便于后续深入交流与观点碰撞,也能为您带来更具参与感的技术阅读体验,衷心感谢每一位读者的支持与陪伴!
信源:观察者网——性能突破2EFlops!国产超算时隔九年再度登顶全球
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.