![]()
探索宇宙奥秘 · 理性思考
想象一下,你是一位顶尖的建筑师,设计出了一栋美轮美奂的摩天大楼。但现在,你得带着这沓图纸,分别跑到只用钢筋、只用木头、只用石头的工地上,让工人们盖出一模一样的楼来。你是不是得给每个工地都重新画一整套图?
这就是中国超算科学家们过去几年面临的“幸福的烦恼”。手里握着“神威”这样的国产顶尖硬件,但软件却像个“水土不服”的外乡人。不过,这个局面正在被改写。
到底什么是swKokkos?要理解它,得先明白超算的“心”有多复杂。
今天的超算,早已不是一堆相同CPU的简单堆砌。它更像一个异构的“特种部队”,有擅长指挥的(CPU),有擅长重复计算的(GPU或神威的从核)。但问题来了,不同的超算,架构天差地别。
给A超算写的程序,拿到B超算上,轻则跑得慢如蜗牛,重则直接“罢工”。这就是高性能计算领域最难缠的敌人之一——性能不可移植。
中科院这次搞定的swKokkos,本质上是一个“性能可移植”的编程后端。它的高明之处在于,为神威处理器那个独特的“主从核”架构(可以理解为一个大脑指挥数万个勤杂工),引入了一套“并行执行抽象” 。程序员不用再去记神威那套繁琐的原生指令(Athread),而是用更通用的“语言”写代码,swKokkos自动帮你在神威的“勤杂工”们之间分配任务、搬运数据。
光说概念可能有点虚,咱们看点硬核的数据。
swKokkos有多好用?研究团队用几个最基础的数学测试(AXPY、数值求解器)做了检验。结果让人眼前一亮:它的性能达到了神威原生编程模型Athread的99%以上。
这是个什么概念?相当于一个同声传译,不仅把话翻译过去了,连原讲话人的语气、停顿、情绪都还原了99%。对于程序员来说,这意味着巨大的“无痛感”——几乎不需要为了迁就新硬件去重写代码,就能享受到硬件本身的大部分算力。
更牛的还在后面。他们把我国自主研发的海洋模型LICOM拿出来“练手”。这个模型在超过10万核的规模上,不仅稳定运行,还实现了显著加速。10万核,相当于同时指挥10万个“勤杂工”挖一条运河,不仅没乱套,反而比原先靠人海战术推土还快。
放眼全球,性能可移植性也是块难啃的硬骨头。国际主流走的是一条“统一生态”的路子,比如美国的Kokkos和RAJA框架 。它们试图定义一个“通用标准”,让Intel、AMD、NVIDIA的芯片都来遵守。
![]()
所以,swKokkos的突破,不仅仅是跟进国际潮流,更是一次“精准滴灌”。它不是简单地把Kokkos拿过来用,而是针对神威的“独特性格”(硬件约束)做了深度改造。比如它引入的向量化哈希索引和FDSL快速调度库,就是为了解决神威从核启动任务太慢、缓存容易堵车的“水土不服”问题 。
无独有偶,就在同一个月,北京大学的杨超教授团队也在性能可移植模型上亮出了自己的方案——Leonid,不仅能跑CPU和GPU,同样也支持了神威平台,还搞出了“自动算子融合” 。
这两件事放一起看,信号就很明确了:中国超算界正在集体攻关,试图在“软”的一面,为国产“硬”件构建起一道护城河。
swKokkos的意义,其实超越了这一个软件本身。它像是一面镜子,照出了中国超算战略重心的微妙转移。
过去十年,我们痴迷于在全球超算TOP500榜单上争第一,比谁的运算速度更快,那是“堆硬件”的蛮力时代。但速度再快,如果应用软件跑不上去,超算就是一个昂贵的“电子花瓶”。
现在,我们已经有了神威、曙光等国产重器,下一步的关键是:如何让千千万万的科学家,能像用水用电一样,轻松地用上这些国之重器?
swKokkos的出现,正是为了解决这个“最后一公里”的难题。它试图把程序员从繁琐的硬件细节中解放出来,让他们专注于科学问题本身——是模拟气候变化,还是设计新药分子。
这不只是方便,更是生态的萌芽。当一个工具能让你用一套代码,同时跑在神威和GPU集群上,而且效率损耗极小的时候,开发者才愿意留下来,应用生态才能繁荣起来。
从某种意义上说,我们对超算的评价标准,正在从“它算得有多快”,转向“用它编程有多爽,跑应用有多顺”。这,才是真正从超算大国迈向超算强国的必经之路。
当我们的程序员不再需要为一个循环是放在主核还是从核而挠头,当我们的海洋模型可以轻松地在国产超算上模拟出每一朵浪花,到那时,我们才能真正地说:这不仅是中国的算力,更是中国创新的底气。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.