网易首页 > 网易号 > 正文 申请入驻

从高性能计算(HPC)技术演变解析方案、生态和行业发展趋势

0
分享至

如今大数据、云计算技术的发展已经自身疲惫了。然而跨界竞争和技术融合迫使我们不断换血和补充能量来适应一次次变革。在人工智能、虚拟现实、物联网等技术热潮过后,能预测到的下一个技术热点会是什么,高性能计算(HPC)?是的,HPC应该再适合不过了。

为什么这么说呢?因为前期作者已经做了大量分析,并在项目实践和总结中得到了答案,分析成果精要都已经通过发文的形式分享给小伙伴们。按照前期的惯例,今天也是把HPC行业趋势、产品和技术的分析梳理成“高性能计算(HPC)技术、方案和行业全面解析”电子书,通过的收取少量费用的方式提供给真正需要的小伙伴参阅,详情参阅原文链接,以下为目录介绍。

回顾历史,传统HPC主要聚焦在仿真、物理化学、生命科学、渲染、勘探和气象等六大场景,上层HPC集群化软件、生态和解决方案还是比较固定。

根据HPC应用的目标市场可分为HPC商业市场和HPC科研市场。但随着大数据、云计算和技术发展和行业融合,综合技术和行业趋势,HPC行业划分方法也发生了变化,目前主要分为传统HPC(以上述的六大场景为主),HPDA高性能数据分析、HPC Anywhere和HyperScale四大类。

其中,在HPC Anywhere中实现了HPC和云的结合,例如Panzura、Ctera、Avere和Nasumi等集群文件网关存储厂商,他们提供一个高速的本地分布式NAS系统,用于对接AWS、Azure等这样的公有云对象存储和一些低速的NAS产品,通过这些网关提供了一个缓冲层,可以设置策略让数据在网关和其它存储之间流动,通过NAS或Object存储直接实现与集群网关,甚至公有云连接和数据流动。

随着闪存技术的成熟,HPC的传统的3层技术架构(即计算节点内存、并行文件系统和归档存储)也发生了变化。在HPC系统中,并行文件系统(pFS)对HPC性能影响最大,在某种意义上决定整个HPC存储性能。传统HPC架构应对超大规模HPC集群计算节点同时Checking Point需求时,显得力不从心,那就需要在pFS之上多加一层高速大容量(相对于Memory)的Cache(Burst Buffer)。

我个人认为Burst Buffer技术可能是一个技术过度产品,类似改善系统性能的Hybird存储,不过,在目前SSD还相当贵的状况下,Burst Buffer却能够很好的匹配超大型HPC场景极致性能需求。在性能和容量空间比在20MB/TB至200MB/TB之间,Burst Buffer可以说是非常适合的(Burst Buffer提供的SSD承载80%以上的性能,容量由传统存储HDD提供),通过简单的配置调整,不但不会出现容量或性能超配,而且还能发挥出SSD的价值。

回首HPC并行文件系统,屈指可数,主流的有Lustre、GPFS、BeeGFS,当然Glustre、Ceph和企业NAS也会在HPC中出现,但还不是主流。

在HPC行业,有个业界一直被推崇的做法可以借鉴,那就是开源生态和的重要性。从Linux,OpenStack,Ceph到Lustre和BeeGFS等。他们的成功说明开放的魅力强大,参与者越多产品才会越稳定,客户才会认同。拥抱开源,基于自己的优势和理解定制化,走出一条自己的路。DDN、Seagate还有很多HPC方案供应商都是这样从开源和合作中占据主要的HPC市场份额。

谈到HPC不可避免的会谈到NAS或pFS,那么HPC为什么就一定要pFS呢?

因为计算软件,配置数据需要在各个计算节点共享,需要多并发访问,计算的临时文件、中间、结果文件需要集中处理。

在计算集群形成初期,系统中并没有复杂的存储系统存在,甚至没有统一存储的概念,那时每台计算节点把自己所计算出的数据先暂时写到自己的本地硬盘上(Cache),最终由主节点进行所有数据的回收,至主节点所挂载的相对大的空间中(其实这就是后来HPC存储的雏形),再进行后续处理(分析、共享、可视化、备份与恢复)。

本地存储引入的问题:计算任务在计算集群中被分割为若干个子任务。计算过程中,某个计算节点的输入数据可能存放在另外的节点上,引入的问题。

  • 1、各节点的数据会二次进出本地硬盘,各节点间的数据传输也会造成多余的网络风暴,这种做法无疑会造成计算效率的下降;

  • 2、应用程序代码编写过程中,无法预计所要数据在哪个节点上,都造成麻烦与效率的低下。

因此后续的程序编写中,会让所有的节点都认到一块区域,将所有的临时性数据和最终数据都写到这里,即统一命名空间,因为所有计算节点都可以看到这块同一个名字的数据存储区域,表现在计算节点的OS中即为看到同一个名字的目录。

HPC应用软件,例如Paradigm、3Ds Max等,在配置计算模型的存储指针时,会发现要求指向同一个区域,即统一的存储空间,而且有许多软件在这个参数的设置上是不能修改的。

某计算节点自己的中间数据,可能会存放在自己内部的存储上。如果使用SAN存储,就必须使用SAN共享软件(如StoreNext),保证数据读写的一致性。

DDN是在Burst Buffer上发力最猛的HPC解决方案提供商,但是Burst Buffer目前还没有一统天下(未来可能全闪存会一统HPC天下),Panasas和Seagate是两家专注HPC行业的专业存储厂商,他们在Burst Buffer上没有发力,但是他们在NL_SAS磁盘和HPC专有存储上却一直不懈努力。

Panasas的技术从我一开始借助HPC就吸引着我,ActiveStor 8、9、11、12采用数据控制分离,磁盘内置控制器可以把HDD磁盘性能发挥极致,遗憾的是不知为何,最近几年Panasas一直淡出在我们视野。

至于Seagate,更是把密度和HDD结合的非常完美的典范,ClusterStor可以在5U空间提供84个磁盘容量和16GB/s性能,从最新的宣传来看,性能已经翻番了。他们虽没有采用SSD,但成了完全可以玩转HPC的例子。

面对未来高性能、大带宽应用和业务,网络有哪些要求呢?目前主流的就是100GE以太网、Omni-Path和InfiniBand。

站在市场角度,我更希望Mellanox的InfiniBand和Intel的Omni-Path技术都能找到适合发展的市场空间,分别发挥出自己不同的优势,希望Intel收购了Qlogic的InfiniBand业务后又基于True Scale Fabric另辟新径是正确选择。

HPC系统能力通过哪些基准来衡量呢?Top500和Green500的排名是衡量HPC系统地位的重要指标。

中国“神威-太湖之光”超级计算机(无锡)和“天河二号”超算系统(广州)多年来蝉联Top500榜首,虽然成绩优异,但其在Green500的排名还有很大的提供空间。在未来迎接HPDA、云化和HPC HyperScale趋势,只有计算性能和绿色节能兼备才能更好的把握云计算和大数据下HPC的主动权和话语权。

关于HPC系统能力BenchMark排名,除了TOP500、Green500和HPCG之外,还有Graph500排名和Green Graph 500排名等,Green Graph 500使用与Green500相同的性能指标,但它是根据每瓦特性能排名,即采用Green 500测试模型测试但配合Top500(HPL)使用每瓦特性能排序。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
觉悟的解禁!这是与田りん(与田铃)成为大人的代价!

觉悟的解禁!这是与田りん(与田铃)成为大人的代价!

孤独的独角兽影视
2026-04-28 09:45:09
央视主持人文清现状胖到不敢认,在桂林陪读,老公在澳洲当院长

央视主持人文清现状胖到不敢认,在桂林陪读,老公在澳洲当院长

凛若秋霜
2026-05-25 04:41:33
事件反转!七段影像公布、幕后之人浮出水面,马英九竟因尾牙翻脸

事件反转!七段影像公布、幕后之人浮出水面,马英九竟因尾牙翻脸

野史日记
2026-05-27 13:50:05
上海换乘王来了...

上海换乘王来了...

新浪财经
2026-05-27 07:44:38
输球哽咽过去仅半月,王曼昱正式官宣“新身份”,终于等到这一天

输球哽咽过去仅半月,王曼昱正式官宣“新身份”,终于等到这一天

夕落秋山
2026-05-27 11:59:26
赵勇赖亚文神操作:把功勋的路堵死 把自己的路走窄 中国女排告急!

赵勇赖亚文神操作:把功勋的路堵死 把自己的路走窄 中国女排告急!

舟望停云
2026-05-27 11:41:13
奇葩!广厦外援痴迷单打,孙铭徽喷脏话后接球不投再将球扔了回去

奇葩!广厦外援痴迷单打,孙铭徽喷脏话后接球不投再将球扔了回去

新杀猪的秀才
2026-05-27 00:21:45
江西一新娘临时加8万彩礼,新郎扭头就去取钱,新娘到娘家后慌了

江西一新娘临时加8万彩礼,新郎扭头就去取钱,新娘到娘家后慌了

涛哥讲堂
2025-01-10 14:13:19
一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

老范谈史
2026-05-08 02:36:29
金小刀或入狱?不到24小时,萧旭岑抵达大陆,对民进党喊出四个字

金小刀或入狱?不到24小时,萧旭岑抵达大陆,对民进党喊出四个字

共工之锚
2026-05-26 14:01:35
我在非洲干废品回收,娶了一对姐妹,年赚三百万,如今感觉快疯了

我在非洲干废品回收,娶了一对姐妹,年赚三百万,如今感觉快疯了

千秋文化
2026-05-01 19:00:05
正式官宣!国乒男队主教练王皓上任新岗位,薪资待遇首次被曝光

正式官宣!国乒男队主教练王皓上任新岗位,薪资待遇首次被曝光

冷紫葉
2026-05-27 12:46:40
北京今天狂发15.4万个绿牌!有人激动到哭,真的太不容易了!

北京今天狂发15.4万个绿牌!有人激动到哭,真的太不容易了!

起喜电影
2026-05-27 01:39:00
43岁佟丽娅在广东街头,现实中真人看起来很娇小,目测158cm左右

43岁佟丽娅在广东街头,现实中真人看起来很娇小,目测158cm左右

可乐谈情感
2026-05-26 08:23:05
98岁李嘉诚要IPO敲锣了:2000亿

98岁李嘉诚要IPO敲锣了:2000亿

PE星球
2026-05-27 08:35:12
A股:全体股民做好心理准备,今天5月27号股市尾声真的将至了?

A股:全体股民做好心理准备,今天5月27号股市尾声真的将至了?

趋势清风侠
2026-05-27 08:42:35
被做局了?!NBA官网剧透总决赛双方!!

被做局了?!NBA官网剧透总决赛双方!!

柚子说球
2026-05-27 12:35:17
越扒越有!福建“杨梅商会会长”是当地最大的老板,亲戚担任要职

越扒越有!福建“杨梅商会会长”是当地最大的老板,亲戚担任要职

童童聊娱乐啊
2026-05-27 11:28:46
来自东北的雪白短发人妻,月神花梨E罩杯惊艳亮相

来自东北的雪白短发人妻,月神花梨E罩杯惊艳亮相

吃瓜党二号头目
2026-05-27 10:41:51
华为发布“韬定律”,西方科技的桌子这次真的被掀翻了吗?

华为发布“韬定律”,西方科技的桌子这次真的被掀翻了吗?

码头青年
2026-05-27 13:21:44
2026-05-27 14:24:49
科技全世界
科技全世界
科技
214文章数 738关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

258亩荠菜地遭数百人哄抢造成损失约70万 种植户发声

头条要闻

258亩荠菜地遭数百人哄抢造成损失约70万 种植户发声

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

极狐问道V9今日将正式上市 搭载华为雪鸮增程系统

态度原创

健康
艺术
房产
本地
公开课

打外泌体会比干细胞更安全吗

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

房产要闻

终极塔尖资产!这可能是海南今年最出圈的豪宅!

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版