网易首页 > 网易号 > 正文 申请入驻

邬贺铨提出算力十大思考,建言从实战中学习创新

0
分享至

近日,2022中国算力大会在济南开幕,在以“算力筑基高质量发展”为主题的主论坛上,中国工程院院士邬贺铨发表《对数据中心“数学”与“算术”的思考》的主题演讲,提出了对算力的十大思考。邬贺铨解释“数学”即研究数据的科学,“算术”即研究算力的技术。

以算为主还是以存为主?

邬贺铨表示,AI应用驱动算力需求快速增长。基于GPU/NPU/FPGA等构建的AI智算中心适于训练数据导出模型。

训练出数学模型后,深度神经网络的使用并不需要调度非常多的参数,降低了对算力的需求。基于CPU的通用算力的IDC适于在已知数学模型下的计算任务。

邬贺铨指出,是否可以认为AI智算中心主要任务是算,IDC主要任务是存?

三类算力如何合理比例?

目前算力可以分为基础算力(基于CPU芯片)、智能算力(基于GPU和NPU芯片)和超算算力(基于超算)。

从2021年全球算力分布来看,美国占31%,中国占27%,其次是日本、德国、英国等其他国家。美国的基础算力占全球35%,智能算力占15%,超算占30%,而中国这三类分别为27%、26%和20%。

邬贺铨表示,可以看到美国以基础算力为主,中国智能算力的能力远远超过美国。中国的超算和AI智能中心是以政府为主,基础算力以运营商和互联网企业为主,美国则主要是互联网企业为主。

冷数据与热数据

IDC数据显示,人类历史上90%的数据都是在过去几年间产生的,50%在短短两年内生成的,预测到2025年数据量年均将以30%增长,即两年增70%。

一般来说,最近产生的是热数据,经历一周或数月后将转为温或冷数据,冷、温、热数据分别占累计数据总量约80%、15%和5%。

冷数据主要是存储,计算需求非常态。东西部分别适合处理热和冷数据,东数西算实际上是东数西存。

存算分离与存内计算

存算分离架构在控制单元指令下从存储器读数据并交到CPU计算,得到的结果还需送回存储器。但对冷数据I/O往复并不频繁,因此更适用于冷数据处理,例如云平台建模,边缘计算训练与仿真。另外,存算分离可采用开放存储体系和磁带存储介质,存储器可同时服务多服务器,池化存储支持多云,高利用率,降成本与能耗。

不过,热数据需快速计算,但受限于存算分离I/O瓶颈,且CPU能力受累于存储器访问速度难以发挥,更需要存内计算。存内技术以RAM代硬盘,在RAM内完成所有运算,例如自动驾驶可以在车内同时完成存与算,但目前实现复杂和成本高。

邬贺铨表示,虽然西部以处理冷数据为主,但也需要处理当地的热数据,冷热数据是否需要分别采用不同的存算架构?

封闭系统存储与开放系统存储

服务器一般由CPU和内存组成,如果将存储也放在一起,则称为封闭存储系统,但是容量有限。因此,大多数情况下是将存储和服务器分离,即开放系统存储,实现存储容量为多服务器共享,以池化方式支持多云应用。不同存储架构适应不同任务,可按照任务来软件定义存储。

PUE与IT能效

PUE是数据中心能耗占IT系统能耗之比,反映了制冷系统的水平,但并非衡量IT系统的能效。据统计在IDC的IT系统的能耗中,服务器约占50%,存储系统约占35%,网络通信设备约占15%。

数据中心需要7*24小时工作,但通常并非7*24小时都在计算,非计算状态下也耗能,此时存储系统的能耗成为主体。据麦肯锡报告:大部分电能用于维持服务器状态,仅6-12%用于计算。

因此,要降低能耗,首先对冷数据存储采用磁带代替磁盘,预计100PB十年存储成本可下降73%;其次,热数据存储用闪存代替磁盘,改进访速、吞吐量及能效,但目前成本还较高;另外,还要探索通过数据预处理改进能效。

数据可信与灾备保护

数据最重要的是安全,目前主要有两种灾备保护方案。一是三副本方案,容量利用率较低,但读写快,适于小文件;二是4+2纠删码方案,容量利用率较高,但读写慢,适用于大文件场景。这时候就要思考,大小文件需要分区存储,以便采用不同可靠性技术方案吗?

同时,灾备是数据中心刚性要求。据华为/罗兰贝格报告,美国数据保护占存储投资为33.3%,全球平均为27.4%,而我国仅7.8%,并且异地备份的比例更低,防灾能力堪忧。

此外还有值得研究的是对数据备份还是算力备份?算力与存力需要等比例备份吗?

存算协同的思考

根据华为/罗兰贝格报告,中国与美国相比存算比低一倍,导致中国算力利用率也较低,可以理解为,虽然算力有了,但存储没跟上。而存算比并非固定,例如对于冷数据其计算频度低,存算比应比热数据更高。因此,对冷数据和热数据分别的合理存算比应该是多少值得思考。

另外,带宽(吞吐量)和每秒/O操作数(IOPS)是衡量存储性能的两大指标,前者需要聚合更多存储单元的带宽,后者希望减少每次数据存取请求涉及的存储单元数,二者难以兼得。可以从计算任务调度入手,为存储系统提供预判此次任务的IO模式的信息,以便做出针对性的缓存策略和数据一致性策略,甚至将数据调度到合适的存储位置,获得更好的数据存储效能。

算网容量配比的思考

2021年全球数据中心流量分布,数据中心内占71.5%、数据中心到用户占比14.5%、数据中心间占比13.6%。主备数据中心间的数据传输要求同步动态更新数据,实时性高,不过每次更新的数据量不大。但对主备间链路可靠性要求高,通常需要端到端双路由。

另外,东西部数据中心间传输系统容量双向不对称。从东部定期将由热转冷的数据转移到西部,数据量大,但实时性要求不高,瞬时带宽不必很高。西部数据按需计算后的结果需要回传东部,数据量不大,但实时性可靠性要求高。东西数据中心间链路在数据中心到所在城市段需要双路由。我国需要有更多的调研和经验数据来决定数据中心间及到用户间的传输通道容量优化设计。

东数西算的思考

东数西算使得算力设施的布局超越了数据中心枢纽的范畴,虽然设想东部与西部互为冷热数据的配对,但东部西部间应如何比例?

以广东数据中心规划为例,设计省内算力70%,省外算力30%,这与冷数据占比80%差别很大,是否理解冷数据占80%是指存储容量而非算力的比例?另外,在市场经济条件下,东部与西部并非固定配对,各自独立设计部要如何能做到容量最佳利用?

同时,同一数据中心枢纽或集群内部也有很多比例需要优化。数据中心枢纽内有多个数据中心,每个数据中心内部多业主,如何实现枢纽内各数据中心所需的能源与网络资源集约化,并建立业主间资源共享机制,提升利用率。每一个数据中心需要设计算力、存力与网络能力合理的比例以及相应灾备比例,会视冷热数据有不同的优化。数据中心需立足长远建设能效更高的大型数据中心,但切忌一步到位.

此外,Gartner认为,2025年约超75%的数据将在边缘侧处理,需规划边缘与集群数据中心算力比例。

最后,邬贺铨表示,关于数据中心的 “数学”与“算术”还有很多需要深入研究的内容,要善于从实战中学习创新。(C114 水易)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
52岁谢金燕近况曝光!马甲线锋利如刀,背后却藏着数不尽的坎坷

52岁谢金燕近况曝光!马甲线锋利如刀,背后却藏着数不尽的坎坷

飘飘然的娱乐汇
2026-05-14 21:15:11
都体:长友佑都39岁入选世界杯,第五次参赛当场落泪

都体:长友佑都39岁入选世界杯,第五次参赛当场落泪

懂球帝
2026-05-16 02:20:07
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
刚接公婆来家,爸妈就停我12000房贷:钱给亲家养老房贷

刚接公婆来家,爸妈就停我12000房贷:钱给亲家养老房贷

麦子情感故事
2026-05-15 16:35:19
枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

深挖全球热点
2026-05-16 05:01:28
访华最后一天,中方以茶论道,给了特朗普中美外交史上唯二的待遇

访华最后一天,中方以茶论道,给了特朗普中美外交史上唯二的待遇

泛舟碧波湖水
2026-05-15 22:56:48
马刺新星瓦塞尔身家1900万,5年1.35亿合同细节曝光

马刺新星瓦塞尔身家1900万,5年1.35亿合同细节曝光

慢享生活集
2026-05-16 01:55:35
官方回应“广州一网红粥店后厨员工用扫把洗锅”:情况属实,已立案调查,该店已自行停业整顿

官方回应“广州一网红粥店后厨员工用扫把洗锅”:情况属实,已立案调查,该店已自行停业整顿

新浪财经
2026-05-15 22:43:11
4 种最佳抗衰老的运动,平均寿命延长5-10年

4 种最佳抗衰老的运动,平均寿命延长5-10年

增肌减脂
2026-04-07 21:15:04
马斯克访华像回家,母亲已长住上海,儿子身价万亿她还做视频带货

马斯克访华像回家,母亲已长住上海,儿子身价万亿她还做视频带货

别人都叫我阿腈
2026-05-15 12:53:23
小玥儿雨中崩溃大哭,张兰佛堂痛哭,孩子委屈背后藏什么隐情

小玥儿雨中崩溃大哭,张兰佛堂痛哭,孩子委屈背后藏什么隐情

君笙的拂兮
2026-05-15 23:45:00
《一帘幽梦碎,谁解痴心人》

《一帘幽梦碎,谁解痴心人》

青苹果sht
2026-05-15 04:59:04
耍大牌!NBA豪门内讧要解散,超巨遭队友背刺离队,哈登被你害惨了

耍大牌!NBA豪门内讧要解散,超巨遭队友背刺离队,哈登被你害惨了

老侃侃球
2026-05-15 15:27:54
两年输光2000亿资产的王健林,可能是中国地产的最后赢家

两年输光2000亿资产的王健林,可能是中国地产的最后赢家

流苏晚晴
2026-05-12 19:20:28
韩国南极科考站发生一起恐怖电影般事件:一50多岁研究员,用车间不锈钢板自制30厘米刀具,亮刀威胁同事!只因与其发生矛盾……

韩国南极科考站发生一起恐怖电影般事件:一50多岁研究员,用车间不锈钢板自制30厘米刀具,亮刀威胁同事!只因与其发生矛盾……

都市快报橙柿互动
2026-05-15 22:36:39
深圳地铁站偶遇王鸥!荧幕上颜值一般,现实中却美得惊艳又年轻

深圳地铁站偶遇王鸥!荧幕上颜值一般,现实中却美得惊艳又年轻

陈意小可爱
2026-05-16 05:28:09
大兴机场卷成吃住一条龙驿站了

大兴机场卷成吃住一条龙驿站了

Vista氢商业
2026-05-15 18:56:49
特朗普称美伊停火系“应其他国家要求”

特朗普称美伊停火系“应其他国家要求”

新京报
2026-05-15 21:44:04
昔日接班人稳坐核心,水谷隼为何容不下张本一家?答案刺痛日乒

昔日接班人稳坐核心,水谷隼为何容不下张本一家?答案刺痛日乒

曹老师评球
2026-05-15 22:23:13
2025长沙初中实力榜出炉!头部梯队断层领先,四大率差距一目了然

2025长沙初中实力榜出炉!头部梯队断层领先,四大率差距一目了然

朗威谈星座
2026-05-15 18:48:06
2026-05-16 09:19:00
C114 incentive-icons
C114
通信行业垂直门户网站
8675文章数 35038关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

鲁比奥访华期间回应媒体提问:中美两国关系至关重要

头条要闻

鲁比奥访华期间回应媒体提问:中美两国关系至关重要

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

张嘉译和老婆的差距让人心酸

财经要闻

造词狂魔贾跃亭

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

旅游
家居
游戏
教育
公开课

旅游要闻

缙云·巫山时序丨刘红梅:深山丛林

家居要闻

110㎡淡而有致的生活表达

《街霸6》春丽新品来了!招牌肉腿完美还原

教育要闻

26年高考电气工程分数会涨吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版