网易首页 > 网易号 > 正文 申请入驻

刚刚,华为AI突破性技术公布!英伟达花50亿才买到“同款”

0
分享至


智东西
作者 云鹏
编辑 心缘

智东西11月21日报道,刚刚,华为正式发布了Flex:ai,一项能够将智算资源利用率提升30%的AI容器技术。值得一提的是,这项技术并无生态限制,英伟达的GPU和华为昇腾NPU等算力卡都可以用。


具体来看,Flex:ai是基于Kubernetes容器编排平台构建的XPU池化与调度软件,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的“精准匹配”,进而提升算力资源利用率。

以软件补硬件提升AI训推效率、通过开放兼容降低软件开发难度,是其主要特点。

此前,英伟达于2024年4月以7亿美元(约合人民币49.7亿元)收购了以色列AI基础设施公司Run:ai,这家公司核心技术和产品就是提升GPU利用率,能够补充英伟达在AI计算资源管理领域的软件能力。

华为的Flex:ai有其“对标”的意味在,填补国内这一领域的空白,但同时开源的更加全面,相比Run:ai的解决方案,在虚拟化、智能调度方面有其独特技术优势。

Flex:ai将在发布后开源在魔擎社区中,与华为此前开源的Nexent智能体框架、AppEngine应用编排、DataMate数据工程、UCM推理记忆数据管理器等AI工具共同组成了完整的ModelEngine开源生态。

华为特别提到,这项技术“从第一天起”就是高校一起合作开发的。在华为看来,开源是非常重要的,算力资源利用率的提升绝非“一概而论”,需要根据实际业务场景来分析,形成一系列算法。因此华为希望更多客户利用开源生态,将技术拿到自身实际业务场景中,共同探索、解决问题。

华为公司副总裁、数据存储产品线总裁周跃峰特别提到,华为更关注的是AI真正的行业化应用,关注tokens实现的价值而非总量。他们希望让更多企业真正用好AI,让AI进入生产流程中,实现增值,进而推动AI的平民化。

魔擎社区地址:
https://modelengine-ai.net

一、拆解Flex:ai三个关键能力:一张卡变N张卡、负载算力精准匹配、通算和智算融合

具体来看,Flex:ai主要有三个方面的关键能力:

1、算力资源切分,一卡变N卡服务多个AI工作负载

通过算力切分技术,将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。


2、多级智能调度,实现AI工作负载与算力资源的“精准匹配”

通过全局智能调度器Hi Scheduler,自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,实现AI工作负载分时复用资源。即便在负载频繁波动的场景下,也能保障任务平稳运行。


3、跨节点算力资源聚合,实现通用算力与智能算力资源融合

聚合集群内各节点的空闲XPU算力聚合形成“共享算力池”,通用服务器通过高速网络将AI工作负载转发至池内GPU/NPU卡执行,实现通用算力与智能算力资源融合。


二、AI大模型时代,AI容器技术升级势在必行

为什么要发布并开源Flex:ai AI容器技术?在华为看来,大模型时代,容器与AI是天然搭档。

容器技术作为一种轻量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立的、轻量级的镜像,实现跨平台无缝迁移,解决模型部署“环境配置不一致”的痛点。容器还可以按需挂载GPU、NPU算力资源,按需分配和回收“资源”,提升集群整体资源利用率。

Gartner的分析师表示,目前AI负载大多都已容器化部署和运行,据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。

华为提到,当前传统容器技术已无法完全满足AI工作负载需求,AI时代需要AI容器。


大型语言模型(LLM)的容器镜像轻松突破10GB,多模态模型镜像甚至可达TB级别,传统容器无法支持超大镜像的快速拉起,环境构建时间往往长达数小时。

传统容器主要针对CPU、内存等通用计算资源进行管理与调度,而AI大模型训练与推理还需大幅依赖GPU、NPU等智能算力资源,传统容器无法对异构智算资源做到算力细粒度切分与智能调度,导致即使很小的AI工作负载也独占整张算力卡,且无法进行远程调用。

传统容器的资源调度以固定分配、通用调度为主,而AI工作负载的资源调度需要以保障任务完成效率为目标,对不同任务的SLO特性进行感知,实现动态弹性的资源分配。

三、对标英伟达Run:ai,虚拟化和智能调度是关键优势

AI容器领域业界已经有多家企业推出了不同产品,与英伟达今年年初收购的Run:ai公司的核心产品相比,华为Flex:ai主要在虚拟化和智能调度方面有一定优势。

具体来看,在本地虚拟化技术中,Flex:ai支持把单个物理GPU/NPU算力卡切割为数个虚拟算力单元,并通过弹性灵活的资源隔离技术,可实现算力单元的按需切分。

同时,Flex:ai独有的“拉远虚拟化”技术,可以在不做复杂的分布式任务设置情况下,将集群内各节点的空闲XPU算力聚合形成“共享算力池”,此时不具备智能计算能力的通用服务器通过高速网络,可将AI工作负载转发到远端“资源池”中的GPU/NPU算力卡中执行,实现通用算力与智能算力资源融合。

智能调度方面,Flex:ai智能资源和任务调度技术,可自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,满足不同AI工作负载对资源的需求。

比如高优先级AI工作负载可以获得更高性能算力资源支持,在出现算力资源已被全部占满的情况下,能直接抢占其他任务资源,确保最重要的任务能够完成。而优先级较低的AI工作负载,则可以在算力闲时如夜间执行,实现分时调度;针对增量训练场景,Flex:ai还可智能感知集群中增量数据的变化,达到一定阈值后,触发数据飞轮。

结语:AI容器技术升级,AI平民化提速

现如今,不同行业、不同场景的AI工作负载差异较大,Flex:ai的开源,可提供提升算力资源利用率的基础能力和部分实践案例,随着更多产业玩家的加入,业界必将完成更多基于这一技术结合场景的落地探索。

与此同时,开源的Flex:ai可以在产学研各界开发者的参与下,共同推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案,进一步加速AI的平民化。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

秋姐居
2026-01-19 22:01:43
恭喜国米!捡漏曼城巨星!罗马诺确认,30岁年富力强未来5年无忧

恭喜国米!捡漏曼城巨星!罗马诺确认,30岁年富力强未来5年无忧

阿泰希特
2026-01-20 11:39:42
巴特勒赛季报销!勇士遭重创+冲冠梦破碎,交易库明加再现转机?

巴特勒赛季报销!勇士遭重创+冲冠梦破碎,交易库明加再现转机?

李喜林篮球绝杀
2026-01-20 16:42:30
打败张本智和!淘汰雨果,王皓大喜,樊振东、王楚钦不再孤单!

打败张本智和!淘汰雨果,王皓大喜,樊振东、王楚钦不再孤单!

曹说体育
2026-01-20 13:15:34
全明星首发出炉!詹姆斯落选,西部阵容完爆东部!库里成唯一老将

全明星首发出炉!詹姆斯落选,西部阵容完爆东部!库里成唯一老将

篮球扫地僧
2026-01-20 17:47:18
沪指下探4080点后V型拉升,广发证券:看好一年当中“日历效应”最强的上涨区间

沪指下探4080点后V型拉升,广发证券:看好一年当中“日历效应”最强的上涨区间

每日经济新闻
2026-01-20 11:14:46
南博事件再升级!《江南春》调拨人是凌波,神秘顾客也浮出水面

南博事件再升级!《江南春》调拨人是凌波,神秘顾客也浮出水面

小娱乐悠悠
2025-12-22 09:35:17
高市早苗提前大选,名为最后一搏,实则金蝉脱壳,她早就不想干了

高市早苗提前大选,名为最后一搏,实则金蝉脱壳,她早就不想干了

白露文娱志
2026-01-20 16:11:43
疯狂!盟友变身主人!死道友不死贫道!

疯狂!盟友变身主人!死道友不死贫道!

汉唐智库
2026-01-19 11:07:40
央视曝光“毒铁锅”,用它炒菜,美食变“毒药”,很多人还在用!

央视曝光“毒铁锅”,用它炒菜,美食变“毒药”,很多人还在用!

阿纂看事
2026-01-17 09:41:12
老祖宗的智慧:如果第二脚趾长过大拇趾,这种人晚年命运早已注定

老祖宗的智慧:如果第二脚趾长过大拇趾,这种人晚年命运早已注定

卡西莫多的故事
2026-01-17 08:05:09
刚刚预报!未来两天 无锡较高风险!

刚刚预报!未来两天 无锡较高风险!

无锡eTV全媒体
2026-01-20 13:36:10
施工员丈夫生病住院,妻子:你不是有家人吗?用不着我这个外人

施工员丈夫生病住院,妻子:你不是有家人吗?用不着我这个外人

施工员小天哥
2026-01-19 17:12:58
36岁便慷慨就义的瞿秋白,建国后毛主席为何会有 “以后少纪念他” 这样的评价?

36岁便慷慨就义的瞿秋白,建国后毛主席为何会有 “以后少纪念他” 这样的评价?

桃烟读史
2025-12-31 21:38:26
台湾票房冠军,内地查无此片

台湾票房冠军,内地查无此片

闲人电影
2026-01-14 22:08:59
炸裂!梅西加盟利物浦?布拉德利替代者锁定,冬窗首签目标曝光!

炸裂!梅西加盟利物浦?布拉德利替代者锁定,冬窗首签目标曝光!

澜归序
2026-01-20 03:41:50
艰难!仅7%球迷看好U23国足进决赛 越南方面:中国队只会禁区堆人

艰难!仅7%球迷看好U23国足进决赛 越南方面:中国队只会禁区堆人

风过乡
2026-01-20 12:29:36
牢A“糖霜苹果”撕碎美国最后滤镜,洋奴只能靠“四大名著”活了

牢A“糖霜苹果”撕碎美国最后滤镜,洋奴只能靠“四大名著”活了

韬闻
2026-01-20 10:12:16
去了北京才发现:没人穿大衣、皮草,满大街都是“海淀风3件套”

去了北京才发现:没人穿大衣、皮草,满大街都是“海淀风3件套”

小虎新车推荐员
2026-01-13 11:24:22
中国军工太“狠”,比苏联还苏联,比西方更西方,关键还坚持本我

中国军工太“狠”,比苏联还苏联,比西方更西方,关键还坚持本我

老范谈史
2026-01-19 20:46:26
2026-01-20 19:04:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11093文章数 116943关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

李亚鹏的嫣然医院收到千万捐款可否交房租 律师发声

头条要闻

李亚鹏的嫣然医院收到千万捐款可否交房租 律师发声

体育要闻

新的时代!东契奇首夺全明星票王 詹姆斯落选首发

娱乐要闻

贝克汉姆长子发文决裂:全家都在演戏

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

艺术
家居
手机
数码
教育

艺术要闻

传说曾是刑场?深圳这栋“蜡烛楼”,看一眼后背发凉!

家居要闻

隽永之章 清雅无尘

手机要闻

安卓首款无折痕折叠屏!三星Galaxy Z Fold8已在路上

数码要闻

VGN推出蜻蜓3系列三模鼠标:全系内龙骨架构,99~299元

教育要闻

《长大啦》本周双期连播:如何破解校园跟风和写作业难题?

无障碍浏览 进入关怀版