网易首页 > 网易号 > 正文 申请入驻

从“拼规模”到“拼效率”:华为Flex:ai跃升算力利用效率

0
分享至

C114讯 11月27日专稿(蒋均牧)从机器人聊天到使能千行万业的专业模型+Agent,AI技术的每一门分支、每一次飞跃都离不开算力的强有力支撑。

然而,随着AI应用的日益广泛与深入,一个更为现实的问题正在浮出水面——昂贵的GPU/NPU资源利用率普遍低于40%,大量算力在“空转”中被浪费;一些中小企业与科研机构却因算力门槛过高,难以充分受益于AI。长此以往,无疑将极大地制约AI产业发展。

在这一背景下,容器技术这个发端于云计算领域的概念,以其轻量级、可移植、易部署等特性,正从“应用封装工具”演进为“算力调度中枢”。就在最近,华为联合上海交通大学、西安交通大学与厦门大学发布并开源AI容器技术Flex:ai,旨在通过技术创新与生态共建,破解算力资源利用难题,进而推动AI技术的普惠。

“大家以前没有听到一个词,‘让AI从此平民化’?AI平民化不是在台式机里装块4090的游戏卡就作数,而是花更少的钱、让更多人获益,这就是我们今天所做的事情以及努力的方向。”华为副总裁、数据存储产品线总裁周跃峰博士告诉C114。发布会后,他携手数位华为技术专家出席媒体圆桌,对该公司在AI容器领域的前瞻视野与深远布局作出了详尽解读。


AI产业高歌猛进下的效率困境

2025年,全球AI产业继续高歌猛进,大模型参数规模从千亿迈向万亿,AI在各行各业的应用也开始步入深水区,算力需求呈指数级增长。但与之形成鲜明对比的是,算力资源的利用效率始终在低位徘徊。据统计,超过60%的头部互联网企业GPU利用率低于40%,在私有云化部署场景中甚至不足30%。

“小任务单卡算力用不完,大任务单机算力不够用,多任务并发时调度无解。”周跃峰的发言一针见血。他以医疗场景举例,一家顶级三甲医院仅能负担16张AI加速卡,但当多名医生同时使用AI辅助诊断时,推理任务排队等待时间长达数十分钟,“这不是技术不行,是资源调度机制出了问题”。

“在学校里面,GPU是非常关键的,大家都需要拿来做科研,发现资源利用率会比较低,一部分原因是卡被人占用后往往需要排队,形成了非常大的资源浪费。”上海交通大学戚正伟教授分享说,“传统虚拟化方案要么粒度粗放,要么开销过大,无法在异构算力环境中实现细粒度资源隔离。”

面对算力资源利用的挑战,容器技术以其独特的优势成为优化资源配置的重要手段。然而,传统容器技术在面对AI应用时,仍存在诸多不足。例如对GPU、NPU等异构算力资源的支持不够完善,难以实现算力的精细化管理;容器间的资源隔离与性能保障机制不够健全,容易导致任务间的相互干扰;此外,容器在跨节点、跨集群的资源调度与协同方面也存在较大局限,难以满足AI应用对算力资源的高效利用需求。

更深层的问题在于生态封闭。英伟达通过MIG技术实现GPU切分,但其固定粒度与硬件绑定的模式限制了灵活性;被其收购的Run:ai虽在调度层有所突破,却未彻底开源,形成“技术黑盒”且硬件兼容性严重受限。

显然,AI真正由“贵族游戏”走向“平民工具”,需要找到那块关键的拼图。

Flex:ai破局:从“资源切片”到“全局调度”

针对这一系列挑战,华为此次发布并开源的Flex:ai XPU池化与调度软件提供了破局之道。从技术架构看,Flex:ai基于Kubernetes构建,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的精准匹配,从而做到算力资源的“按需取用”与“细水长流”。其核心技术突破体现在三个方面:

突破一、XPU池化,让一卡变多卡:针对“小任务占大卡”的浪费现象,华为与上海交通大学联合研发了XPU池化框架。该技术可将单张GPU或NPU算力卡切分为多份虚拟算力单元,服务多个AI工作负载,切分粒度精准至10%。

“我们能不能把一张卡虚拟化成多张卡,让我们以更小的算力单元进行调度,让每一张卡的算力能力能够充分释放出来。”周跃峰在演讲中如此阐述设计初衷。在实际测试中,该技术使得小模型推理场景下的整体算力平均利用率提升30%,显著提高了单卡服务能力。

相比芯片原生的MIG技术只能切固定的切片,Flex:ai的软切分更加灵活,“用多少,切多少”。华为技术专家解释说:“我们的切片技术基于软件,可以根据需求来切分,比如说切三份,有的占40%、有的占30%、有的占20%,弹性也更好一点。”

突破二、跨节点聚合,打破“算力孤岛”:针对大量通用服务器无法服务于AI工作负载的问题,华为与厦门大学联合研发了跨节点拉远虚拟化技术。该技术将集群内各节点的空闲XPU算力聚合形成“共享算力池”,一方面为高算力需求的AI工作负载提供充足资源支撑;另一方面,可让不具备智能计算能力的通用服务器通过高速网络,可将AI工作负载转发到远端“资源池”中的GPU/NPU算力卡中执行。

“我们的关键思想是把XPU上下文从CPU的进程里面分离出来,并且进行抽象的组织和灵活映射。”厦门大学张一鸣教授阐述道,通过“多对多”与“多对一”的灵活映射,该技术有效解决了外部碎片(跨节点XPU空闲)和内部碎片(单卡算力未被充分利用)问题。

实测数据显示,该方案相比现有最佳技术Sota,在作业中提升了67%的高优作业吞吐量,并有效利用17%的内部碎片;在大规模仿真实验中,打破了XPU的服务范围限制,减少了74%的外部碎片。

突破三、多级智能调度,为算力基建装上“智慧大脑”:面对异构算力统一调度的挑战,华为与西安交通大学共同打造了Hi Scheduler智能调度器。该调度器可自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,实现AI工作负载分时复用资源。

“做了分层调度后怎么把它用好,一层一层推一直到模型的服务系统里去,从上到下怎样做有效调度?我们和华为一起进行了各种尝试。”西安交通大学张兴军教授从体系结构角度解读说,Hi Scheduler的创新之处在于,它通过控制命令缓冲区实现时间隔离,直接面向底层命令缓冲区进行调度与控制,有效屏蔽了API层的差异性,在可移植性与长期兼容性方面展现出显著优势。

生态共建:推动AI平民化加快实现

不止于技术突破,Flex:ai的价值更在于其开创的开源模式与生态定位。在Run:ai被英伟达收购并逐步封闭的背景下,华为选择了一条截然不同的道路——开源开放,共建生态。

“如果AI只能在拥有万张卡的企业中运行,这个泡沫终将破灭。”周跃峰在分享中多次强调了“AI平民化”愿景,希望让中小企业甚至家庭用户也能以更低的成本享受到AI技术带来的便利与高效,而要实现这个愿景就必须调动起“产学研用”各方的力量。


“AI行业化落地是一件很难的事情,光靠华为公司的软件工程师的力量是远远难以完成的。”他坦言,“我们更多的是希望能够把这些软件开源开放之后,有很多伙伴、有很多打造解决方案的公司或者集成商,他们能够更加灵活地使用它。”

华为先前已经向外界开源开放了DCS AI全流程工具链与UCM推理记忆数据管理器,Flex:ai亦是沿着这一思路发展。有所不同的是,Flex:ai从一开始就是由华为与三家高校“共创”。而从更宏观的角度,Flex:ai的开源开放也为国内的AI产业提供了另一种选择,降低了被卡脖子的风险。

华为技术专家亦谈到,Flex:ai已向开源社区开源开放了智能调度和算力虚拟化模块,将提供标准化的通用API接口,希望后续有更多的开发者一起参与进来,共同推进算法调度处理、异构算力兼容等工作。这不仅有助于提升我国在全球AI产业中的竞争力,也将为全球AI产业的高质量发展注入强劲动能。

Flex:ai的出现,标志着AI基础设施从“拼规模”进入到“拼效率”的新阶段。通过三大核心技术的突破,它破解了算力资源利用的难题、降低了AI应用的门槛,让AI真正从“炫技”走向“赋能”、从“情绪价值”走向“生产力价值”。而随着技术的持续演进与生态的不断完善,Flex:ai这样的容器技术,或许比任何一个万亿参数的模型都更加值得期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
耿同学的学术打假,正在破坏科研生态

耿同学的学术打假,正在破坏科研生态

户外阿毽
2026-05-08 14:51:32
女子潜水遇成千上万海狼群,网友:被袭击10秒不到就剩骨架!

女子潜水遇成千上万海狼群,网友:被袭击10秒不到就剩骨架!

狸猫之一的动物圈
2026-05-10 10:17:09
80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

妍妍教育日记
2026-04-27 09:20:13
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
伊朗12枚导弹齐射,阿联酋主动挑衅,以军秘密参战,海峡战火升级

伊朗12枚导弹齐射,阿联酋主动挑衅,以军秘密参战,海峡战火升级

聊历史的阿稼
2026-05-09 21:23:44
双冠!男乒横扫日本队,梁靖崑大逆转,王楚钦神勇发挥

双冠!男乒横扫日本队,梁靖崑大逆转,王楚钦神勇发挥

史海流年号
2026-05-11 02:44:12
3-2逆转张本智和!国乒29岁王牌连创神迹:霸气庆祝变王楚钦绝配

3-2逆转张本智和!国乒29岁王牌连创神迹:霸气庆祝变王楚钦绝配

李喜林篮球绝杀
2026-05-11 00:43:20
美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

来科点谱
2026-02-20 07:16:30
湖南益阳一钓鱼者钓到女尸:死者身份披露,事发全过程还原

湖南益阳一钓鱼者钓到女尸:死者身份披露,事发全过程还原

老猫观点
2026-05-10 16:37:13
卖掉无锡滨湖公寓,举家搬迁江苏盐城,定居一年,看透苏北小城生活的真实难处

卖掉无锡滨湖公寓,举家搬迁江苏盐城,定居一年,看透苏北小城生活的真实难处

石辰搞笑日常
2026-05-10 20:41:35
马琳抱着曼昱哭成泪人,孙颖莎含泪:国乒这场胜利为何如此滚烫?

马琳抱着曼昱哭成泪人,孙颖莎含泪:国乒这场胜利为何如此滚烫?

孙譁北漂拍客
2026-05-11 02:40:55
山东将出现一次强对流天气过程

山东将出现一次强对流天气过程

北青网-北京青年报
2026-05-10 16:34:03
调查发现:经常吃苹果的人,不出半年时间,身体会出现这几个变化

调查发现:经常吃苹果的人,不出半年时间,身体会出现这几个变化

摇感军事
2026-05-09 20:58:21
阿森纳最后两轮对阵伯恩利和水晶宫,赛程难度远低于曼城

阿森纳最后两轮对阵伯恩利和水晶宫,赛程难度远低于曼城

懂球帝
2026-05-11 02:16:23
王皓含泪唱国歌!世乒赛扭转风评,成头号赢家,王励勤秦志戬减压

王皓含泪唱国歌!世乒赛扭转风评,成头号赢家,王励勤秦志戬减压

曦言说
2026-05-11 02:27:36
摩根:我的心跳停了5分钟;太难熬了,不过离冠军只差两场了

摩根:我的心跳停了5分钟;太难熬了,不过离冠军只差两场了

懂球帝
2026-05-11 02:37:14
15.98万,真的疯了

15.98万,真的疯了

放毒
2026-05-09 18:53:10
新帅徐正源搞砸了:升班马主场沦陷,耻辱6连败,姆本扎补时进球

新帅徐正源搞砸了:升班马主场沦陷,耻辱6连败,姆本扎补时进球

足球狗说
2026-05-10 20:54:29
特罗萨德:西汉姆那球刚进完,拉亚就说了“这球绝对不算”

特罗萨德:西汉姆那球刚进完,拉亚就说了“这球绝对不算”

懂球帝
2026-05-11 02:16:23
5.10重庆重大交通事故后续,女司机下车一脸惊恐,警方通报

5.10重庆重大交通事故后续,女司机下车一脸惊恐,警方通报

阿凫爱吐槽
2026-05-10 22:37:27
2026-05-11 04:08:49
C114 incentive-icons
C114
通信行业垂直门户网站
8656文章数 35038关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

旅游
手机
亲子
健康
军事航空

旅游要闻

北京“二绿地区”郊野公园焕新升级

手机要闻

OPPO Reno16系列参数全曝光,就差价格了

亲子要闻

从第一声呼唤开始,爱就有了名字

干细胞能让人“返老还童”吗

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版