网易首页 > 网易号 > 正文 申请入驻

xAI坐拥55万张GPU加速卡,但算力利用率仅11%

0
分享至


全球AI竞赛的早已从“谁能抢到更多GPU”悄然转向“谁能把GPU真正用起来”。然而,坐拥约55万块英伟达GPU,实际利用率仅有11%,这一“打脸”般的数字,正将埃隆·马斯克(Elon Musk)旗下的人工智能公司xAI推上风口浪尖。

据外媒《The Information》获取的xAI内部备忘录显示,xAI公司总裁迈克尔·尼科尔斯(Michael Nicolls)向团队坦承,公司目前的模型浮点运算利用率(MFU)约为11%。这个数字意味着,理论上能输出100份训练算力的硬件,实际仅产出了11份。

xAI目前拥有约55万颗NVIDIA GPU,其中包括H100和H200系列。尽管这些GPU比最新的Blackwell产品落后了一个世代,但xAI部署的GPU规模之大令市场印象深刻。

对于这一现状,Michael Nicolls在内部备忘录中给出了直白的评价:“低得尴尬”。他已为团队设定了在未来几个月内将利用率拉升至50% 的目标。

“11%”这个数字,并非指89%的GPU在完全闲置,而是衡量有效训练吞吐占硬件理论峰值算力比例的严苛指标。

从行业基准来看,生产级大模型训练的MFU通常落在35%至45%之间。Meta和谷歌凭借深厚的软件堆栈积累,其GPU利用率分别可达约43%和46%。即便以“低效”著称的GPT-3训练时期,MFU也在21%-26%之间。相比之下,xAI的11%不仅远低于当前主流水平,甚至低于AI算力发展史上的“古早”尴尬时期。

坐拥算力“金山”却难有用武之地,症结出在哪里?答案指向软件堆栈与并行策略的滞后。

xAI在业内以“完全按照英伟达推荐方式部署GPU”的模范生做法著称。模范生却跑出低分,说明问题不在标准的硬件或网络拓扑层面。根源在于,训练栈、并行策略和模型工程等软件优化速度,远跟不上其激进的硬件扩张步伐。

业界广泛讨论的“存储墙”现象成为主要瓶颈——HBM显存读取速度远慢于计算芯片,导致芯片大量时间空转等待数据;网络拓扑中的任何一处瓶颈,在数万张卡的同步要求下,都会被急剧放大。此外,Lambda等机构的分析指出,显存压力、过度的激活重计算和张量并行带来的跨GPU通信开销等,都是拖累MFU的系统性因素。

xAI的算力基础设施建设速度本身就是一个“神话”:其孟菲斯Colossus超算集群从动工到投入运营仅用了122天,从10万张GPU扩展到20万张仅用了92天。黄仁勋曾评价此类工程“通常需要四年”。


△xAI孟菲斯Colossus超算集群

然而,惊人的速度似乎也让xAI“欠下”了技术债。扩张越快,支撑大规模并行训练的软件系统复杂度就越大。当企业试图将GPU规模从数千张推向数十万张时,通信、调度、容错和并行策略的挑战会呈指数级增长。xAI的11%的算力利用率,正是这一矛盾的集中体现。

把问题完全归咎于xAI一家也并不公平。《The Information》的报道援引一位匿名研究员的话称:“跑过40%对xAI的大多数竞争对手来说也很难”。这表明,超大规模集群下的低效问题,是笼罩整个AI行业的阴影。

报道还揭示了一个行业内部的扭曲现象:由于担心GPU被调走或承受压力,一些研究员甚至通过反复重跑训练来人为“美化”自家MFU数据。囤而不用的算力浪费,成为行业心照不宣的秘密。

面对效率困局,xAI正多措并举。一方面,公司计划通过基础设施和软件栈优化来解决利用率问题。另一方面,据媒体报道,xAI已开始将部分闲置算力对外出租,AI编程创业公司Cursor已计划使用其“数万张GPU”来训练新模型。

AI算力之争已过“装备竞赛”阶段,正式进入“效率竞赛”的深水区。11%的低利用率如同一面镜子,照出AI行业下半场的核心命题:如何将“买得到”的硬件,转化为真正“用得好”的竞争壁垒。

编辑:芯智讯-浪客剑

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

魔都姐姐杂谈
2026-05-13 22:44:16
央视拒买转播权只是表面,这3个问题才是关键!难怪降价也不买账

央视拒买转播权只是表面,这3个问题才是关键!难怪降价也不买账

以茶带书
2026-05-14 23:14:19
突发重磅!美国放行H200!明天科技牛回归!

突发重磅!美国放行H200!明天科技牛回归!

老A情报圈
2026-05-15 00:45:38
Skip谈詹姆斯留湖人队可能性:他们想把你赶走,只会给你老将底薪

Skip谈詹姆斯留湖人队可能性:他们想把你赶走,只会给你老将底薪

好火子
2026-05-15 05:14:57
关之琳为53岁弟弟庆生,姐弟罕同框长得很像,弟弟浓眉大眼的

关之琳为53岁弟弟庆生,姐弟罕同框长得很像,弟弟浓眉大眼的

阿废冷眼观察所
2026-05-15 01:16:51
骑士加时逆转3-2活塞:哈登30+8+6比肩詹姆斯 坎宁安39+7+9

骑士加时逆转3-2活塞:哈登30+8+6比肩詹姆斯 坎宁安39+7+9

醉卧浮生
2026-05-14 11:07:28
上海楼市爆了!

上海楼市爆了!

地产观点
2026-05-14 18:00:07
特朗普称中美关系将会更好

特朗普称中美关系将会更好

中国日报网
2026-05-14 20:19:47
65.3公里!北京将拥有世界首条“不断线绚丽花环”!

65.3公里!北京将拥有世界首条“不断线绚丽花环”!

家住朝阳
2026-05-14 19:10:23
一代人觉醒,三代人托举:这篇文章,建议每个普通家庭都读两遍

一代人觉醒,三代人托举:这篇文章,建议每个普通家庭都读两遍

心理观察局
2026-05-12 08:55:11
哎,上海人在公共场合豪横地用上海话聊天,似乎已经成了一种常态

哎,上海人在公共场合豪横地用上海话聊天,似乎已经成了一种常态

上海云河
2026-05-13 19:55:38
奇葩!女摊主吵架当众脱内裤,套在另一男摊主头上,摊主都晕倒了

奇葩!女摊主吵架当众脱内裤,套在另一男摊主头上,摊主都晕倒了

汉史趣闻
2026-05-14 17:38:49
创历史,特奥成法国队史首位入选世界杯名单的非欧洲联赛球员

创历史,特奥成法国队史首位入选世界杯名单的非欧洲联赛球员

懂球帝
2026-05-15 06:15:04
特朗普访华,为什么明明有钓鱼台国宾馆不住,非要住四季酒店?

特朗普访华,为什么明明有钓鱼台国宾馆不住,非要住四季酒店?

可爱小菜
2026-05-14 23:37:25
长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

揽星河的笔记
2026-05-13 13:26:24
金曲奖来了,看完提名名单,我要说:华语乐坛完了!

金曲奖来了,看完提名名单,我要说:华语乐坛完了!

八卦南风
2026-05-13 18:27:59
哈登拿下天王山后,NBA夺冠概率更新!骑士3.6%升第4马刺屈居第3

哈登拿下天王山后,NBA夺冠概率更新!骑士3.6%升第4马刺屈居第3

锅子篮球
2026-05-14 16:20:23
史密斯爆料:湖人高层"不喜欢"詹姆斯,矛盾源于威斯布鲁克交易

史密斯爆料:湖人高层"不喜欢"詹姆斯,矛盾源于威斯布鲁克交易

林间小温柔
2026-05-15 01:42:36
广东一网红粥店被曝用扫把洗锅,同一把扫把还洗墙、扫地,食客:那口锅刚炒完我们的粉!

广东一网红粥店被曝用扫把洗锅,同一把扫把还洗墙、扫地,食客:那口锅刚炒完我们的粉!

深圳晚报
2026-05-14 22:54:15
对象当初是这么把我骗到手的,网友:评论区个个都是高手啊

对象当初是这么把我骗到手的,网友:评论区个个都是高手啊

夜深爱杂谈
2026-05-13 07:37:46
2026-05-15 07:51:00
芯智讯 incentive-icons
芯智讯
聚焦科技万象,报道前沿资讯。
8678文章数 32114关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

媒体:中美外交盛事成"圈粉"现场 特朗普直呼"惊艳"

头条要闻

媒体:中美外交盛事成"圈粉"现场 特朗普直呼"惊艳"

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

房产
时尚
旅游
健康
军事航空

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

白色上衣+彩色下装:今年夏天最火搭配,时髦又减龄!

旅游要闻

沪客重返金门,岛内呼吁恢复两岸旅游

专家揭秘干细胞回输的安全风险

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版