网易首页 > 网易号 > 正文 申请入驻

佐治亚理工曝AI训练真相:CPU拖后腿让GPU空转

0
分享至


2026年3月,佐治亚理工学院(Georgia Institute of Technology)发布了一项让AI基础设施团队坐立不安的研究。他们追踪了多GPU大语言模型推理中的性能损耗,发现一个反常识结论:GPU利用率暴跌的元凶,往往不是显卡本身,而是被忽视的CPU

「GPU在等CPU发号施令」

研究团队Chung、Jia、Jezghani和Kim在论文《Characterizing CPU-Induced Slowdowns in Multi-GPU LLM Inference》中描述了一个典型场景:当CPU核心分配不足时,系统会出现内核启动延迟、通信停滞、分词(tokenization)耗时激增——GPU明明有空闲算力,却被迫原地待命。

这种「控制端瓶颈」的隐蔽性在于,它不会触发传统监控的警报。GPU占用率看起来正常,实际吞吐量却断崖式下跌。研究团队指出,「在有限CPU分配下,多GPU性能频繁退化,不是因为GPU饱和,而是因为CPU无法让GPU保持忙碌」。

更棘手的是,现代优化手段对此束手无策。即使采用进程级隔离和CUDA Graphs这类GPU侧优化技术,CPU瓶颈依然顽固存在。这就像给赛车换了顶级引擎,却发现方向盘反应迟钝——动力再强也发挥不出来。

1.36-5.40倍:一个数字背后的成本账


研究团队测试了多种配置下的首token延迟(TTFT)。结果呈现陡峭的对比曲线:CPU饥饿配置在中等负载下频繁超时,而增加CPU核心后,TTFT降低1.36-5.40倍,且无需额外GPU。

成本维度更值得玩味。云实例定价中,边际CPU核心的成本相对于GPU实例价格微乎其微。论文作者直言,「由于额外CPU核心的边际成本相对于GPU实例定价很小,我们的评估表明,增加CPU核心数量可以以极小的额外成本大幅提高性能和稳定性」。

这对正在扩建AI基础设施的企业有直接影响。当前行业普遍遵循「GPU优先」的采购逻辑,CPU往往按最低配套餐配置。佐治亚理工的数据暗示,这种策略可能让数百万美元的GPU投资陷入低效运转。

为什么这个问题现在才暴露

大模型推理的架构演进提供了部分解释。早期单卡推理时代,CPU与GPU的协作关系简单直接。进入多GPU并行阶段后,通信调度、批次管理、动态分词等控制逻辑复杂度指数级上升,CPU的负载被严重低估。

研究团队观察到三类典型症状:内核启动队列堆积、NCCL集合通信阻塞、Python GIL(全局解释器锁)引发的序列化瓶颈。这些问题在压力测试中才会显现,日常监控难以捕捉。


一个细节值得注意:论文提到「CPU配置是多GPU LLM推理配置中的关键因素,有助于防止控制端瓶颈」。这里的措辞经过斟酌——不是「可选优化」,而是「关键因素」。这意味着在特定负载下,CPU不足会直接决定服务是否可用。

对工程团队的实操启示

论文没有给出通用的CPU/GPU配比公式,这恰恰反映了问题的复杂性。不同模型架构(稠密vs稀疏)、不同服务策略(实时vs离线)、不同批处理策略对CPU压力差异显著。

但研究团队提供了明确的排查方向:当出现GPU利用率波动、TTFT长尾延迟、超时错误增长时,优先检查CPU核心数是否成为隐形天花板。在AWS p4d.24xlarge或同类8卡实例上,默认的96核vCPU配置可能并非最优解。

对于正在评估硬件采购的团队,论文数据支持一种反直觉策略:在GPU预算固定时,适度削减GPU数量以换取更高CPU配比,可能提升整体性价比。当然,这需要结合具体工作负载验证。

佐治亚理工团队将完整技术细节开源在arXiv:2603.22774。论文末尾的发表时间是2026年3月,这意味着相关发现尚处于传播早期——你的推理集群是否已经在为CPU买单?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重庆一女子长得很漂亮,天天在市场卖鱼,网友:人美,鱼也鲜美

重庆一女子长得很漂亮,天天在市场卖鱼,网友:人美,鱼也鲜美

朗威谈星座
2026-05-05 20:25:43
广汽传祺越7亮相:换标换脸,就能逆天改命?

广汽传祺越7亮相:换标换脸,就能逆天改命?

车动态
2026-05-05 18:16:03
英媒:欧美要死死守住这5项技术,一旦被中国突破或将难以抵挡

英媒:欧美要死死守住这5项技术,一旦被中国突破或将难以抵挡

触摸史迹
2026-05-05 07:51:34
回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

素衣读史
2026-03-31 15:11:31
混到我这个地步,已经没什么救了~

混到我这个地步,已经没什么救了~

果粉之家
2026-03-27 14:56:34
男人只要不沉迷于色欲,就不会对女人精虫上脑,从而对女人祛魅

男人只要不沉迷于色欲,就不会对女人精虫上脑,从而对女人祛魅

加油丁小文
2026-04-18 13:30:08
龚正会见史蒂夫·戴安斯率领的美国参议员代表团

龚正会见史蒂夫·戴安斯率领的美国参议员代表团

澎湃新闻
2026-05-05 17:56:27
涉事男主播,永久除名

涉事男主播,永久除名

南方都市报
2026-05-05 16:16:32
哈文含泪道破李咏葬在美国原因:不是不爱国,而是三天内必须下葬

哈文含泪道破李咏葬在美国原因:不是不爱国,而是三天内必须下葬

悦君兮君不知
2026-04-22 01:54:22
纪委假期暗访加码!公职人员5条红线,碰了直接从严追责

纪委假期暗访加码!公职人员5条红线,碰了直接从严追责

解说阿洎
2026-05-03 21:05:23
政府200亿挽留失败,ASML光刻机巨头坚持迁离荷兰

政府200亿挽留失败,ASML光刻机巨头坚持迁离荷兰

璀璨明星
2026-05-04 01:00:04
“必须停止干涉内政”,巴林国王怒斥伊朗,让伊朗得了三个大教训

“必须停止干涉内政”,巴林国王怒斥伊朗,让伊朗得了三个大教训

无情有思ss
2026-05-05 19:47:33
热搜上“广州地铁最气愤一幕”流出:出门在外,不要低估人性的恶

热搜上“广州地铁最气愤一幕”流出:出门在外,不要低估人性的恶

凡知
2026-05-04 07:09:49
61岁大爷存52万养老,五一取钱发现只剩下3块2,查监控才知真相

61岁大爷存52万养老,五一取钱发现只剩下3块2,查监控才知真相

张道陵秘话
2025-05-06 22:36:06
大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

娱乐圈的笔娱君
2026-05-05 12:45:29
山东3孩2非亲生后续,当地人曝猛料,老实人被设局,一切早有预谋

山东3孩2非亲生后续,当地人曝猛料,老实人被设局,一切早有预谋

千言娱乐记
2026-05-04 16:31:52
福建财政收入9市大洗牌:厦门第1,漳州市仅第4,莆田市入围

福建财政收入9市大洗牌:厦门第1,漳州市仅第4,莆田市入围

次元君情感
2026-05-05 17:07:55
特朗普访华倒计时10天!74位美议员联名上书,阻止中国做这件事

特朗普访华倒计时10天!74位美议员联名上书,阻止中国做这件事

青烟小先生
2026-05-05 14:39:00
带模特老婆养鸡18年,满脸皱纹认不出,如今搭档谭松韵终于火了

带模特老婆养鸡18年,满脸皱纹认不出,如今搭档谭松韵终于火了

揽星河的笔记
2026-03-12 12:10:40
98年我在火车站蹬三轮,傍晚顺路送老人一程,结果竟然改变我一生

98年我在火车站蹬三轮,傍晚顺路送老人一程,结果竟然改变我一生

白云故事
2025-03-27 21:40:08
2026-05-05 21:07:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
2064文章数 34关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

健康
艺术
教育
手机
家居

干细胞治烧烫伤面临这些“瓶颈”

艺术要闻

有多少人知道,它曾是亚洲第一高楼?

教育要闻

“鸡娃”的要义,是“好好生活”

手机要闻

小米三大猛料:K100涨价、小折叠被砍、大折叠携玄戒O3年底回归

家居要闻

灵动实用 生活艺术场

无障碍浏览 进入关怀版