网易首页 > 网易号 > 正文 申请入驻

佐治亚理工团队发现:GPU集群里藏了1个"隐形杀手"

0
分享至


2026年3月,一份来自佐治亚理工学院的论文在arXiv悄然上线。研究团队花了数月时间追踪多GPU大模型推理的卡顿源头,最后锁定了一个令人意外的答案——不是GPU不够强,是CPU在拖后腿。

这个发现有点反直觉。毕竟过去两年,行业把所有火力都砸向GPU:H100抢不到就抢H200,显存不够就上量化压缩,推理框架迭代了一轮又一轮。但佐治亚理工的测量数据显示,大量生产环境的GPU利用率根本没跑满,问题出在CPU侧的控制面

CPU starvation:GPU空转的元凶

研究团队把这种现象命名为"CPU starvation"(CPU饥饿)。具体症状有三类:内核启动延迟、通信管道堵塞、分词(tokenization)耗时暴涨。这些控制面任务本该由CPU快速调度完成,一旦CPU核心数配少了,GPU就得干等着。

论文给出的数字相当刺眼。在中等负载的在线服务场景下,CPU配置不足的系统频繁触发超时;而补足CPU资源后,首token延迟(TTFT)直接下降1.36到5.40倍——最高5倍多的提升,零额外GPU成本

更麻烦的是,这个问题藏得很深。即使采用了进程级隔离、CUDA Graphs等现代GPU优化手段,CPU瓶颈依然会冒出来。换句话说,你在GPU侧堆的优化,可能被CPU侧的短板一键清零。

为什么没人早发现?

一个合理的疑问是:CPU核心才多少钱,GPU实例多少钱?为什么厂商不直接多配点CPU?

论文作者之一的Hyesoon Kim团队在测量中发现了认知盲区。云厂商的GPU实例模板往往沿用"够用就行"的CPU配比,而用户侧的性能监控又集中在GPU利用率指标上。CPU侧的调度延迟、内核队列堆积,在常规监控面板里几乎不可见。

这就形成了一个诡异局面:GPU利用率显示80%,你以为是模型算力吃满了;实际上可能是CPU来不及喂数据,GPU在空转。用户感受到的卡顿、超时、TTFT抖动,根源在CPU,但排查路径会把你引向量化策略、批大小(batch size)、甚至网络带宽——全是弯路。

研究团队用了一个精妙的类比:多GPU系统像一条流水线,GPU是重型机械臂,CPU是传送带和控制中枢。机械臂再快,传送带卡壳或者指令下发延迟,整条线就得降速。

成本账怎么算?

论文的财务测算部分可能会让很多工程师坐不住。

以当前云厂商的定价结构,增加CPU核心的边际成本相对于GPU实例价格可以忽略不计。但CPU不足导致的性能损失却是实打实的:超时重试、用户体验下降、甚至被迫扩容GPU集群——花大钱办小事,还是花小钱办大事,这道选择题的答案相当明确

研究团队没有给出具体的"黄金配比"数字,因为不同模型架构、序列长度、批处理策略对CPU的压力差异很大。但他们提供了系统性的分析框架:从内核启动延迟、通信停滞时长、分词耗时三个维度建立监控,定位CPU瓶颈的真实位置。

这篇论文的发布时间也值得玩味。2026年3月,正值多模态大模型和Agent系统爆发的前夜,推理负载的复杂度和并发规模都在指数级上升。CPU控制面的压力只会更大,而不是更小。

佐治亚理工团队把论文开源在arXiv:2603.22774,标题直截了当:《Characterizing CPU-Induced Slowdowns in Multi-GPU LLM Inference》。没有造新词,没有包装概念,就是老老实实把测量过程、瓶颈定位、优化收益摊开给你看。

一位参与论文评审的工程师在社交媒体评论:「我们上周刚花三倍预算扩容GPU集群,看完这篇想回去检查一下CPU配置了。」

你的生产环境监控面板里,CPU调度延迟这个指标,现在能直接看到吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张本美和夺冠,三十多年前何智丽的回旋镖打回中国乒乓球队

张本美和夺冠,三十多年前何智丽的回旋镖打回中国乒乓球队

罗纳尔说个球
2026-03-17 21:33:29
留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

触摸史迹
2026-04-02 14:39:03
万科前董事长郁亮曾两次拒绝王石

万科前董事长郁亮曾两次拒绝王石

地产微资讯
2026-03-04 08:40:10
北京挖出大太监李莲英之墓,开棺后,考古人员被吓得浑身发抖

北京挖出大太监李莲英之墓,开棺后,考古人员被吓得浑身发抖

历史人文2
2026-04-05 11:30:03
以色列弹尽粮绝,伊朗痛打“落水狗”,突然齐射100枚重型导弹

以色列弹尽粮绝,伊朗痛打“落水狗”,突然齐射100枚重型导弹

音乐时光的娱乐
2026-04-06 11:42:26
突然拉升!美联储、鲍威尔,突发!降息,大消息!

突然拉升!美联储、鲍威尔,突发!降息,大消息!

证券时报e公司
2026-04-04 22:12:45
哈兰德戴帽后拿走比赛用球,队友球上留言:干得好,你这该死的怪胎

哈兰德戴帽后拿走比赛用球,队友球上留言:干得好,你这该死的怪胎

懂球帝
2026-04-06 11:22:10
每体:巴萨决心欧冠首回合锁定胜局,因到了马竞主场变数太大

每体:巴萨决心欧冠首回合锁定胜局,因到了马竞主场变数太大

懂球帝
2026-04-06 10:49:10
田曦薇从小就是班花级别,这美貌不要太出众!

田曦薇从小就是班花级别,这美貌不要太出众!

动物奇奇怪怪
2026-04-05 17:08:34
“只剩咱俩了,你也100了,都不容易”!查尔斯国王看望百岁保姆

“只剩咱俩了,你也100了,都不容易”!查尔斯国王看望百岁保姆

书酱瞄瞄
2026-03-20 15:37:53
42岁王皓偷偷抹眼泪!决胜局咆哮鼓励王楚钦:放手一搏,释放出来

42岁王皓偷偷抹眼泪!决胜局咆哮鼓励王楚钦:放手一搏,释放出来

风过乡
2026-04-06 11:19:33
特朗普入院,48小时通牒成笑柄反噬美国

特朗普入院,48小时通牒成笑柄反噬美国

未来展望
2026-04-06 12:35:07
蹊跷!上海一小区地下车库突然出现10多辆破旧“僵尸车”……意欲何为?

蹊跷!上海一小区地下车库突然出现10多辆破旧“僵尸车”……意欲何为?

环球网资讯
2026-04-06 09:22:16
轰38+6+6!请把球给哈登,米切尔赛后明牌了,他还透露骑士战术

轰38+6+6!请把球给哈登,米切尔赛后明牌了,他还透露骑士战术

巴叔GO聊体育
2026-04-06 11:42:14
仰天大笑+吐舌庆祝!18岁日乒王牌被赞真天才 日媒:成队史第二人

仰天大笑+吐舌庆祝!18岁日乒王牌被赞真天才 日媒:成队史第二人

颜小白的篮球梦
2026-04-05 14:35:02
一觉醒来,特朗普躺进医院?48小时最后通牒,沦为国际大笑话

一觉醒来,特朗普躺进医院?48小时最后通牒,沦为国际大笑话

刘森森
2026-04-06 10:21:08
朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

共工之锚
2026-04-05 00:18:42
蒋介石咽气后宋美龄想独揽大权,蒋经国一句话宋美龄连夜逃往美国

蒋介石咽气后宋美龄想独揽大权,蒋经国一句话宋美龄连夜逃往美国

纪实文录
2025-05-15 16:21:00
法国冠军车手锐评张雪机车夺冠,7字一针见血,直戳中国人心窝里

法国冠军车手锐评张雪机车夺冠,7字一针见血,直戳中国人心窝里

兴史兴谈
2026-04-06 11:21:37
上海年近八旬老夫妻被撞!全身多处骨折,还是全责!又是这种车,83岁邻居也因此受伤

上海年近八旬老夫妻被撞!全身多处骨折,还是全责!又是这种车,83岁邻居也因此受伤

新民晚报
2026-04-05 16:42:09
2026-04-06 13:16:49
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
823文章数 11关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

美以被指欲借库尔德人攻入伊朗 库区官员:绝不会介入

头条要闻

美以被指欲借库尔德人攻入伊朗 库区官员:绝不会介入

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

118吨!这家央行,大幅抛售黄金!

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

家居
游戏
旅游
教育
公开课

家居要闻

温馨多元 爱的具象化

米哈游新作要来了?官号定位现身美国 玩家集体催更

旅游要闻

清明假期重庆欢乐谷簪花巡游火热出圈

教育要闻

单位邀请函 | 2026上海高校“春季促就业攻坚行动”暨艺术人才专场招聘会

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版