网易首页 > 网易号 > 正文 申请入驻

调整GPU时钟频率可将大语言模型训练能耗降低14%

0
分享至


OpenAI的第四代大语言模型GPT-4在训练过程中估计消耗了约50吉瓦时的电力,相当于5000户美国家庭一年的用电总量。这一数字来自2023年。此后,训练前沿大语言模型所需的计算资源只增不减,但具体的能耗数据却难以获取。

近日,荷兰特文特大学的一支研究团队证明,通过在计算过程中智能调整GPU的时钟频率,可以在不牺牲速度的前提下,将大语言模型训练所需的能耗降低多达14%。特文特大学博士候选人、该研究论文的第一作者Jeffrey Spaan上月在西西里岛卡塔尼亚举办的Computing Frontiers学术会议上发布了这一研究成果。

"我的研究方向是找出计算过程中的浪费现象,"Spaan表示,"这与硬件利用率不足的问题类似,但我们的思路不是优化软件以适配硬件,而是反过来优化硬件以适配软件。"

Spaan与合作者采用了一种名为动态电压频率调节(DVFS)的技术来实现这一目标。每块芯片(包括训练前沿模型常用的GPU)都至少使用一个时钟来协调计算操作,芯片中的每项运算都由时钟脉冲触发。时钟频率的高低决定了芯片的运行速度和功耗水平。

现代GPU拥有两个时钟,一个负责计算核心,另一个负责内存。当计算核心全力进行数值运算时,时钟频率会保持在较高水平以确保计算速度;而此时借助DVFS技术,内存时钟频率可以降低,从而减少功耗。从原理上看,直接关闭芯片的内存部分也是可行的,但GPU的设计并不支持通过软件控制这一开关,而且在运算中途重新开启也会耗费过多时间。同理,当计算核心等待从内存加载数据时,计算核心的时钟频率可以大幅降低,同时提升内存时钟频率。

DVFS技术早在20世纪90年代便已广为人知,但Spaan指出,此前的研究者未能将其有效应用于大语言模型训练,原因在于他们的方法要么导致计算速度大幅下降,要么粒度不够精细,无法取得显著的节能效果。

以往的DVFS尝试是在每轮训练迭代时调整频率。大语言模型的训练迭代由两部分组成:前向传播(数据按照当前权重在模型各层中正向流动)和反向传播(根据前向传播的结果逐层调整权重)。因此,过去的方法通常对前向传播和反向传播分别采用不同的固定频率值。

Spaan及其团队则将时钟频率的调整粒度进一步细化。GPU的工作任务被拆解为大量细小的计算单元,称为"内核(kernel)"。例如,一次向量乘法运算就可以构成一个内核,这些内核由GPU并行处理。在Spaan的方案中,深度神经网络单层的计算任务被拆分为约40个内核,通过在内核级别逐一调整时钟频率,团队得以挖掘出远超以往的节能潜力。

Spaan还指出,GPU本身也会在芯片内部系统检测到负载高低变化时自动执行DVFS。"有些人可能因此认为,直接让GPU自己处理就好,"他说,"但由于GPU无法预判接下来要运行哪些内核,只能进行实时的最优猜测,因此永远无法达到手动调节所能实现的节能效果。"这正是人工介入调整的价值所在。

研究团队以Nvidia RTX 3080 Ti GPU为实验平台,对拥有13亿参数的GPT-3-XL模型进行了训练实验。为节省时间,他们将研究重点集中在单层模型的训练上。在此条件下,他们找到了一套频率调节方案,可在训练时间仅延长0.6%的情况下实现14%的节能效果。模型的整体性能同时取决于计算速度和能耗水平。

不过,这一方法也面临一个现实挑战:降低时钟频率虽然比关闭/开启核心快得多,但仍非即时完成。在实验中,研究人员逐一对每个内核进行评估,并未将频率切换所需的时间纳入考量,因此14%的节能率属于理想情况下的最优结果。Spaan表示,这在实际应用中的影响程度因GPU型号而异。例如,基于Blackwell架构的新一代GPU拥有比旧型号快得多的频率切换速度,理论上能够充分释放该方法的节能潜力。

目前,研究团队正在开发一款工具,能够针对特定工作负载自动实现最优的频率调节方案。Spaan希望这一方法能够引起业界的足够关注并推动落地应用。"我们的目标是在不损失性能的前提下实现节能,"Spaan说,"在现实世界中,性能始终是最高优先级。"

Q&A

Q1:动态电压频率调节(DVFS)技术是什么原理?它为什么能节省大语言模型训练的能耗?

A:DVFS是一种通过动态调整芯片时钟频率和电压来控制功耗的技术。GPU拥有计算核心和内存两个时钟,当计算核心繁忙时可降低内存时钟频率减少功耗,当内存加载数据时可降低核心时钟频率。特文特大学的研究团队将调节粒度细化到单个内核级别,相比以往针对整个训练迭代调节的方案,能挖掘出更大的节能空间,最终实现了14%的节能效果。

Q2:这项研究的节能效果是在什么实验条件下取得的?是否适用于所有GPU?

A:研究团队在Nvidia RTX 3080 Ti GPU上,针对GPT-3-XL(13亿参数)模型的单层训练进行了实验,实现了训练时间仅延长0.6%、能耗降低14%的效果。但14%属于理想情况下的最优结果,因为实验未将频率切换时间纳入考量。实际节能效果因GPU型号而异,频率切换速度更快的新型GPU(如基于Blackwell架构的产品)更能充分发挥该方法的节能潜力。

Q3:GPU自身的自动DVFS与研究团队提出的手动调节方案有什么区别?

A:GPU内部系统可以根据负载变化自动执行DVFS,但由于GPU无法提前预知接下来要执行的内核类型,只能进行实时的"最优猜测",因此节能效果有限。而研究团队的方案能够在任务执行前预判每个内核的计算与内存需求特征,从而提前做出精准的频率调节决策,节能效果远超GPU的自动调节机制。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台当局真狠:大陆军舰直逼日本,台高层立马放话,真的豁出去了!

台当局真狠:大陆军舰直逼日本,台高层立马放话,真的豁出去了!

介知
2026-07-03 16:20:24
孙颖莎也没想到,国乒男单全军覆没没多久,樊振东传来特大喜讯

孙颖莎也没想到,国乒男单全军覆没没多久,樊振东传来特大喜讯

生活新鲜市
2026-07-04 19:28:00
14.1亿人里到底多少人在负债过日子?数据被揭开 结果比想象更扎心

14.1亿人里到底多少人在负债过日子?数据被揭开 结果比想象更扎心

牛锅巴小钒
2026-06-29 17:38:24
韩红百人援蒙义诊排场引热议!列队迎送网友调侃:只差一辆检阅车

韩红百人援蒙义诊排场引热议!列队迎送网友调侃:只差一辆检阅车

老猫观点
2026-07-04 15:35:44
大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

好贤观史记
2026-07-03 14:16:05
普京这步棋走得太精了,派梅德韦杰夫去伊朗,美国才反应过来晚了

普京这步棋走得太精了,派梅德韦杰夫去伊朗,美国才反应过来晚了

奇思妙想生活家
2026-07-04 13:04:56
舆论越大越反抗?20多位明星集体帮韩红站台,这是和网友打擂台?

舆论越大越反抗?20多位明星集体帮韩红站台,这是和网友打擂台?

眼光很亮
2026-07-02 10:44:56
注意,注意!有色金属的春天真的要来了!

注意,注意!有色金属的春天真的要来了!

趣味萌宠的日常
2026-07-04 20:30:23
王金平提统一:外交和军队归大陆!有两处关键硬伤

王金平提统一:外交和军队归大陆!有两处关键硬伤

健身狂人
2026-07-04 20:27:23
大V怒批留学生!建议校领导各领一个留学生回家,评论区一片支持

大V怒批留学生!建议校领导各领一个留学生回家,评论区一片支持

谭谈社会
2026-07-04 11:26:09
保险卖不动了,700万人集体离场。

保险卖不动了,700万人集体离场。

流苏晚晴
2026-07-04 18:54:07
伊朗葬礼暗藏杀机,中方出席不止吊唁,还能镇住美以斩首阴谋?

伊朗葬礼暗藏杀机,中方出席不止吊唁,还能镇住美以斩首阴谋?

健身狂人
2026-07-04 12:05:28
黄瓜再次成为关注对象!提醒:中老年吃黄瓜时,要多留意这几点!

黄瓜再次成为关注对象!提醒:中老年吃黄瓜时,要多留意这几点!

芹姐说生活
2026-07-04 15:31:18
我国首架,首飞成功!

我国首架,首飞成功!

环球网资讯
2026-07-04 15:50:17
人过80岁,哪怕身体再健康,也要记住这四句话,晚年远离病痛

人过80岁,哪怕身体再健康,也要记住这四句话,晚年远离病痛

观星赏月
2026-07-03 12:03:48
57岁大姐直言:只要满足我4个要求,我的二婚老伴可以没房没存款

57岁大姐直言:只要满足我4个要求,我的二婚老伴可以没房没存款

惟来
2026-07-01 11:11:49
饮料含甜蜜素被美国“预警进口”!娃哈哈:经销商私自出口

饮料含甜蜜素被美国“预警进口”!娃哈哈:经销商私自出口

南方都市报
2026-07-03 17:22:32
记者:厄瓜多尔球员遭墨西哥贩毒集团威胁,5名球员被联系

记者:厄瓜多尔球员遭墨西哥贩毒集团威胁,5名球员被联系

懂球帝
2026-07-03 19:03:23
男篮大早启程韩国!全队情绪低沉,杨瀚森王俊杰严肃,压力山大了

男篮大早启程韩国!全队情绪低沉,杨瀚森王俊杰严肃,压力山大了

篮球资讯达人
2026-07-04 09:59:34
开启烧烤模式!四川发布高温蓝色预警 成都等9市最高可达40°C

开启烧烤模式!四川发布高温蓝色预警 成都等9市最高可达40°C

封面新闻
2026-07-04 17:09:12
2026-07-04 22:08:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19861文章数 49713关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

13年前收礼被偷拍的县长被查 偷拍他的父子此前被判刑

头条要闻

13年前收礼被偷拍的县长被查 偷拍他的父子此前被判刑

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

家居
旅游
教育
公开课
军事航空

家居要闻

传奇筑 日常诗

旅游要闻

暑期旅游旺季开启 青岛凭借“避暑+海滨+美食”的多元体验进入AI交互最热门目的地城市前三名

教育要闻

弥勒老师学生课堂喊麦“暑期安全”!#暑期安全 #弥勒融媒

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版