网易首页 > 网易号 > 正文 申请入驻

用BT下载的方式在家跑千亿大模型,推理/微调速度10倍提升

0
分享至

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

在家用消费级GPU就能跑1760亿参数大模型,推理微调都很快。

还是用BT下载的方式实现。

这事儿可把AI爱好者们新鲜坏了。

这不,这个名为PETALS的项目刚开源没多久,GitHub标星数就达到了1.3k。

老司机们都知道,BT下载这玩意儿,下载同一个文件的人越多,这个文件的下载速度就越快,因为每个下载用户都会成为一个“资源节点”,互通有无。

PETALS道理差不多,就是把大家伙的GPU都利用起来,协同推理/微调同一个大模型。

用上它,你的GPU实际上只需要加载大模型的一小部分,就能把模型跑起来,速度还嘎嘎快:

推理速度能达到1秒/token,比offloading的方式快10倍。

offloading是通过提高GPU利用率,加速模型训练的一种方法,

什么是PETALS

具体来说,PETALS来自BigScience这个科研合作项目。此前人人皆可用的1760亿参数开源大模型BLOOM也来自于该项目。

至于PETALS具体是怎么个用法,先来看看下面这个例子:

张三想基于BLOOM搞个懂法语的语言大模型,而李四则想微调BLOOM让它学会C++编程。

尽管任务不同,但两者涉及的一些步骤却是共同的。

此时包括张三李四在内的PETALS用户们,自个儿的GPU里已分别加载好了模型的一部分(子集)。

于是,张三和李四就可以通过网络寻求其他用户的帮助,利用别人已经拥有的模型子集,在最短时间内对BLOOM进行微调。同时,他们GPU上的模型资源也会被其他用户利用。

实际的操作过程中,PETALS的每个参与者,都会通过本地设备运行一个服务器/客户端,或者两者兼具。

服务器包含模型层子集,通常是Transformer块。同时,服务器会处理来自客户端的请求。

客户端则会形成以流水线形式并行的一连串服务器,来运行整个模型的推理/微调。

值得一提的是,微调后的子模型可以在模型中心共享,继续提供给其他人使用。

此外,为了提高分布式推理的性能,开发人员们还采取了以下策略:

  • 动态量化,使每个GPU存储更多参数,减少连续设备和通信回合的数量;
  • 优先考虑低延迟连接,即每个客户端优先考虑距离近的服务器;
  • 服务器之间的负载均衡。

在这些优化措施的基础之上,研究人员证明,千亿参数级别的模型可以基于PETALS有效运行。

对了,如果你感兴趣,还可以直接在官方提供的Colab链接上试玩一下,地址文末奉上~

关于BigScience

前文说到,PETALS是BigScience项目的一部分。

BigScience是一个开放科学合作计划,旨在打破科技巨头对AI资源的垄断。

此前,在HuggingFace、法国国家大型计算中心等机构的牵头之下,BigScience汇聚来自60个国家和250多个机构的1000多名研究人员,一起搞出了“人人可用”、从代码到数据集通通开源的BLOOM语言大模型。

BLOOM有1760亿参数,支持59种语言,是目前最大的多语种开源语言模型。

目前,PETALS主要支持的就是BLOOM。不过开发人员表示,未来还将支持更多基础模型。

Colab地址:
https://colab.research.google.com/drive/1Ervk6HPNS6AYVr3xVdQnY5a-TjjmLCdQ?usp=sharing

参考链接:
[1]https://github.com/bigscience-workshop/petals
[2]https://news.ycombinator.com/item?id=34215665

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
活久见!发行价75元,上市后从106跌到了7分钱,惨不忍睹

活久见!发行价75元,上市后从106跌到了7分钱,惨不忍睹

惜别的海岸
2024-04-23 09:26:04
申城今天最高25℃,阳光明媚!明傍晚起又有雨水

申城今天最高25℃,阳光明媚!明傍晚起又有雨水

新民晚报
2024-04-24 07:32:11
亚洲杯太刺激了:韩国保送奥运会,越南进4强有戏,国奥第9创历史

亚洲杯太刺激了:韩国保送奥运会,越南进4强有戏,国奥第9创历史

侃球熊弟
2024-04-24 05:50:10
极星首款手机Polestar Phone发布 16GB+1TB售7388元

极星首款手机Polestar Phone发布 16GB+1TB售7388元

手机中国
2024-04-23 20:36:04
保时捷卡宴新车型开订!确认三季度交付,配置升级够诚意吗?

保时捷卡宴新车型开订!确认三季度交付,配置升级够诚意吗?

网上车市
2024-04-22 08:15:17
不会演别尬演!杨幂一出手,让观众看清吃戏有多离谱

不会演别尬演!杨幂一出手,让观众看清吃戏有多离谱

娱乐圈笔娱君
2024-04-23 14:16:52
苹果手机输入“发现石油”自动开启定位,真的自带监控?网友炸了

苹果手机输入“发现石油”自动开启定位,真的自带监控?网友炸了

奇奇怪怪的冒险
2024-04-24 06:46:28
哭麻了!东北雨姐手术病因曝光,老蒯哭成泪人,知情人曝更多内幕

哭麻了!东北雨姐手术病因曝光,老蒯哭成泪人,知情人曝更多内幕

鑫鑫说说
2024-04-22 15:21:45
布林肯访华,大陆用自己的方式跟台湾“打了个招呼”,吓住一批人

布林肯访华,大陆用自己的方式跟台湾“打了个招呼”,吓住一批人

千里持剑
2024-04-23 14:38:48
王婆在江西说媒:要求相亲两万五以上小姐姐回应来啦!评论区炸了!

王婆在江西说媒:要求相亲两万五以上小姐姐回应来啦!评论区炸了!

椰青美食分享
2024-04-24 04:46:08
养老金又有新消息

养老金又有新消息

财经早餐
2024-04-24 06:36:35
从朝鲜归来,有些大实话不得不讲!

从朝鲜归来,有些大实话不得不讲!

李砍柴
2024-04-21 23:53:00
有理数?被翻译带歪了,看完英文单词Ratio我才恍然大悟

有理数?被翻译带歪了,看完英文单词Ratio我才恍然大悟

CAD画家
2024-04-23 18:49:11
54年后才明白,当年苏联挖穿地球,为何挖到12262米就停了?

54年后才明白,当年苏联挖穿地球,为何挖到12262米就停了?

祥瑞
2024-04-22 11:43:27
“榜一大哥”的真面目:侵吞公款127万打赏女主播!其父亲手将他送到纪委

“榜一大哥”的真面目:侵吞公款127万打赏女主播!其父亲手将他送到纪委

红星新闻
2024-04-23 22:09:14
为啥美国不收割三哥?网友:一头千年的蛆醒来,全世界为之恶心。

为啥美国不收割三哥?网友:一头千年的蛆醒来,全世界为之恶心。

小鹿姐姐情感说
2024-04-24 01:51:32
狂轰16分+20板,首个2-0诞生!米切尔23+8,5年2.7亿真不贵

狂轰16分+20板,首个2-0诞生!米切尔23+8,5年2.7亿真不贵

一才说个球
2024-04-23 12:08:55
哈尔滨海关查获管制刀具2把,长度均为50厘米

哈尔滨海关查获管制刀具2把,长度均为50厘米

北青网-北京青年报
2024-04-23 20:21:04
“小团团”掉粉近50万或面临3至5年刑期,斗鱼多名头部主播成“消失的她”

“小团团”掉粉近50万或面临3至5年刑期,斗鱼多名头部主播成“消失的她”

上游新闻
2024-04-23 12:33:15
考生声称体育测试被压表?山东省教育招生考试院通报

考生声称体育测试被压表?山东省教育招生考试院通报

新京报
2024-04-24 08:34:08
2024-04-24 09:20:49
量子位
量子位
追踪人工智能动态
9313文章数 175240关注度
往期回顾 全部

科技要闻

特斯拉财报差劲 但马斯克做出一个重磅表态

头条要闻

长沙警方通报14岁女生被同学殴打:将嫌疑人传唤到案

头条要闻

长沙警方通报14岁女生被同学殴打:将嫌疑人传唤到案

体育要闻

老球痞们给年轻人上了课

娱乐要闻

赵丽颖晒照似初恋,拍照疑与儿子分享

财经要闻

AI风口吹不起科大讯飞

汽车要闻

广汽丰田2024赛那SIENNA正式上市

态度原创

教育
旅游
时尚
房产
手机

教育要闻

父母觉得孩子不懂感恩,为什么孩子却认为父母眼里只有学习?

旅游要闻

重庆荣获2023年全国游客满意度十佳城市

40+女人更适合极简风穿搭,不穿花哨反而更加洋气,赶紧安排

房产要闻

供应量环跌71%!海口这个月又只发了5张证!

手机要闻

3月份中低端市场分析:vivo第二,荣耀夺冠

无障碍浏览 进入关怀版