网易首页 > 网易号 > 正文 申请入驻

用BT下载的方式在家跑千亿大模型,推理/微调速度10倍提升

0
分享至

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

在家用消费级GPU就能跑1760亿参数大模型,推理微调都很快。

还是用BT下载的方式实现。

这事儿可把AI爱好者们新鲜坏了。

这不,这个名为PETALS的项目刚开源没多久,GitHub标星数就达到了1.3k。

老司机们都知道,BT下载这玩意儿,下载同一个文件的人越多,这个文件的下载速度就越快,因为每个下载用户都会成为一个“资源节点”,互通有无。

PETALS道理差不多,就是把大家伙的GPU都利用起来,协同推理/微调同一个大模型。

用上它,你的GPU实际上只需要加载大模型的一小部分,就能把模型跑起来,速度还嘎嘎快:

推理速度能达到1秒/token,比offloading的方式快10倍。

offloading是通过提高GPU利用率,加速模型训练的一种方法,

什么是PETALS

具体来说,PETALS来自BigScience这个科研合作项目。此前人人皆可用的1760亿参数开源大模型BLOOM也来自于该项目。

至于PETALS具体是怎么个用法,先来看看下面这个例子:

张三想基于BLOOM搞个懂法语的语言大模型,而李四则想微调BLOOM让它学会C++编程。

尽管任务不同,但两者涉及的一些步骤却是共同的。

此时包括张三李四在内的PETALS用户们,自个儿的GPU里已分别加载好了模型的一部分(子集)。

于是,张三和李四就可以通过网络寻求其他用户的帮助,利用别人已经拥有的模型子集,在最短时间内对BLOOM进行微调。同时,他们GPU上的模型资源也会被其他用户利用。

实际的操作过程中,PETALS的每个参与者,都会通过本地设备运行一个服务器/客户端,或者两者兼具。

服务器包含模型层子集,通常是Transformer块。同时,服务器会处理来自客户端的请求。

客户端则会形成以流水线形式并行的一连串服务器,来运行整个模型的推理/微调。

值得一提的是,微调后的子模型可以在模型中心共享,继续提供给其他人使用。

此外,为了提高分布式推理的性能,开发人员们还采取了以下策略:

  • 动态量化,使每个GPU存储更多参数,减少连续设备和通信回合的数量;
  • 优先考虑低延迟连接,即每个客户端优先考虑距离近的服务器;
  • 服务器之间的负载均衡。

在这些优化措施的基础之上,研究人员证明,千亿参数级别的模型可以基于PETALS有效运行。

对了,如果你感兴趣,还可以直接在官方提供的Colab链接上试玩一下,地址文末奉上~

关于BigScience

前文说到,PETALS是BigScience项目的一部分。

BigScience是一个开放科学合作计划,旨在打破科技巨头对AI资源的垄断。

此前,在HuggingFace、法国国家大型计算中心等机构的牵头之下,BigScience汇聚来自60个国家和250多个机构的1000多名研究人员,一起搞出了“人人可用”、从代码到数据集通通开源的BLOOM语言大模型。

BLOOM有1760亿参数,支持59种语言,是目前最大的多语种开源语言模型。

目前,PETALS主要支持的就是BLOOM。不过开发人员表示,未来还将支持更多基础模型。

Colab地址:
https://colab.research.google.com/drive/1Ervk6HPNS6AYVr3xVdQnY5a-TjjmLCdQ?usp=sharing

参考链接:
[1]https://github.com/bigscience-workshop/petals
[2]https://news.ycombinator.com/item?id=34215665

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世界第一巨贪:家藏数吨黄金,拥有29架私人飞机,拖垮一国经济

世界第一巨贪:家藏数吨黄金,拥有29架私人飞机,拖垮一国经济

东哥讲故事
2024-04-28 12:54:31
我是镇书记、老王是镇长,他升为副县长我原地踏步,后来他说出真相

我是镇书记、老王是镇长,他升为副县长我原地踏步,后来他说出真相

乔生桂
2024-03-27 19:00:36
日本再次赌上国运,和美国对着干,或发动金融“珍珠港”

日本再次赌上国运,和美国对着干,或发动金融“珍珠港”

韦英雄
2024-04-28 22:08:46
北影节闭幕式红毯:闫妮姚晨聚首,陈数摔倒险走光,胡歌尴尬出油

北影节闭幕式红毯:闫妮姚晨聚首,陈数摔倒险走光,胡歌尴尬出油

萌神木木
2024-04-26 18:11:59
越南政坛没有地震?

越南政坛没有地震?

新民周刊
2024-04-28 09:05:58
“星星之火”,席卷全美

“星星之火”,席卷全美

平原公子
2024-04-26 09:45:33
演员王阳接女儿放学,3岁女儿太漂亮,高斯又高又瘦很时髦!

演员王阳接女儿放学,3岁女儿太漂亮,高斯又高又瘦很时髦!

柠檬有娱乐
2024-04-28 09:50:56
恭喜朱婷!恭喜女排!2年1冠+1亚,朱婷回归女排敲定,蔡斌激动

恭喜朱婷!恭喜女排!2年1冠+1亚,朱婷回归女排敲定,蔡斌激动

詹妹侃体育
2024-04-28 15:12:43
1987年,我国派出五名特工追杀一名叛徒,引出一位幕后谍王……

1987年,我国派出五名特工追杀一名叛徒,引出一位幕后谍王……

极品小牛肉
2024-04-23 14:04:29
周淑怡二台也塌房了!背刺老板,出轨榜1大哥,前LPL官方解说被绿

周淑怡二台也塌房了!背刺老板,出轨榜1大哥,前LPL官方解说被绿

风尘Game
2024-04-28 09:32:50
李尚福被免去国防部长,虎父无犬子,父亲竟和美国交过手

李尚福被免去国防部长,虎父无犬子,父亲竟和美国交过手

磊子讲史
2024-03-25 14:45:46
35岁女子当丈母娘,被误认成新娘,网友:这岳母还能继续生二胎

35岁女子当丈母娘,被误认成新娘,网友:这岳母还能继续生二胎

户外阿崭
2024-04-22 08:40:44
常住人口再创新历史新高 解读深圳人口增长的背后……

常住人口再创新历史新高 解读深圳人口增长的背后……

南方都市报
2024-04-28 16:36:19
基恩:哈兰德非常像一名英冠球员,他的进步很大

基恩:哈兰德非常像一名英冠球员,他的进步很大

懂球帝
2024-04-29 06:19:10
问界M9底盘用料太吓人了,可以比肩合资50-100万间任意车型!

问界M9底盘用料太吓人了,可以比肩合资50-100万间任意车型!

热爱娱乐等
2024-03-15 15:05:48
果不其然!美国大选一夜逆转,下任总统板上钉钉?奥巴马担忧了

果不其然!美国大选一夜逆转,下任总统板上钉钉?奥巴马担忧了

星辰故事屋
2024-04-27 19:30:22
44+42+39!创生涯最高纪录,哈登如梦初醒了,还不如答应火箭啊

44+42+39!创生涯最高纪录,哈登如梦初醒了,还不如答应火箭啊

巴叔GO聊体育
2024-04-28 15:32:45
外媒:哥大理事会通过决议批评管理层阻止学生抗议,“违背常春藤盟校传统”

外媒:哥大理事会通过决议批评管理层阻止学生抗议,“违背常春藤盟校传统”

环球网资讯
2024-04-27 09:46:18
《城中之城》结局:田晓慧再续孽缘,周琳沦为资本玩物,沈婧没赢

《城中之城》结局:田晓慧再续孽缘,周琳沦为资本玩物,沈婧没赢

阿芒娱乐说
2024-04-29 06:44:08
史诗级的6部神级大片,每部都值得三刷四刷

史诗级的6部神级大片,每部都值得三刷四刷

小Q侃电影
2024-04-24 15:08:25
2024-04-29 09:44:49
量子位
量子位
追踪人工智能动态
9332文章数 175242关注度
往期回顾 全部

科技要闻

马斯克想把特斯拉中国数据送出国 这事太难

头条要闻

男子将车停小区车位被贴"违停单" 直言燃油车主太难了

头条要闻

男子将车停小区车位被贴"违停单" 直言燃油车主太难了

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

问界M7追尾起火3人遇难 四大疑问待解

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

时尚
房产
本地
家居
健康

人到中年穿裙子更提气质,夏季借鉴好这些搭配技巧,时尚高级优雅

房产要闻

力度越来越大!落户两年享本地居民购房政策,海南第16城松绑限购!

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

家居要闻

光影之间 空间暖意打造生活律动

春天野菜不知不识莫乱吃

无障碍浏览 进入关怀版