网易首页 > 网易号 > 正文 申请入驻

3140亿参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了

0
分享至

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

马斯克说到做到开源Grok-1,开源社区一片狂喜。

但基于Grok-1做改动or商用,都还有点难题:

Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。



△图注:Grok登上GitHub热度榜世界第一

Colossal-AI团队最新成果,解大家燃眉之急,提供方便易用的Python+PyTorch+HuggingFace Grok-1,能将推理时延加速近4倍

现在,模型已在HuggingFace、ModelScope上发布。

HuggingFace下载链接:
https://huggingface.co/hpcai-tech/grok-1

ModelScope下载链接:
https://www.modelscope.cn/models/colossalai/grok-1-pytorch/summary

性能优化

结合Colossal-AI在AI大模型系统优化领域的丰富积累,已迅速支持对Grok-1的张量并行。

在单台8H800 80GB服务器上,推理性能相比JAX、HuggingFace的auto device map等方法,推理时延加速近4倍



使用教程

下载安装Colossal-AI后,启动推理脚本即可。

./run_inference_fast.sh hpcaitech/grok-1

模型权重将会被自动下载和加载,推理结果也能保持对齐。如下图中Grok-1 greedy search的运行测试。



更多详情可参考grok-1使用例:
https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/grok-1

庞然大物Grok-1

此次开源,xAI发布了Grok-1的基本模型权重和网络架构。

具体来说是2023年10月预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

结构上,Grok-1采用了混合专家(MoE)架构,包含8个专家,总参数量为314B(3140亿),处理Token时,其中的两个专家会被激活,激活参数量为86B。

单看这激活的参数量,就已经超过了密集模型Llama 2的70B,对于MoE架构来说,这样的参数量称之为庞然大物也毫不为过。

更多参数信息如下:

  • 窗口长度为8192tokens,精度为bf16
  • Tokenizer vocab大小为131072(2^17),与GPT-4接近;
  • embedding大小为6144(48×128);
  • Transformer层数为64,每层都有一个解码器层,包含多头注意力块和密集块;
  • key value大小为128;
  • 多头注意力块中,有48 个头用于查询,8 个用于KV,KV 大小为 128;
  • 密集块(密集前馈块)扩展因子为8,隐藏层大小为32768



在GitHub页面中,官方提示,由于模型规模较大(314B参数),需要有足够GPU和内存的机器才能运行Grok。

这里MoE层的实现效率并不高,选择这种实现方式是为了避免验证模型的正确性时需要自定义内核。

模型的权重文件则是以磁力链接的形式提供,文件大小接近300GB。



值得一提的是,Grok-1采用的是Apache 2.0 license,商用友好

目前Grok-1在GitHub上的标星已达到43.9k Stars。

量子位了解,Colossal-AI将在近期进一步推出对Grok-1在并行加速、量化降低显存成本等优化,欢迎持续关注。

Colossal-AI开源地址:
https://github.com/hpcaitech/ColossalAI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国国务卿布林肯在北京购买了窦唯的专辑唱片

美国国务卿布林肯在北京购买了窦唯的专辑唱片

花非花008
2024-04-27 09:25:53
KD称永远不穿华子的垃圾鞋!美媒P图:华子直接将KD踩在脚底

KD称永远不穿华子的垃圾鞋!美媒P图:华子直接将KD踩在脚底

直播吧
2024-04-27 15:06:13
三部门要求储备一定现金,网友:后续动作来了!某银行上门服务…

三部门要求储备一定现金,网友:后续动作来了!某银行上门服务…

火山诗话
2024-04-27 08:15:20
不会演别尬演!范伟一段“劳改犯出狱戏”,让观众看清演技有多假

不会演别尬演!范伟一段“劳改犯出狱戏”,让观众看清演技有多假

喵喵娱乐团
2024-04-26 16:09:28
重庆一19岁女生称被舞蹈老师压断腿致十级伤残 涉事培训学校:在走司法程序,绝不回避责任

重庆一19岁女生称被舞蹈老师压断腿致十级伤残 涉事培训学校:在走司法程序,绝不回避责任

红星新闻
2024-04-27 15:33:11
1700亿打了水漂?菲律宾“急召”中方大使,我方态度让人害怕

1700亿打了水漂?菲律宾“急召”中方大使,我方态度让人害怕

星辰故事屋
2024-04-24 13:49:16
严打!德阳某处一小院,警方抓获10名男男女女

严打!德阳某处一小院,警方抓获10名男男女女

德阳全媒体
2024-04-27 11:41:48
中国,这次是真的拿捏住了美国命脉!

中国,这次是真的拿捏住了美国命脉!

星辰故事屋
2024-04-26 19:32:26
滑天下之大稽!重罚阿里,轻处华润燃气,如何维护社会公平?

滑天下之大稽!重罚阿里,轻处华润燃气,如何维护社会公平?

王二哥老搞笑
2024-04-27 11:12:05
美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

关尔东
2024-04-27 00:10:14
周鸿祎突然咳嗽不停,三锥子扎不出血,网友怀疑是癌症

周鸿祎突然咳嗽不停,三锥子扎不出血,网友怀疑是癌症

映射生活的身影
2024-04-26 21:51:02
考验中国时刻到了:普京决心已下,要钱也要地,大不了和美国决裂

考验中国时刻到了:普京决心已下,要钱也要地,大不了和美国决裂

千里持剑
2024-04-26 13:44:50
结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

说天说地说实事
2024-04-26 15:33:02
同病相怜!杜兰特詹姆斯0-3,联盟收视率危机:晋级需要奇迹

同病相怜!杜兰特詹姆斯0-3,联盟收视率危机:晋级需要奇迹

天涯沦落人
2024-04-27 13:31:10
湖南将有8-10级雷暴大风或冰雹天气!中央气象台继续发布预警

湖南将有8-10级雷暴大风或冰雹天气!中央气象台继续发布预警

潇湘晨报
2024-04-27 08:10:14
13000颗!马斯克没有料到,6G计划正式公布,外媒:我们输了

13000颗!马斯克没有料到,6G计划正式公布,外媒:我们输了

小蘑菇壹号
2024-04-27 11:07:51
去世半年前,重庆90岁老太被摄影师外孙女爆改成19岁“少女”

去世半年前,重庆90岁老太被摄影师外孙女爆改成19岁“少女”

上游新闻
2024-04-27 14:06:42
“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

星辰故事屋
2024-03-08 21:12:51
重磅!武汉病毒所石正丽团队发布新冠溯源调查

重磅!武汉病毒所石正丽团队发布新冠溯源调查

灰产圈
2024-04-27 00:16:26
去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

北青网-北京青年报
2024-04-26 17:25:03
2024-04-27 18:52:49
量子位
量子位
追踪人工智能动态
9327文章数 175242关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

去世半年前 90岁老太被摄影师外孙女爆改成"19岁少女"

头条要闻

去世半年前 90岁老太被摄影师外孙女爆改成"19岁少女"

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

本地
艺术
教育
数码
公开课

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

艺术要闻

画廊周北京迎来第八年, “漂留” 主题聚集 30 余家艺术机构与 40 场展览

教育要闻

清华大学成立人工智能学院,姚期智任首任院长

数码要闻

苹果已停止升级 Mac 起步内存,库克更看重优化软硬件集成度

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版