网易首页 > 网易号 > 正文 申请入驻

马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星

0
分享至


新智元报道

编辑:编辑部

【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,项目一上线已经在GitHub上狂揽6k星。

说到做到,马斯克xAI的Grok,果然如期开源了!


就在刚刚,xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。


3140亿的参数,让Grok-1成为迄今参数量最大的开源LLM,是Llama 2的4倍。


目前,xAI关于Grok-1没有透露更多信息。

官网放出的信息如下——

- 基础模型在大量文本数据上训练,未针对任何特定任务进行微调。

- 314B参数的MoE,有25%的权重在给定token上处于激活状态。

- 2023年10月,xAI使用JAX和Rust之上的自定义训练堆栈从头开始训练。

一经上线GitHub,Grok就狂揽了6k星,586个Fork。


项目地址:https://github.com/xai-org/grok-1

马斯克还不忘嘲讽OpenAI一番,「告诉我们更多关于OpenAI的「open」部分...」


纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。


开源究竟会让技术更安全,还是会让它更滥用?

「开源支持者」马斯克,以身作则地卷入了AI界的这场激烈辩论,并用行动给出了答案。

小扎刚刚也对Grok做出了评价,「并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了」。


一条磁力链,全球首个最大模型开源

这次xAI开源Grok-1,遵守的是Apache-2.0许可证,因此,用户可以自由使用、修改和分发软件。

存储库包含了用于加载和运行Grok-1开源权重模型的JAX示例代码。

用户需要下载checkpoint,将ckpt-0目录放置在checkpoint中,随后运行以下代码来测试:


pip install -r requirements.txtpython run.py

这个脚本会在测试输入上,加载checkpoint和模型中的样本。

由于模型较大,参数达到了314B参数,因此需要具有足够GPU内存的计算机,才能使用示例代码测试模型。

而且,由于此存储库中MoE层的实现效率不高,选择该实现是为了避免需要自定义内核来验证模型的正确性。

通过Torrent客户端和下面这个磁力链接,就可以下载权重了。


magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce



更多细节

斯坦福研究者Andrew Kean Gao浏览了model.py介绍了更多Grok的架构信息,3140亿参数没有更多附加条款。



8个混合专家(2个活跃专家),860B活跃参数。它使用旋转嵌入,而不是固定位置嵌入。

- tokenizer词汇量:131,072(于GPT-4类似)相当于2^17

- 嵌入大小:6144(48*128)

- Transformer层:64(每一层都有一个解码层:多头注意块和密度块)

- 键值大小:128


多头注意模块:有48个查询头和8个键值

密集块(密集前馈块):

- 宽度因子(Widening Factor):8

- 隐藏层大小为32768

每个token从8个专家中选出2个。


旋转位置嵌入大小6144,这是有意义的,它与模型的输入嵌入大小相同。

- 上下文长度:8192个token

- 精度:bf16


最后,附上一张总结版图。


网友:开源争霸战要来

AI社区已经沸腾了!

技术界指出,Grok的亮点是在前向反馈层中使用了GeGLU以及归一化方法,并且使用了有趣的三明治范式技术(sandwich norm technique)。

连OpenAI的员工,都表示了自己对Grok的强烈兴趣。


英伟达高级科学家Jim Fan表示,「有史以来最大的开源大模型,由世界级团队训练,通过磁力链Apache 2.0发布。

314B参数,混合专家模型(8个专家2个是活跃的)。就连活跃参数规模(86B)都超过了最大的Llama模型。迫不及待地想看到基准测试结果,以及人们能用它构建出什么样的应用」。



AI研究人员Sebastian Raschka表示,与其他通常有使用限制的开源模重模型相比,Grok更为开源。不过它的开源程度低于Pythia、Bloom和Olmo,后者提供了训练代码和可重现的数据集。



Craiyon创始人Boris Dayma,详细分析了Grok-1的代码。


网友indigo表示,为了「理解宇宙」的理念,看来xAI团队特意把参数设定成了「圆周率 314B」,这是目前规模最大的开源模型,期待今年6月的Llama 3加入Grok的开源争霸战。


Grok开源后,一大波微调要来了。


第一代Grok已超越Llama-2-70B

2023年11月,xAI推出了自己的第一代大语言模型Grok,正式加入大模型的战争。

当时,Grok在推特上作为「Premium+」订阅服务的一部分,月费16美元。

xAI表示,Grok的设计灵感来源于《银河系漫游指南》,它能够回答几乎所有问题,助力人类不分背景或政治立场地追求理解和知识。

Grok最初的版本Grok-0拥有330亿参数,紧接着xAI推出了经过数次改进的Grok-1,为X上的Grok聊天机器人提供支持。

根据xAI公布的数据,在GSM8K、HumanEval和MMLU等一系列基准测试中,Grok-1的表现超过了Llama-2-70B和GPT-3.5,虽然跟GPT-4还差得远。


当时,Grok不仅能够处理X平台上实时生成的用户内容,还带有一点幽默感,给憨憨的AI注入了一丝活力。

在提供最新热点事件信息(无论是政治还是体育)的同时,它还能抖个机灵,甚至偶尔讽刺一下。

马斯克为何选择开源?

在数次嘲讽OpenAI是「CloseAI」之后,马斯克果真选择了开源自家大模型。

当然,这背后肯定也有商业上的考量。

作为市场领导者的OpenAI,是没有理由开源ChatGPT背后模型代码的。

现在,通过发布Grok的代码,马斯克将自己牢牢扎根在后者的阵营中。这一决定,或许能让他的xAI超越Meta和Mistral AI。

Llama的开源给Meta带来了很多好处,几乎让小扎从元宇宙的泥潭爬了出来。


而仅仅只是一个小型初创公司的Mistral AI,也因为自己的开源策略而声名鹊起,被业界公认为「欧洲的OpenAI」。


开源版本可能会鼓励开发者和潜在客户更快地采纳自己的模型,实际上起到了市场推广的作用。

开发者社区对Grok开源版本的反馈和改进也可能有助于xAI加速开发新版本,这些新版本xAI可以选择开放源代码或保留专有权。

比如像Mistral一样,承诺继续发布开源版本,同时为付费客户保留最先进的模型。

马斯克一直是开源技术的支持者,连Tesla也已经开放了汽车某些部分的源代码,而他的社交媒体平台X公开了一些用于内容排名的算法。

「还有工作要做,但这个平台已经是迄今为止最透明、最注重真相、不是高门槛的平台,」马斯克今天在回应对开源X推荐算法的评论时,这样说道。


尽管OpenAI目前在AI领域仍遥遥领先,但开源和闭源的战争还远远没有结束。


AI模型是否应该开源?某些人认为,必须防止这种强大技术免受闯入者的侵害,而另一些人则坚持认为,开源的利绝对大于弊。

作为市场领导者的OpenAI,是没有理由开源ChatGPT背后模型代码的。

现在,通过发布Grok的代码,马斯克将自己牢牢扎根在后者的阵营中。

这一决定,或许能让他的xAI最终超越Meta和Mistral AI。

参考资料:

https://x.ai/blog/grok-os

https://twitter.com/itsandrewgao/status/1769447551374156097

https://www.wired.com/story/elon-musk-no-choice-open-chatbot-grok/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国第五家市值超过2万亿美元的企业诞生!谷歌首次突破2万亿美元

美国第五家市值超过2万亿美元的企业诞生!谷歌首次突破2万亿美元

AI商业论
2024-04-27 11:58:21
英国媒体曝出猛料!凯特4个多月不出面,和这两人密切相关

英国媒体曝出猛料!凯特4个多月不出面,和这两人密切相关

金牌娱乐
2024-04-26 10:43:26
上海逆转,王哲林爆发,吴前冲突,浙江输球罪人低迷、没斗志不该

上海逆转,王哲林爆发,吴前冲突,浙江输球罪人低迷、没斗志不该

东球弟
2024-04-26 21:46:23
几乎全是假货,利润率高达650%,为何很多人仍然愿意被割韭菜!

几乎全是假货,利润率高达650%,为何很多人仍然愿意被割韭菜!

盛世科记
2024-04-21 10:00:48
汪小菲父亲汪玺突然赴台,疑为孙子孙女改姓一事,答案已经很明确

汪小菲父亲汪玺突然赴台,疑为孙子孙女改姓一事,答案已经很明确

郑丁嘉话
2024-04-25 14:33:21
笑不活了!林更新现身武汉大学,感叹没赶上樱花,校花也没的

笑不活了!林更新现身武汉大学,感叹没赶上樱花,校花也没的

乐观探历史
2024-04-27 10:40:07
“拉链门”女主角莱温斯基50岁如女王般绽放,77岁克林顿头发全白

“拉链门”女主角莱温斯基50岁如女王般绽放,77岁克林顿头发全白

柴叔带你看电影
2024-04-26 20:24:19
102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

娱乐团长
2024-04-18 21:00:03
所罗门群岛候选人:当选总理将废除同中国的安全协议,外交部回应

所罗门群岛候选人:当选总理将废除同中国的安全协议,外交部回应

雪狼看世界
2024-04-26 15:00:09
新加坡前外交部司长用“国家机密通道”,给中国女友寄了21块名表!被控认罪…

新加坡前外交部司长用“国家机密通道”,给中国女友寄了21块名表!被控认罪…

新加坡万事通
2024-04-27 18:09:14
双预警!大暴雨!强沙尘暴!10级雷暴大风!持续性强降雨来袭!国家防总:或出现较重汛情→

双预警!大暴雨!强沙尘暴!10级雷暴大风!持续性强降雨来袭!国家防总:或出现较重汛情→

鲁中晨报
2024-04-27 15:37:10
中俄052D进展曝光,俄海军总司令来华签约,俄想要的我们会给吗?

中俄052D进展曝光,俄海军总司令来华签约,俄想要的我们会给吗?

兵国大事
2024-04-27 17:21:29
杭州孤男寡女爬山真相大白,同学关系,女子擦伤的地方很清白!

杭州孤男寡女爬山真相大白,同学关系,女子擦伤的地方很清白!

小怪吃美食
2024-04-27 13:56:30
这是1946年航拍的北京城,当时确实很雄伟,可惜被拆了城墙

这是1946年航拍的北京城,当时确实很雄伟,可惜被拆了城墙

作家李楠枫
2024-04-16 07:21:01
薛之谦演唱会女主再发文,澄清三大事实,晒自拍称自己长得好看

薛之谦演唱会女主再发文,澄清三大事实,晒自拍称自己长得好看

小海娱计
2024-04-26 12:40:58
去灵隐寺为何要买飞来峰门票?西湖景区:实现一票制仍需努力

去灵隐寺为何要买飞来峰门票?西湖景区:实现一票制仍需努力

澎湃新闻
2024-04-27 11:54:30
伊涅斯塔:纵观巴萨历史,称得上超级球星的仅3人,我还不行!

伊涅斯塔:纵观巴萨历史,称得上超级球星的仅3人,我还不行!

天下足球资讯
2024-04-26 22:32:18
证券突发惊掉下巴的消息,金融圈传的沸沸扬扬,A股的好戏要开始

证券突发惊掉下巴的消息,金融圈传的沸沸扬扬,A股的好戏要开始

彩云的夕阳
2024-04-27 00:00:58
赵雅芝去世?工作室撒谎?明天下午五点见分晓

赵雅芝去世?工作室撒谎?明天下午五点见分晓

娱乐的小灶
2024-04-27 19:28:34
今年的湿气很重,最耗阳气,记住少吃这3种水果

今年的湿气很重,最耗阳气,记住少吃这3种水果

今日养生之道
2024-04-27 22:14:36
2024-04-27 23:00:49
新智元
新智元
AI产业主平台领航智能+时代
10964文章数 65460关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

布林肯:推迟制裁以军 给以色列时间"纠正错误"

头条要闻

布林肯:推迟制裁以军 给以色列时间"纠正错误"

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

亲子
本地
家居
公开课
军事航空

亲子要闻

健康夜话 | 医生讲述“试管妈妈”的故事:治疗的过程也是“治愈”彼此

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

家居要闻

光影之间 空间暖意打造生活律动

公开课

睡前进食会让你发胖吗?

军事要闻

军事专家:福建舰距离海试为期不远

无障碍浏览 进入关怀版