网易首页 > 网易号 > 正文 申请入驻

马斯克打脸OpenAI!全球最大模型Grok-1开源,高达3140亿参数震撼世界|钛媒体AGI

0
分享至


马斯克参加纽约时报活动(来源:视频截图)

就在刚刚,马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下 AI 初创公司 xAI 宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。


xAI表示,Grok-1 是一个由 xAI 2023 年 10 月使用基于 JAX 和 Rust 的自定义训练堆栈、从头开始​​训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是 Grok-1 预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。 314B,专家混合(8 个活跃中的 2 个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关 OpenAI 的‘开放’部分的信息”。他直言,xAI 这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。


截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI 创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI 最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI 已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责 OpenAI 遭到微软的控制。他表示,世界需要一个替代GPT的 AI 技术选择。

去年11月,马斯克正式发布xAI 旗下首个大模型和应用成果方案Grok,并将Grok AI 助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI 技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2 -70B,在HumanEval编码任务、MMLU 基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家 AI 公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了 OpenAI,表示需要有一个与 Google/DeepMind 相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1 正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。


xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛媒体App梳理的关键信息:

  • 该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。
  • 3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。
  • 模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)
  • 最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计 gpt-3.5-turbo 的嵌入大小为 4096,称花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。


3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

(本文首发钛媒体App,作者|林志佳)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
游客行为惹怒日本当地居民,直接出手“毁掉”富士山打卡绝美景点,以后大家都没得拍

游客行为惹怒日本当地居民,直接出手“毁掉”富士山打卡绝美景点,以后大家都没得拍

日本物语
2024-04-26 21:28:56
雷军在车展狂拍劳斯莱斯,销售苦笑,网友:下一辆小米汽车来了!

雷军在车展狂拍劳斯莱斯,销售苦笑,网友:下一辆小米汽车来了!

户外小阿隋
2024-04-27 12:20:21
镜头横扫过去,画面极其炸裂!轮换时替补席的皇马,坐着好几个亿

镜头横扫过去,画面极其炸裂!轮换时替补席的皇马,坐着好几个亿

林子说事
2024-04-27 13:45:32
山姆奶油西瓜上热搜,8块一斤真的贵吗?

山姆奶油西瓜上热搜,8块一斤真的贵吗?

映射生活的身影
2024-04-26 16:25:32
教育部:教师工资要提高!目前农村教师每月七八千退休金太低了

教育部:教师工资要提高!目前农村教师每月七八千退休金太低了

鹏飞深文
2024-04-27 12:28:02
快船G3输球后,伦纳德正式下令,乔治不满判罚,泰伦卢解释原因

快船G3输球后,伦纳德正式下令,乔治不满判罚,泰伦卢解释原因

体坛大辣椒
2024-04-27 12:33:03
毛泽东为何要反复翻彭德怀过去的老账?这事还要从1928年开始说起

毛泽东为何要反复翻彭德怀过去的老账?这事还要从1928年开始说起

拙言问史
2024-04-03 22:48:37
湖南31岁美女教师,无法接受丈夫自杀,头七当天抱俩娃殉情

湖南31岁美女教师,无法接受丈夫自杀,头七当天抱俩娃殉情

莉雅细细谈
2024-03-08 21:52:12
当年在罗马尼亚有个著名的笑话,你要是走的话,我们就不用走了!

当年在罗马尼亚有个著名的笑话,你要是走的话,我们就不用走了!

翻开历史和现实
2024-04-26 13:48:06
湖人若被横扫,将引发4个连锁反应:NBA改革季中赛,哈姆该下课了

湖人若被横扫,将引发4个连锁反应:NBA改革季中赛,哈姆该下课了

篮坛扒客
2024-04-26 22:59:19
王毅划下红线后,布林肯口风变了,离开中国前,见到中国领导人

王毅划下红线后,布林肯口风变了,离开中国前,见到中国领导人

有凤Talk
2024-04-26 18:32:38
广州闹市区车祸致11伤,现场惨烈,肇事司机弃车扬长而去

广州闹市区车祸致11伤,现场惨烈,肇事司机弃车扬长而去

此处已无情
2024-04-27 18:44:41
45岁董洁:一婚出轨王大治,离婚11年后,才和丈夫和解

45岁董洁:一婚出轨王大治,离婚11年后,才和丈夫和解

娱乐白名单
2024-04-26 15:51:12
爱信、ZF时代彻底落幕:时代淘汰变速箱的时候,招呼都没打一声!

爱信、ZF时代彻底落幕:时代淘汰变速箱的时候,招呼都没打一声!

汽车扒壹扒
2024-04-26 22:34:05
直击广州龙卷风:天空异常昏暗,飞沙走石,鸡被超10厘米冰雹砸死

直击广州龙卷风:天空异常昏暗,飞沙走石,鸡被超10厘米冰雹砸死

火山诗话
2024-04-27 19:21:42
小S看到得气疯掉!

小S看到得气疯掉!

拿数据说话
2024-04-25 15:47:06
俄彻底放弃幻想,从源头切断乌军武器供应链,球重新抛回北约手中

俄彻底放弃幻想,从源头切断乌军武器供应链,球重新抛回北约手中

三分亮剑
2024-04-27 19:22:02
石宏:美国宣布60亿美元军援,只能给乌克兰“吊命”

石宏:美国宣布60亿美元军援,只能给乌克兰“吊命”

直新闻
2024-04-27 18:59:27
刚刚汪妈曝光大小S吸毒,小S偷偷上线,大S妈妈留言求饶

刚刚汪妈曝光大小S吸毒,小S偷偷上线,大S妈妈留言求饶

娱乐八卦木木子
2024-04-26 17:55:19
台湾即将迎来回归,也许,就在2025!

台湾即将迎来回归,也许,就在2025!

星辰故事屋
2024-04-26 19:33:31
2024-04-27 20:38:44
钛媒体APP
钛媒体APP
独立财经科技媒体
100789文章数 858295关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

警车鸣笛进村指名道姓喊话一村民"涉嫌嫖娼" 当地回应

头条要闻

警车鸣笛进村指名道姓喊话一村民"涉嫌嫖娼" 当地回应

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

游戏
旅游
家居
本地
房产

T1全队抵达成都,大量粉丝热情接机!Faker人气爆炸,被直接包围

旅游要闻

散装河北,冀北、冀东、冀中、冀南如何划分?

家居要闻

光影之间 空间暖意打造生活律动

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

房产要闻

海南最新房价出炉,三亚跌价最猛!

无障碍浏览 进入关怀版