网易首页 > 网易号 > 正文 申请入驻

马斯克打脸OpenAI!全球最大模型Grok-1开源,高达3140亿参数震撼世界|钛媒体AGI

0
分享至


马斯克参加纽约时报活动(来源:视频截图)

就在刚刚,马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下 AI 初创公司 xAI 宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。


xAI表示,Grok-1 是一个由 xAI 2023 年 10 月使用基于 JAX 和 Rust 的自定义训练堆栈、从头开始​​训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是 Grok-1 预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。 314B,专家混合(8 个活跃中的 2 个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关 OpenAI 的‘开放’部分的信息”。他直言,xAI 这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。


截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI 创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI 最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI 已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责 OpenAI 遭到微软的控制。他表示,世界需要一个替代GPT的 AI 技术选择。

去年11月,马斯克正式发布xAI 旗下首个大模型和应用成果方案Grok,并将Grok AI 助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI 技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2 -70B,在HumanEval编码任务、MMLU 基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家 AI 公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了 OpenAI,表示需要有一个与 Google/DeepMind 相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1 正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。


xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛媒体App梳理的关键信息:

  • 该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。
  • 3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。
  • 模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)
  • 最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计 gpt-3.5-turbo 的嵌入大小为 4096,称花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。


3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

(本文首发钛媒体App,作者|林志佳)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2024年养老金调整,1953年、1958年、1963年出生的人,能多涨吗?

2024年养老金调整,1953年、1958年、1963年出生的人,能多涨吗?

小强财艺
2024-04-29 07:47:04
国产品牌近乎全军覆没的安全漏洞:唯一不受影响的只有华为

国产品牌近乎全军覆没的安全漏洞:唯一不受影响的只有华为

快科技
2024-04-29 11:46:57
美媒提议勇士、快船、火箭和魔术4队,休赛季交易互利,改变联盟

美媒提议勇士、快船、火箭和魔术4队,休赛季交易互利,改变联盟

阿雄侃篮球
2024-04-29 23:46:52
汪小菲抛售与大S婚房,6600万豪宅内部无死角曝光!网友:很壕~

汪小菲抛售与大S婚房,6600万豪宅内部无死角曝光!网友:很壕~

空间设计
2024-04-29 12:11:44
世界第二艘电磁弹射航母!4月29日下午3点,中国“福建舰”开动了

世界第二艘电磁弹射航母!4月29日下午3点,中国“福建舰”开动了

说天说地说实事
2024-04-29 17:42:58
长三角人事丨江苏同一天任命两名副市长,都从重庆赴苏挂职

长三角人事丨江苏同一天任命两名副市长,都从重庆赴苏挂职

澎湃新闻
2024-04-29 17:32:27
问界M7事故细节曝光!车辆没搭载智驾系统,他们根本不是被撞死的

问界M7事故细节曝光!车辆没搭载智驾系统,他们根本不是被撞死的

快乐娱文
2024-04-28 19:52:26
这谁顶得住嘛!泰勒·斯威夫特这身材,这才是尤物啊!

这谁顶得住嘛!泰勒·斯威夫特这身材,这才是尤物啊!

冷却爱情
2024-04-25 18:28:15
大厂忙着踢皮球的时候也请看看脚下的人

大厂忙着踢皮球的时候也请看看脚下的人

关尔东
2024-04-29 00:13:21
国务院关税税则委员会公布对美加征关税商品第十四次排除延期清单

国务院关税税则委员会公布对美加征关税商品第十四次排除延期清单

财联社
2024-04-29 16:14:14
河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

青丝人生
2024-04-07 19:08:37
国内首富再换人,身价高达4100亿,相当于2个丁磊3个王健林!

国内首富再换人,身价高达4100亿,相当于2个丁磊3个王健林!

文迪科记
2024-04-29 14:28:54
图片报:市政府撤回,阿隆索等人将不会成为勒沃库森荣誉市民

图片报:市政府撤回,阿隆索等人将不会成为勒沃库森荣誉市民

懂球帝
2024-04-29 17:10:28
揭秘!太阳报独家:克洛普与萨拉赫争执是因后者上场前没好好握手

揭秘!太阳报独家:克洛普与萨拉赫争执是因后者上场前没好好握手

直播吧
2024-04-29 12:13:52
4月28日,谢娜张杰,凌晨零点,同时发文!

4月28日,谢娜张杰,凌晨零点,同时发文!

紫雨说娱乐
2024-04-28 09:16:47
愿天堂没有宗教车!科技进步成果:不是情怀遥遥领先而是生命至上

愿天堂没有宗教车!科技进步成果:不是情怀遥遥领先而是生命至上

大风文字
2024-04-29 08:55:38
上海动真格?后排乘客不系安全带罚款200元?刚刚,官方回应了

上海动真格?后排乘客不系安全带罚款200元?刚刚,官方回应了

上观新闻
2024-04-29 20:46:39
养眼,昔日“国足杀手”李同国女儿成韩国名模,靓照曝光身材真好

养眼,昔日“国足杀手”李同国女儿成韩国名模,靓照曝光身材真好

尘语者
2024-04-29 16:32:07
CCTV5直播!皇马决战拜仁,3巨星缺阵,欧冠之王连续3次淘汰穆勒

CCTV5直播!皇马决战拜仁,3巨星缺阵,欧冠之王连续3次淘汰穆勒

球场没跑道
2024-04-29 10:07:16
全面停止生产!又一造车新势力宣告“破产”,正式落幕

全面停止生产!又一造车新势力宣告“破产”,正式落幕

户外小阿隋
2024-04-28 13:47:03
2024-04-30 00:52:49
钛媒体APP
钛媒体APP
独立财经科技媒体
100620文章数 858312关注度
往期回顾 全部

科技要闻

马斯克收获大礼,李彦宏梅开二度?

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

体育要闻

足球童话!执教16年,从业余联赛到德甲

娱乐要闻

田馥甄遭抵制,蔡依林却能稳稳捞金?

财经要闻

建信人寿巨亏40亿 部分产品退保率93%

汽车要闻

配置更丰富 静态体验2024款欧拉好猫

态度原创

时尚
健康
本地
游戏
公开课

学会这一招,0成本get上镜脸

春天野菜不知不识莫乱吃

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

《剑星》流程不长:仅主线通关只需13.5小时

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版