网易首页 > 网易号 > 正文 申请入驻

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

0
分享至

丰色 西风 发自 凹非寺
量子位 | 公众号 QbitAI

就在刚刚,马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。

来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大”(旺柴)



新版本Grok有啥突破?

一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。

二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4

消息一出,评论区立刻就躁起来了。



具体跑分结果如何,咱们立马来看。

Grok-1.5来了

首先,对于上下文窗口。

这次是一把直接提升到之前的16倍,来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示,同时保持其遵循指令的能力。

在“大海捞针”(NIAH)测试中,Grok-1.5在128K token的上下文中完美检索嵌入的文本。

整个图一水儿的蓝色(100%的检索深度):



其次,推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。

数学方面,Grok-1.5在MATH基准测试上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。

编程方面,Grok-1.5在HumanEval基准测试上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,仅次于大杯Claude 3 Opus。



看起来,Grok这次的实力也是不可小觑。

Grok系列与其他大模型相比还有一个特色,不使用通用的Python语言+Pytorch框架。

据官方介绍,Grok 1.5采用分布式训练架构,使用Rust、JAX、Kubernetes构建。

为了提高训练可靠性和维持正常运行时间,团队提出了自定义训练协调器,可自动检测到有问题的节点,然后剔除。

除此之外,他们还优化了checkpointing、数据加载和训练重启等流程,最大限度地减少故障停机时间。

这,才速速有了现在的Grok 1.5~

更多信息官方也暂时还没有披露。

可以确定的是,新版本未来几天会先推送给早期测试者。并按照“老规矩”,很快将在平台上线。



有网友表示,Grok进步真的相当迅速。



有人甚至称马斯克这是发了另一个“GPT-4等效模型”,喊着:

  • OpenAI搞快点啊。



你期待新版本的Grok吗?

参考链接:
[1]https://twitter.com/xai/status/1773510159740063860
[2]https://x.ai/blog/grok-1.5

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这天中午,男子去收废品,女子让他进屋喝口水,两人发生关系时,女子丈夫突然回家

这天中午,男子去收废品,女子让他进屋喝口水,两人发生关系时,女子丈夫突然回家

起喜电影
2024-04-27 07:50:26
想不到4月还没结束,国家一级演员何赛飞,就给影视圈演员敲警钟

想不到4月还没结束,国家一级演员何赛飞,就给影视圈演员敲警钟

陈述影视
2024-04-27 22:09:20
半小时内跑两枪!林雨薇东海岸12秒83夺银,再创赛季亚洲最佳

半小时内跑两枪!林雨薇东海岸12秒83夺银,再创赛季亚洲最佳

懂球帝
2024-04-28 10:37:14
回顾:河南好赌书记甘荣坤,一夜输掉几百万,扰乱司法,贪1.66亿

回顾:河南好赌书记甘荣坤,一夜输掉几百万,扰乱司法,贪1.66亿

江东浪流史
2024-04-28 14:04:37
现在是4月28日下午,消息不得了,突发一大要消息,要来大动作吗

现在是4月28日下午,消息不得了,突发一大要消息,要来大动作吗

股市皆大事
2024-04-28 11:30:34
傅崐萁一行人访陆进行时!朱立伦未等其返台,趁机对美献忠!

傅崐萁一行人访陆进行时!朱立伦未等其返台,趁机对美献忠!

波顿要统一
2024-04-28 11:54:22
拜登彻底输了!刚刚,英企最新消息传来,这是向中国企业投降了?

拜登彻底输了!刚刚,英企最新消息传来,这是向中国企业投降了?

户外钓鱼哥阿旱
2024-04-27 23:19:56
养老金调整总算敲定,农民、企退、事退养老金能涨多少钱?

养老金调整总算敲定,农民、企退、事退养老金能涨多少钱?

社保小达人
2024-04-28 08:45:45
59岁“李莫愁”与梁小龙聚会!颜值崩塌认不出,与李若彤似两代人

59岁“李莫愁”与梁小龙聚会!颜值崩塌认不出,与李若彤似两代人

裕丰娱间说
2024-04-27 09:42:58
55岁邓文迪最新出席晚宴把人美到!花朵裙配波浪卷发,又嫩又霸气

55岁邓文迪最新出席晚宴把人美到!花朵裙配波浪卷发,又嫩又霸气

时尚丽人风行
2024-04-27 14:50:20
皮尔斯:湖人飞到丹佛必输,系列赛5场结束。G4是掘金故意放水的

皮尔斯:湖人飞到丹佛必输,系列赛5场结束。G4是掘金故意放水的

好火子
2024-04-28 15:19:49
布林肯入住和平饭店,视野中有导弹驱逐舰,中方安排体现东方智慧

布林肯入住和平饭店,视野中有导弹驱逐舰,中方安排体现东方智慧

国平视野
2024-04-26 10:45:24
是谁?詹宁斯:库里下赛季会联手一名超巨 我深信

是谁?詹宁斯:库里下赛季会联手一名超巨 我深信

直播吧
2024-04-28 09:54:23
宗馥莉的KELLYONE饮料遇到了大麻烦

宗馥莉的KELLYONE饮料遇到了大麻烦

快乐的漂流瓶
2024-04-28 14:58:22
苗苗真的一点也不像3孩的妈,真的好少女,身材好薄好元气好白

苗苗真的一点也不像3孩的妈,真的好少女,身材好薄好元气好白

阿芒娱乐说
2024-04-27 22:36:45
一点都不想呆在中国了,出国的人已经排得人山人海到底是什么原因

一点都不想呆在中国了,出国的人已经排得人山人海到底是什么原因

娱乐圈的笔娱君
2024-04-24 15:32:30
张玉宁本轮攻破浙江队大门,他却拒绝为此庆祝,原因让球迷点赞

张玉宁本轮攻破浙江队大门,他却拒绝为此庆祝,原因让球迷点赞

罗掌柜体育
2024-04-27 15:15:35
美媒评述:中国国航订购100架C919飞机

美媒评述:中国国航订购100架C919飞机

参考消息
2024-04-28 09:11:17
湖北省纪委监委通报

湖北省纪委监委通报

湖北e家庭
2024-04-28 10:53:29
恩里克:从积分上来说还没结束,但我认为可以说我们是冠军了

恩里克:从积分上来说还没结束,但我认为可以说我们是冠军了

懂球帝
2024-04-28 07:35:34
2024-04-28 16:10:44
量子位
量子位
追踪人工智能动态
9327文章数 175242关注度
往期回顾 全部

科技要闻

马斯克周日意外来华,目前或已身在北京

头条要闻

乌多地遭袭击 泽连斯基:至少还需7套"爱国者"防空系统

头条要闻

乌多地遭袭击 泽连斯基:至少还需7套"爱国者"防空系统

体育要闻

赢了!詹皇末节14分制胜咆哮 压力给到KD

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

日元“崩”了!影响多大?

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

时尚
教育
本地
健康
房产

夏季穿搭要清爽也要高级!借鉴这些搭配技巧,优雅减龄又显瘦

教育要闻

基本立体图形(第2课时)圆柱、圆锥、圆台之间的关系

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

春天野菜不知不识莫乱吃

房产要闻

海南最新房价出炉,三亚跌价最猛!

无障碍浏览 进入关怀版