网易首页 > 网易号 > 正文 申请入驻

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】马斯克「搞笑」模型刚刚升级到Grok-1.5,推理性能暴涨,支持128k长上下文。最重要的是,Grok-1.5的数学和代码能力大幅提升。

Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。

刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。

并且,很快就会上线。


11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进展。

Grok-1有3140亿参数,是Llama 2的4倍大,而且采用的是MoE架构,8个专家中2个是活跃专家。


Xai介绍,也就是从那时起,团队改进了最新模型Grok-1.5的推理和解决问题的能力。


OpenAI前开发者关系负责人表示,从xAI重大发布的时间可以看出他们前进的步伐和紧迫感。令人振奋!


128K上下文,Grok-1.5数学推理能力暴涨

根据官方介绍,Grok-1.5改进了推理能力,上下文长度为128K。


Grok-1.5最显著的改进之一是,它在编码和数学相关任务中的表现。

在测试中,Grok-1.5在数学基准上取得50.6%的得分,在GSM8K基准上获得了90%,这两个数学基准涵盖了从小学到高中的各种竞赛问题。

此外,在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5获得了74.1%的高分。

从下图中,与Grok-1相比,可以看出Grok-1.5在数学方面的能力得到大幅提升,GSM8K上从62.9%改进到90,MATH上从23.9%提升到50.6%。


128K长语境理解,扩增16倍

Grok-1.5另一全新特点是,能够在其上下文窗口内处理高达128K token的文本。

这使Grok的内存容量,增加到以前上下文长度的16倍,从而使它能够利用更长的文档中的信息。


此外,新模型还可以处理更长和更复杂的提示,同时在其上下文窗口扩展时仍保持其指令跟随能力。

在Needle In A Haystack(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可检索长度达 128K 字节的上下文中的嵌入文本,并取得了完美的检索结果。

Grok-1.5基础设施

Grok-1.5构建在基于JAX、Rust和Kubernetes的定制分布式训练框架之上。

这个训练堆栈可以让xAI团队能够以最少的投入,大规模构建创意,以及训练新的架构。

在大型计算群集上进行训练LLM的一个主要挑战是,最大限度地提高训练任务的可靠性和正常运行时间。

xAI定制的训练编排器,可确保自动检测有问题的节点,并将其从训练任务剔除。

与此同时,他们还优化了检查点、数据加载和训练任务的重启,以最大限度地减少发生故障时的停机时间。

xAI表示,Grok-1.5将很快提供给早期测试者,以帮助改进模型。

博客还预告了Grok-1.5将在未来几天里推出几个新功能。

最后,xAI还是一如既往地po出了招募信息。


参考资料:

https://x.ai/blog/grok-1.5

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
涉嫌行贿,慧心医疗(广东)有限公司法人梁小兵被调查!

涉嫌行贿,慧心医疗(广东)有限公司法人梁小兵被调查!

南方都市报
2024-04-28 15:16:13
舷号20航母模型:大连造船厂再次发布,大概率由该厂负责打造

舷号20航母模型:大连造船厂再次发布,大概率由该厂负责打造

老李得娱乐
2024-04-28 17:00:44
世锦赛第2轮:马奎尔13-9击败墨菲,8强战将对阵吉尔伯特

世锦赛第2轮:马奎尔13-9击败墨菲,8强战将对阵吉尔伯特

FrankReport
2024-04-28 19:53:50
广东:女子精心打扮跨省奔现,见面后男友一脸嫌弃:个子太矮了!

广东:女子精心打扮跨省奔现,见面后男友一脸嫌弃:个子太矮了!

夫妻谈资局
2024-04-26 18:07:16
中国最诡异的四大风水事件,太邪门了!

中国最诡异的四大风水事件,太邪门了!

平安是福呀
2024-04-22 23:35:19
他是江青前夫,曾居高位,被主席责备后活活吓死?两儿子非同一般

他是江青前夫,曾居高位,被主席责备后活活吓死?两儿子非同一般

阿胡
2024-04-15 13:37:34
英超最新积分战报:三大豪门翻车,保级队绝平曼联,纽卡狂轰5球

英超最新积分战报:三大豪门翻车,保级队绝平曼联,纽卡狂轰5球

足球狗说
2024-04-28 07:23:50
她被称为中国黄金身材,巅峰期退圈结婚,丈夫身份特殊到不方便说

她被称为中国黄金身材,巅峰期退圈结婚,丈夫身份特殊到不方便说

简读视觉
2024-04-11 20:00:03
这谁顶得住嘛!泰勒·斯威夫特这身材,这才是尤物啊!

这谁顶得住嘛!泰勒·斯威夫特这身材,这才是尤物啊!

冷却爱情
2024-04-25 18:28:15
内塔尼亚胡批准了,准备进攻!坦克、装甲车已在边境集结,这100多万人能去哪里?

内塔尼亚胡批准了,准备进攻!坦克、装甲车已在边境集结,这100多万人能去哪里?

每日经济新闻
2024-04-26 13:32:16
妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

乔生桂
2024-04-20 19:44:55
内鬼开始下手了?当年颠覆苏联手法在中国重现,蹊跷事情接连发生

内鬼开始下手了?当年颠覆苏联手法在中国重现,蹊跷事情接连发生

昕梦倾城
2024-04-12 12:04:00
震惊!重庆燃气事件尘埃落定,表没问题,气没问题

震惊!重庆燃气事件尘埃落定,表没问题,气没问题

城内事城外说
2024-04-28 13:37:18
四个小时内,5名交警因查酒驾牺牲,专家建议取消醉驾入刑,为何

四个小时内,5名交警因查酒驾牺牲,专家建议取消醉驾入刑,为何

慢慢瑜伽吧
2024-04-28 09:15:45
文章40岁断崖式衰老,跟大女儿像爷孙,大女儿爱美爱做饭

文章40岁断崖式衰老,跟大女儿像爷孙,大女儿爱美爱做饭

红大娘娱乐
2024-04-15 01:10:48
几小时前,英国王室紧急出面!

几小时前,英国王室紧急出面!

一口娱乐
2024-04-28 14:10:33
西游记演员程伟兵病逝,是六小龄童大师兄

西游记演员程伟兵病逝,是六小龄童大师兄

农人老寓
2024-04-28 03:58:25
喜讯!浙江正式迎来一所新理工大学,投资460亿,开工已取得进展

喜讯!浙江正式迎来一所新理工大学,投资460亿,开工已取得进展

创业的阿废
2024-04-28 15:59:59
清华大学成立2个新学院!院士任院长

清华大学成立2个新学院!院士任院长

中国教育在线
2024-04-28 12:15:58
苏群:湖人队终于没有被横扫 这个系列赛被逆转的可能性微乎其微

苏群:湖人队终于没有被横扫 这个系列赛被逆转的可能性微乎其微

直播吧
2024-04-28 11:29:03
2024-04-28 20:42:44
新智元
新智元
AI产业主平台领航智能+时代
10967文章数 65460关注度
往期回顾 全部

科技要闻

特斯拉生死时速,马斯克西天取经

头条要闻

在中国时被BBC问"美国信誉" 布林肯的回复被嘲讽

头条要闻

在中国时被BBC问"美国信誉" 布林肯的回复被嘲讽

体育要闻

赢了!詹皇末节14分制胜咆哮 压力给到KD

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

家居
旅游
亲子
教育
手机

家居要闻

光影之间 空间暖意打造生活律动

旅游要闻

年轻人出游:为了爱好说走就走 好玩不贵很重要

亲子要闻

宝蓝游戏机组装挑战!宝蓝和朋友们一起组装玩具,玩得不亦乐乎!

教育要闻

孩子长大能赚多少钱,看父母就知道

手机要闻

三星新款折叠屏定了:性能、影像大幅升级,AI又有新功能

无障碍浏览 进入关怀版