网易首页 > 网易号 > 正文 申请入驻

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

0
分享至

机器之心报道

编辑:泽南

马斯克搞大模型,速度也奇快。

Grok 1 开源才刚有 10 天,Grok 1.5 就来了。



本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。

上周一,马斯克刚刚开源了3140 亿参数的混合专家(MoE)模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构,Gork 项目已展示了 xAI 截至去年 11 月所取得的进展。在最新模型 Grok-1.5 中,Gork 又有了进一步提高。

能力与推理

Grok-1.5 最明显的改进之一是其在代码和数学相关任务中的性能。在 xAI 的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。

此外,它在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%。



还记得昨天Databricks 开源的通用大模型 DBRX吗?当时的对比图表如下所示,看起来新版本 Grok 的提升是显著的。



就是不知这个大幅升级的 1.5 版会在什么时候开源?

长上下文理解

Grok-1.5 中的另一个重要升级是在其上下文窗口内可以处理多达 128K token 的长上下文。这使得 Grok 的容量增加到之前上下文长度的 16 倍,从而能够利用更长文档中的信息。



此外,该模型可以处理更长、更复杂的提示(prompt),同时在上下文窗口扩展时仍然能保持其指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可以在长度高达 128K token 的上下文中嵌入文本,实现完美的检索结果。

训练 Grok-1.5 的基础设施

xAI 进一步介绍了用于训练模型的算力设施。在大规模 GPU 集群上运行的先进大型语言模型(LLM)研究需要强大而灵活的基础设施。Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。该训练堆栈允许开发团队能够以最小的精力构建想法原型并大规模训练新架构。

在大型计算集群上训练 LLM 的主要挑战是最大限度提高训练作业的可靠性和正常运行时间。xAI 提出的自定义训练协调器可确保自动检测到有问题的节点,并将其从训练作业中剔除。工程师还优化了检查点、数据加载和训练作业重新启动等问题,以最大限度地减少发生故障时的停机时间。

展望

为了寻求替代微软支持的 OpenAI 和 Google 大模型的解决方案,马斯克去年推推动了 AI 创业公司 xAI,以创建他所说的「最大程度寻求真相的人工智能」 。去年 12 月,这家初创公司为 X 的 Premium+ 订阅者推出了 Grok。



xAI 表示,Grok-1.5 很快就会向早期测试者开放,其团队将继续改进 Grok。随着新版本推向公众,在未来几天 X 上的大模型将陆续推出一些新功能。

参考内容:

https://x.ai/blog/grok-1.5

https://www.reuters.com/technology/musks-xai-launch-improved-version-chatbot-2024-03-29/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马斯克被立案调查,“大清洗开始了”

马斯克被立案调查,“大清洗开始了”

蓝钻故事
2024-04-21 15:26:13
太会玩了!以收购为名狂拉11个涨停,接着宣布收购失败大割韭菜!

太会玩了!以收购为名狂拉11个涨停,接着宣布收购失败大割韭菜!

云姐闲聊
2024-04-27 08:42:52
县政府将50亩土地重复出售,地方法院给政府违法行为“保驾护航”

县政府将50亩土地重复出售,地方法院给政府违法行为“保驾护航”

人我场
2024-04-27 18:49:19
判了!“广洲人家”赔偿“广州酒家”200万元

判了!“广洲人家”赔偿“广州酒家”200万元

新快报新闻
2024-04-27 19:09:06
乌克兰高级官员:俄军将发动大规模攻势!北约以“最大武力”向普京发信号

乌克兰高级官员:俄军将发动大规模攻势!北约以“最大武力”向普京发信号

每日经济新闻
2024-04-27 15:09:26
美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

美国藤校生敢面对美国警察,却不敢跟哈马斯喝杯咖啡

关尔东
2024-04-27 00:10:14
以色列摩萨德威胁美国学生:你们的长相已被记录,未来将拿不到毕业证书

以色列摩萨德威胁美国学生:你们的长相已被记录,未来将拿不到毕业证书

不掉线电波
2024-04-27 17:38:01
局部降温10℃!山东迎新一波冷空气!这些地区有雨,阵风7级

局部降温10℃!山东迎新一波冷空气!这些地区有雨,阵风7级

鲁中晨报
2024-04-27 18:37:05
张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

阿芒娱乐说
2024-04-27 12:23:34
都是预制品,广式早茶基本已全军覆灭?网友:预制品正在毁掉粤菜

都是预制品,广式早茶基本已全军覆灭?网友:预制品正在毁掉粤菜

若有所思
2024-04-27 11:03:14
美媒:美高校抗议学生享用免费咖啡三明治,背后“金主”是犹太裔金融大鳄索罗斯

美媒:美高校抗议学生享用免费咖啡三明治,背后“金主”是犹太裔金融大鳄索罗斯

红星新闻
2024-04-27 17:06:41
三部门要求储备一定现金,网友:后续动作来了!某银行上门服务…

三部门要求储备一定现金,网友:后续动作来了!某银行上门服务…

火山诗话
2024-04-27 08:15:20
悲情!"墨西哥吴镇宇",38岁奥乔亚十年内在法西意3支球队降级

悲情!"墨西哥吴镇宇",38岁奥乔亚十年内在法西意3支球队降级

直播吧
2024-04-27 07:49:21
这就是中国,竟无逻辑学?张维为:瑞典弃中立加入,让北约更弱了

这就是中国,竟无逻辑学?张维为:瑞典弃中立加入,让北约更弱了

瑜说还休
2024-04-26 18:15:25
“要么签,要么打”

“要么签,要么打”

环球时报新闻
2024-04-27 14:23:31
最新消息!人民币突破天际,空头不再是噩梦!

最新消息!人民币突破天际,空头不再是噩梦!

前沿天地
2024-04-27 18:02:57
【观点】詹杜库时代落幕?詹皇杜兰特陷0-3绝境 去陪库里备战奥运

【观点】詹杜库时代落幕?詹皇杜兰特陷0-3绝境 去陪库里备战奥运

醉卧浮生
2024-04-27 13:24:29
探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

挪威森林
2024-04-26 20:45:21
中央重磅布局后,马兴瑞、袁家军、王晓晖、赵一德、王君正、梁言顺密集部署

中央重磅布局后,马兴瑞、袁家军、王晓晖、赵一德、王君正、梁言顺密集部署

政知新媒体
2024-04-26 20:22:32
穆迪再次下调评级,万科回应:坚决反对,希望准确评估和反映公司情况

穆迪再次下调评级,万科回应:坚决反对,希望准确评估和反映公司情况

澎湃新闻
2024-04-27 15:58:40
2024-04-27 20:06:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

杨晓明涉嫌违纪违法 曾带队研发全球首款新冠灭活疫苗

头条要闻

杨晓明涉嫌违纪违法 曾带队研发全球首款新冠灭活疫苗

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

本地
亲子
家居
旅游
军事航空

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

亲子要闻

小女孩过生日哭泣妈妈快速走过生日流程“乐不乐我不知道 主打一个快’

家居要闻

光影之间 空间暖意打造生活律动

旅游要闻

散装河北,冀北、冀东、冀中、冀南如何划分?

军事要闻

佩洛西称俄在支持"挺巴"的美国反战学生 扎哈罗娃回应

无障碍浏览 进入关怀版