网易首页 > 网易号 > 正文 申请入驻

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

0
分享至

机器之心报道

编辑:泽南

马斯克搞大模型,速度也奇快。

Grok 1 开源才刚有 10 天,Grok 1.5 就来了。



本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。

上周一,马斯克刚刚开源了3140 亿参数的混合专家(MoE)模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构,Gork 项目已展示了 xAI 截至去年 11 月所取得的进展。在最新模型 Grok-1.5 中,Gork 又有了进一步提高。

能力与推理

Grok-1.5 最明显的改进之一是其在代码和数学相关任务中的性能。在 xAI 的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。

此外,它在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%。



还记得昨天Databricks 开源的通用大模型 DBRX吗?当时的对比图表如下所示,看起来新版本 Grok 的提升是显著的。



就是不知这个大幅升级的 1.5 版会在什么时候开源?

长上下文理解

Grok-1.5 中的另一个重要升级是在其上下文窗口内可以处理多达 128K token 的长上下文。这使得 Grok 的容量增加到之前上下文长度的 16 倍,从而能够利用更长文档中的信息。



此外,该模型可以处理更长、更复杂的提示(prompt),同时在上下文窗口扩展时仍然能保持其指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可以在长度高达 128K token 的上下文中嵌入文本,实现完美的检索结果。

训练 Grok-1.5 的基础设施

xAI 进一步介绍了用于训练模型的算力设施。在大规模 GPU 集群上运行的先进大型语言模型(LLM)研究需要强大而灵活的基础设施。Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。该训练堆栈允许开发团队能够以最小的精力构建想法原型并大规模训练新架构。

在大型计算集群上训练 LLM 的主要挑战是最大限度提高训练作业的可靠性和正常运行时间。xAI 提出的自定义训练协调器可确保自动检测到有问题的节点,并将其从训练作业中剔除。工程师还优化了检查点、数据加载和训练作业重新启动等问题,以最大限度地减少发生故障时的停机时间。

展望

为了寻求替代微软支持的 OpenAI 和 Google 大模型的解决方案,马斯克去年推推动了 AI 创业公司 xAI,以创建他所说的「最大程度寻求真相的人工智能」 。去年 12 月,这家初创公司为 X 的 Premium+ 订阅者推出了 Grok。



xAI 表示,Grok-1.5 很快就会向早期测试者开放,其团队将继续改进 Grok。随着新版本推向公众,在未来几天 X 上的大模型将陆续推出一些新功能。

参考内容:

https://x.ai/blog/grok-1.5

https://www.reuters.com/technology/musks-xai-launch-improved-version-chatbot-2024-03-29/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

阿芒娱乐说
2024-04-27 12:23:34
“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

星辰故事屋
2024-03-08 21:12:51
广州白云钟落潭疑现龙卷风,增城黄埔已发警报!出现雷电冰雹

广州白云钟落潭疑现龙卷风,增城黄埔已发警报!出现雷电冰雹

南方都市报
2024-04-27 16:36:15
广东卫健系统三任前一把手被查,一局长被点名“吃高档菜肴”

广东卫健系统三任前一把手被查,一局长被点名“吃高档菜肴”

澎湃新闻
2024-04-27 13:32:27
美国国务卿布林肯在北京购买了窦唯的专辑唱片

美国国务卿布林肯在北京购买了窦唯的专辑唱片

花非花008
2024-04-27 09:25:53
普京气炸了!俄罗斯布里亚特共和国代表在联合国的精彩演讲

普京气炸了!俄罗斯布里亚特共和国代表在联合国的精彩演讲

娱宙观
2024-04-26 14:10:55
布林肯离开北京前,等到了接见通知,中方的特殊安排有深意

布林肯离开北京前,等到了接见通知,中方的特殊安排有深意

刘庆彬
2024-04-27 09:06:50
去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

北青网-北京青年报
2024-04-26 17:25:03
习主席用这句古语,点中了布林肯的“心思”

习主席用这句古语,点中了布林肯的“心思”

直新闻
2024-04-26 22:39:10
引众怒!中国女生被恶意赶下澳洲航班,全体乘客竟鼓掌嘲笑!“这就是种族歧视...”

引众怒!中国女生被恶意赶下澳洲航班,全体乘客竟鼓掌嘲笑!“这就是种族歧视...”

澳洲红领巾
2024-04-27 13:14:19
马斯克被立案调查,“大清洗开始了”

马斯克被立案调查,“大清洗开始了”

蓝钻故事
2024-04-21 15:26:13
业绩增长10倍,股价跌去70%,葛卫东抄底1800万股被套,科技龙头

业绩增长10倍,股价跌去70%,葛卫东抄底1800万股被套,科技龙头

资本百科
2024-04-27 06:30:09
俄罗斯冻结美国最大银行在俄资产!乌方:俄乌冲突以来已获得854亿美元财政援助

俄罗斯冻结美国最大银行在俄资产!乌方:俄乌冲突以来已获得854亿美元财政援助

每日经济新闻
2024-04-27 00:24:09
遭穆迪下调评级 万科强硬回应:坚决反对

遭穆迪下调评级 万科强硬回应:坚决反对

财联社
2024-04-27 14:15:11
重磅!武汉病毒所石正丽团队发布新冠溯源调查

重磅!武汉病毒所石正丽团队发布新冠溯源调查

灰产圈
2024-04-27 00:16:26
几千年都没有变过!

几千年都没有变过!

吴女士
2024-04-26 11:16:12
探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

挪威森林
2024-04-26 20:45:21
侮辱性极强!独行侠悍将晒霸气照疯狂扎心威少 东契奇秒点赞

侮辱性极强!独行侠悍将晒霸气照疯狂扎心威少 东契奇秒点赞

厝边人侃体育
2024-04-27 12:31:23
清凉峰一男一女最新后续:知情人透露二人关系,丈夫愤怒二次发声

清凉峰一男一女最新后续:知情人透露二人关系,丈夫愤怒二次发声

影孖看世界
2024-04-26 19:32:33
结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

说天说地说实事
2024-04-26 15:33:02
2024-04-27 18:32:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

亲子
健康
旅游
公开课
军事航空

亲子要闻

5岁小孩哥迷人舞姿征服众人,这气质一般人真来不了,小小年纪怎么就一把年纪了

这2种水果可降低高血压死亡风险

旅游要闻

散装河北,冀北、冀东、冀中、冀南如何划分?

公开课

睡前进食会让你发胖吗?

军事要闻

佩洛西称俄在支持"挺巴"的美国反战学生 扎哈罗娃回应

无障碍浏览 进入关怀版