网易首页 > 网易号 > 正文 申请入驻

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

0
分享至

机器之心报道

编辑:泽南

马斯克搞大模型,速度也奇快。

Grok 1 开源才刚有 10 天,Grok 1.5 就来了。



本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。

上周一,马斯克刚刚开源了3140 亿参数的混合专家(MoE)模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构,Gork 项目已展示了 xAI 截至去年 11 月所取得的进展。在最新模型 Grok-1.5 中,Gork 又有了进一步提高。

能力与推理

Grok-1.5 最明显的改进之一是其在代码和数学相关任务中的性能。在 xAI 的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。

此外,它在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%。



还记得昨天Databricks 开源的通用大模型 DBRX吗?当时的对比图表如下所示,看起来新版本 Grok 的提升是显著的。



就是不知这个大幅升级的 1.5 版会在什么时候开源?

长上下文理解

Grok-1.5 中的另一个重要升级是在其上下文窗口内可以处理多达 128K token 的长上下文。这使得 Grok 的容量增加到之前上下文长度的 16 倍,从而能够利用更长文档中的信息。



此外,该模型可以处理更长、更复杂的提示(prompt),同时在上下文窗口扩展时仍然能保持其指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可以在长度高达 128K token 的上下文中嵌入文本,实现完美的检索结果。

训练 Grok-1.5 的基础设施

xAI 进一步介绍了用于训练模型的算力设施。在大规模 GPU 集群上运行的先进大型语言模型(LLM)研究需要强大而灵活的基础设施。Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。该训练堆栈允许开发团队能够以最小的精力构建想法原型并大规模训练新架构。

在大型计算集群上训练 LLM 的主要挑战是最大限度提高训练作业的可靠性和正常运行时间。xAI 提出的自定义训练协调器可确保自动检测到有问题的节点,并将其从训练作业中剔除。工程师还优化了检查点、数据加载和训练作业重新启动等问题,以最大限度地减少发生故障时的停机时间。

展望

为了寻求替代微软支持的 OpenAI 和 Google 大模型的解决方案,马斯克去年推推动了 AI 创业公司 xAI,以创建他所说的「最大程度寻求真相的人工智能」 。去年 12 月,这家初创公司为 X 的 Premium+ 订阅者推出了 Grok。



xAI 表示,Grok-1.5 很快就会向早期测试者开放,其团队将继续改进 Grok。随着新版本推向公众,在未来几天 X 上的大模型将陆续推出一些新功能。

参考内容:

https://x.ai/blog/grok-1.5

https://www.reuters.com/technology/musks-xai-launch-improved-version-chatbot-2024-03-29/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子怀疑妻子出轨,用百草枯浸泡妻子内裤,几天后他肠子都悔青了

男子怀疑妻子出轨,用百草枯浸泡妻子内裤,几天后他肠子都悔青了

文人鉴史
2024-04-22 00:35:03
离婚19年,俩人在广州某高档小区相遇,男子是房主,女子是保洁员

离婚19年,俩人在广州某高档小区相遇,男子是房主,女子是保洁员

小月文史
2024-04-12 15:25:51
日元,崩了?!

日元,崩了?!

博闻财经
2024-04-27 12:01:38
故事:我在阿富汗外派,掀开了一位穆斯林少女的面纱,她非我不嫁

故事:我在阿富汗外派,掀开了一位穆斯林少女的面纱,她非我不嫁

潮河讲堂
2024-04-24 17:09:26
这谁顶得住嘛!迪恩这身材,这才是尤物啊!

这谁顶得住嘛!迪恩这身材,这才是尤物啊!

冷却爱情
2024-04-25 15:17:13
俄罗斯在乌克兰的优势迅速缩小,莫斯科部队已坐进失败滑梯

俄罗斯在乌克兰的优势迅速缩小,莫斯科部队已坐进失败滑梯

火星宏观
2024-04-27 16:38:23
再次派出最强阵容的日本女乒,陈梦、王曼昱会受到怎样的冲击

再次派出最强阵容的日本女乒,陈梦、王曼昱会受到怎样的冲击

林子说事
2024-04-27 17:21:55
林生斌案忽然传来最新进展!关键证据曝光,我们都被骗了

林生斌案忽然传来最新进展!关键证据曝光,我们都被骗了

听风听你
2024-04-26 21:22:57
惊!敖德萨火车站被俄瓦格纳部队攻陷!速看后续报道

惊!敖德萨火车站被俄瓦格纳部队攻陷!速看后续报道

世界探索者发现
2024-04-25 23:00:37
《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

阿芒娱乐说
2024-04-27 10:25:50
“拉链门”女主角莱温斯基50岁如女王般绽放,77岁克林顿头发全白

“拉链门”女主角莱温斯基50岁如女王般绽放,77岁克林顿头发全白

柴叔带你看电影
2024-04-26 20:24:19
关晓彤酒喝太多了,脸又肿又松

关晓彤酒喝太多了,脸又肿又松

娱乐八卦木木子
2024-04-27 15:02:04
CBA最新消息:任骏飞伤情公布,许钟豪面临追罚,孙铭徽惹争议

CBA最新消息:任骏飞伤情公布,许钟豪面临追罚,孙铭徽惹争议

刺头体育
2024-04-27 11:43:23
广东女子穿红衣打扮精致,在公交站台等七八年,网友:等她爱的人

广东女子穿红衣打扮精致,在公交站台等七八年,网友:等她爱的人

大苏专栏
2024-04-26 22:21:13
财神爷送福!本周狗屎运最旺的4个生 肖,钱财不断,财富爱情双丰收

财神爷送福!本周狗屎运最旺的4个生 肖,钱财不断,财富爱情双丰收

书山有路勤为径
2024-04-26 10:49:20
下午6点,女排世界最新排名,中国女排排名更新。

下午6点,女排世界最新排名,中国女排排名更新。

小鬼头体育
2024-04-27 03:35:29
台海突然出大事了!赖清德果然要动手?解放军强势出击,看谁敢动

台海突然出大事了!赖清德果然要动手?解放军强势出击,看谁敢动

星辰故事屋
2024-04-26 18:56:42
谈判再次破裂?我国或将关闭大使馆?外交部提醒:中方公民勿前往

谈判再次破裂?我国或将关闭大使馆?外交部提醒:中方公民勿前往

星辰故事屋
2024-04-22 18:16:54
亚洲杯悲喜夜:4强出炉!伊拉克1-0越南,乌兹别克2-0送沙特出局

亚洲杯悲喜夜:4强出炉!伊拉克1-0越南,乌兹别克2-0送沙特出局

侃球熊弟
2024-04-27 03:41:37
很准的面相学 有道理 果断收藏

很准的面相学 有道理 果断收藏

农人老寓
2024-04-27 12:27:40
2024-04-27 18:06:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

家居
教育
手机
公开课
军事航空

家居要闻

光影之间 空间暖意打造生活律动

教育要闻

清华大学成立人工智能学院,姚期智任首任院长

手机要闻

苹果用户反馈设备突然退出 Apple ID 账号,被要求重置密码

公开课

睡前进食会让你发胖吗?

军事要闻

佩洛西称俄在支持"挺巴"的美国反战学生 扎哈罗娃回应

无障碍浏览 进入关怀版