网易首页 > 网易号 > 正文 申请入驻

马斯克开始疯狂剧透Grok 5了

0
分享至

鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

马斯克的Grok 5偷偷藏不住了。



刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4+程序合成技术微调

好小汁,啥时候开始Grok都弯道超车了?OpenAI、Anthropic、谷歌一众明星模型都被压一头。



一石激起千层浪,网友纷纷发问,那等Grok5出来,岂不是……



马斯克也随即出来回应:

  • 我现在认为Grok 5能达到AGI。



顺便附赠了一堆有关Grok 5的爆料。

马斯克疯狂剧透Grok 5

这事还得从Grok 4超越预期的表现说起,发布才两个月就登上多个榜单第一的宝座,而就在刚刚,ARC Prize发布了两个最新的ARC-AGI榜单SOTA方案:

  • 都是开源的。
  • 都使用的是Grok 4作为基础模型。
  • 都实现了带测试自适应的程序合成外循环。



先简单介绍一下ARC-AGI排行榜,其旨在评估AI解决复杂难题的能力,类似于人类的智力测试,从而反映LLM的推理能力。

测试任务包含v1和v2版本,v2需要LLM完成更多的多步骤推理,一般来说,即使是最优秀的LLM也只能在v2中获得16%的准确率。



GPT-5在二者上的得分依次是65.7%和9.9%,Claude Opus 4的得分是35.7%和8.6%,而Grok 4则是66.7%和16%。

Jeremy Berman的新方案则是在Grok 4基础上,用英语替代了传统的Python,最终得分来到79.6%和29.44%。

Eric Pang则在Jeremy的工作上,设计了一个受DreamCoder启发、LLM辅助的程序合成系统,能够通过从不断扩展的程序库中学习来解决越来越难的任务。



虽然得分没有进一步升高(77.1%和26%),但是成功让每个任务的平均费用得以下降(v1:8.42美元→2.56美元;v2:30.4美元→3.97美元)

当问及两位作者选择Grok 4的理由,他们均表示,这是他们测试下来效果最好的模型。

当中所体现出的AGI潜力,也让马斯克感到自豪,随即透露了一系列有关Grok 5的消息。

老马表示,这才只是Grok 4,而Grok 5将很有可能达成AGI



而这个可能性也许能达到10%或者更高,要知道他此前并不认为Grok版本会出现AGI。



与此同时,他表示Grok 5将会在几周之内开始训练



加上此前他曾表示Grok 5将在今年年底前推出,或许我们将在不久后见证新的“LLM怪物”诞生。

所以为什么老马能对Grok 5抱以如此强烈的信心呢?

训练数据及硬件资源的投入

归根结底,是马斯克在Grok训练中投入之深。

据悉,Grok 5将拥有较之前代更多的训练数据

Grok 4的训练量是Grok 2的100倍、Grok 3的10倍,而Grok 5则只会更多。



马斯克拥有一整套的最新真实数据收集体系,其中xAI可以为其提供最新的直接数据,特斯拉可以定期利用FSD和摄像头捕获图像从而生成数据,而擎天柱机器人也能从现实世界中生成大量数据。

可以说,马斯克在当下数据为王的时代,最不缺的就是数据。

此外,xAI在硬件资源上也投入颇多,目标在5年内完成相当于5000万台H100 GPU同等算力的部署。

其专门为Grok系列打造的超级计算集群Colossus,已经部署了约23万张GPU。其中包括3万张NVIDIA GB200(基于Nvidia的Blackwell架构),将会持续为Grok提供强大的算力支持。



不过Grok 5究竟能否真正实现AGI,网友们对此也提出了质疑:毕竟要成为AGI靠的可不仅仅是数据和马斯克的声明,一切还得看成品



所以究竟谁才是能吃到第一只AGI螃蟹的AI公司,且让我们拭目以待。

参考链接:
[1]https://x.com/elonmusk/status/1968196086193066365
[2]https://jeremyberman.substack.com/p/how-i-got-the-highest-score-on-arc-agi-again
[3]https://ctpang.substack.com/p/e760eba7-c8b3-4fda-b631-61b89dd0d0fd
[4]https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-says-xai-is-targeting-50-million-h100-equivalent-ai-gpus-in-five-years-230k-gpus-including-30k-gb200s-already-reportedly-operational-for-training-grok

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卸下头巾,奔赴街头:伊朗女孩的勇气与抗争

卸下头巾,奔赴街头:伊朗女孩的勇气与抗争

老马拉车莫少装
2026-01-14 18:36:52
远离造神陷阱,官媒揭开杀猪宴呆呆妹真实处境,令人担心的事发生

远离造神陷阱,官媒揭开杀猪宴呆呆妹真实处境,令人担心的事发生

法老不说教
2026-01-14 14:43:04
印度面临巨额赔偿,火箭升空后现场爆发掌声,6分钟后鸦雀无声

印度面临巨额赔偿,火箭升空后现场爆发掌声,6分钟后鸦雀无声

近史博览
2026-01-14 15:15:28
跳水!今夜,不平静

跳水!今夜,不平静

中国基金报
2026-01-15 00:18:13
被要求判死刑,尹锡悦涨红了脸,抓起麦克风陈述89分钟,拍桌怒骂特检组

被要求判死刑,尹锡悦涨红了脸,抓起麦克风陈述89分钟,拍桌怒骂特检组

红星新闻
2026-01-14 12:58:18
特朗普思考开战,24小时不到,伊朗派兵南非也派兵,中国主持大局

特朗普思考开战,24小时不到,伊朗派兵南非也派兵,中国主持大局

博览历史
2026-01-14 06:20:03
伊朗得到中国声援,特朗普当即调转枪口:对华加关税,马上执行!

伊朗得到中国声援,特朗普当即调转枪口:对华加关税,马上执行!

头条爆料007
2026-01-14 08:27:40
5行代码,逼疯整个硅谷!澳洲放羊大叔,捅开AI编程奇点

5行代码,逼疯整个硅谷!澳洲放羊大叔,捅开AI编程奇点

新智元
2026-01-14 17:38:10
三人私闯庭院后续:正脸曝光社死,官方账号沦陷,大理文旅压力大

三人私闯庭院后续:正脸曝光社死,官方账号沦陷,大理文旅压力大

有范又有料
2026-01-14 20:07:45
受够了AI脱衣?新《古墓丽影》劳拉演员宣布推特删号

受够了AI脱衣?新《古墓丽影》劳拉演员宣布推特删号

游民星空
2026-01-14 12:13:11
美国组织发布Labubu工厂调查报告:工人每月只休1天,还雇有未成年人

美国组织发布Labubu工厂调查报告:工人每月只休1天,还雇有未成年人

小萝卜丝
2026-01-14 13:58:23
“斩杀线”创始人连夜跑路!事迹已登《纽约时报》头条

“斩杀线”创始人连夜跑路!事迹已登《纽约时报》头条

3DM游戏
2026-01-14 10:28:03
瑞银泼冷水:明年房价再跌10%,后年再跌5%

瑞银泼冷水:明年房价再跌10%,后年再跌5%

谭谈投研
2025-12-27 18:07:13
11国做出选择,特朗普很兴奋,喊中国将会服软,高市早苗形势不妙

11国做出选择,特朗普很兴奋,喊中国将会服软,高市早苗形势不妙

胥言
2026-01-14 17:10:50
越扒越有,被人民网点名后,闫学晶又被曝身份造假,成名史太精彩

越扒越有,被人民网点名后,闫学晶又被曝身份造假,成名史太精彩

奇思妙想草叶君
2026-01-14 21:18:53
30亿砸进水里,两年就关门!这家“豪华医院”的倒下比想象更扎心

30亿砸进水里,两年就关门!这家“豪华医院”的倒下比想象更扎心

青眼财经
2026-01-14 23:33:13
普京四年布局成功了?乌克兰只是幌子,真正的目标已经落入圈套

普京四年布局成功了?乌克兰只是幌子,真正的目标已经落入圈套

悦心知足
2026-01-13 02:54:20
同意加装电梯但一直没有出资,一户人家被全楼“孤立”!积怨太深,卖房时尴尬了

同意加装电梯但一直没有出资,一户人家被全楼“孤立”!积怨太深,卖房时尴尬了

扬子晚报
2026-01-14 11:27:18
贺娇龙离世!其大量骑马不正确的踩马镫方式流出,或是悲剧的起因

贺娇龙离世!其大量骑马不正确的踩马镫方式流出,或是悲剧的起因

火山诗话
2026-01-15 05:41:36
哈萨克斯坦:放弃离中国近的阿拉木图,迁都到阿斯塔纳,为哪般?

哈萨克斯坦:放弃离中国近的阿拉木图,迁都到阿斯塔纳,为哪般?

阿柒的讯
2026-01-13 20:18:13
2026-01-15 07:36:49
量子位 incentive-icons
量子位
追踪人工智能动态
12014文章数 176359关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

房产
艺术
游戏
亲子
军事航空

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

艺术要闻

历代书家集字春联大集合

玩5小时直接烧主板!玩家亲述《怪猎荒野》变PS5杀手

亲子要闻

家长要告诉孩子一生遇到都是有用的人

军事要闻

中东气氛愈发紧张 伊朗处于最高战备状态

无障碍浏览 进入关怀版