网易首页 > 网易号 > 正文 申请入驻

Grok4成“宇宙最强模型”?AI竞赛进入“马斯克节奏”

0
分享至

21世纪经济报道记者孔海丽、实习生郑子涵 北京报道

虽然马斯克本人一脸疲态,但他亲自坐镇,给Grok 4的噱头拉到顶配。

“宇宙最强模型”“它比所有领域的人类博士都聪明,无一例外”“Grok 4还没发明新科学或新物理定律只是时间问题”“Grok 4解决代码问题,比Cursor更好用”……

以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模型Grok 4的定调。

Grok 4也确实争气,在“人类最后的考试”(Humanity's Last Exam)中,拿到了38.6%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3的21%。多智能体版本Grok 4 Heavy拿到了44.4%,如果进一步使用工具辅助,则能达到50.7%。

这背后,是“暴力计算美学”,xAI耗时6个月搭建起来的10万块H100 GPU超级算力中心正在给出回报,Grok 4的训练量是Grok 3的10倍,是Grok 2的100倍。

回归商业世界的马斯克火力全开,接下来还计划 8 月推出代码模型,9 月上线多模态智能代理,10 月发布视频生成模型。

据悉,Grok已经被配置在了特斯拉最新固件里,未来也将通过人形机器人与现实世界交互。

AI大模型、自动驾驶、人形机器人、商业航天,马斯克的AI帝国正在越来越宏大,节奏也更甚从前。

Grok 4有多能打?

在多个高难度基准测试中,Grok 4表现出色。

马斯克在直播中强调,Grok 4在人文、数学、物理、工程等学科均达到博士以上水平,“比几乎所有学科的研究生更聪明”。

推理能力刷新纪录。Grok 4 拿到历史高分的“人类最后的考试”,是一份被称为“AI 世界终极试炼”的测试合集,这份专门针对AI的考卷,覆盖了数学、化学、语言学、自然科学等一百多个学科,大模型在这份测试中无法依赖网络搜索,只能凭自己的理解和推理能力作答。

能应对这份考卷的Grok 4,推理能力有大幅提升,可以减少对现有知识框架的依赖。

除HLE测试领先外,Grok 4在GPQA(研究生级问答)中拿到了88.9%,在美国数学邀请赛(AIME25)中拿下满分,ARC-AGI-2测试中以16.2%得分登顶(超第二名Claude Opus 4近一倍)。

商业场景的落地验证方面,在名为 Vending-Bench 的商业模拟任务中,Grok 4 也表现突出,经营自动售货机时平均净资产达到 4684.15 美元,是第二名的两倍,证明了长期规划和多步骤推理能力。

值得注意的是,Grok 4的创新点在于“工具原生融合”架构。与多数模型后期接入工具不同,Grok 4在训练阶段嵌入了搜索、代码执行等工具,使其能灵活调用资源解决复杂问题。例如直播演示中,它通过检索学术论文、调用模拟工具,生成了黑洞碰撞的可视化动态模型。

不过,业内人士认为,Grok 4 的强项主要集中在推理和复杂知识整合方面,而在代码、多模态、图像和视频生成等方面还有进步空间。

“最贵”模型的想象空间

xAI同步推出了行业最贵订阅计划:Super Grok Heavy月费高达300美元,较OpenAI顶级订阅贵50%。API定价同样激进,每百万token输入3美元、输出15美元。

高定价背后其实是训练成本的陡增。Grok 4百倍于前代的训练量,依托10万块H100 GPU集群完成,xAI并未披露单次训练耗资,但马斯克提到的“我们快没有合适问题考验AI了”,侧面印证了模型能力已逼近当前测试极限。

Grok 4的终极目标是与现实世界交互。马斯克透露,今年Grok 4还将融合有限元分析、流体动力学等工具,构建高精度物理模拟器(如黑洞模拟)。在他的规划中,Grok 4将通过Optimus(马斯克旗下的擎天柱)人形机器人连接现实,“让AI接受物理定律的最终检验”。另有消息显示,目前特斯拉最新固件已预埋Grok,未来或将作为车载语音助手及自动驾驶的“大脑”。

“我们正站在智能大爆炸的开端。”马斯克表示,对AI的最终测试是现实世界,未来AI技术将会放到改进汽车或火箭等领域验证有效性。

“睡在算力中心”的掌舵人归来

从特斯拉Robotaxi(无人驾驶出租车)秀肌肉,到Grok 4的暴力美学,近10天,马斯克已经称霸舆论场两回,他正以标志性的激进节奏推进业务。

马斯克所布局的自动驾驶、AI大模型、人形机器人、商业航天,逐渐形成闭环。Grok大模型作为“大脑”,驱动特斯拉自动驾驶、Optimus机器人行动决策;特斯拉车辆与机器人反馈的真实场景数据,反哺模型迭代;其旗下SpaceX星链提供全球低延迟通信,支撑实时AI交互。

OpenAI的ChatGPT-5还在酝酿中,目前AI军备竞赛进入“马斯克节奏”。马斯克的算力碾压、多场景捆绑,确实具有更宽广的应用想象力。

但在AI大模型快速迭代的当下,有多少用户愿意为了300美元月费的Grok 4买单,还是未知数。

高调背后也暗藏风险。Grok近期因发表反犹言论遭土耳其封禁、波兰政府投诉,迫使xAI紧急删除不当内容并调整审核策略。在“AI寻求真理”的路上,如何在开放性与安全性间平衡,不只是OpenAI 塞姆·奥特曼的难题,也是马斯克的。

马斯克在今天的直播中说:“安全是最重要的事,我们需要确保AI是一个好AI。你可以把AI看作是超级天才的孩子,它最终会比你聪明,但我们仍然要灌输正确的价值观。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1-0!阿森纳7分领跑却遭全英痛骂:丑陋夺冠能否终结22年等待?

1-0!阿森纳7分领跑却遭全英痛骂:丑陋夺冠能否终结22年等待?

落夜足球
2026-03-05 12:26:40
下任最高领袖遭“清除”威胁,伊朗还能打多久?

下任最高领袖遭“清除”威胁,伊朗还能打多久?

中国新闻周刊
2026-03-04 20:05:14
真被拜登说中了?让特朗普干完这4年,美国或成为世界老二?

真被拜登说中了?让特朗普干完这4年,美国或成为世界老二?

惊视
2026-03-05 04:55:26
霍尔木兹海峡切断不到24小时,后果已经显现,3个原因让中国不慌

霍尔木兹海峡切断不到24小时,后果已经显现,3个原因让中国不慌

说故事的阿袭
2026-03-04 21:25:31
"逼婚"成功!网球世界第一订婚,年赚两亿却甘愿为男友背上小三骂名

"逼婚"成功!网球世界第一订婚,年赚两亿却甘愿为男友背上小三骂名

体坛小二哥
2026-03-05 00:10:46
新华社消息|新华社播发钟华论文章《在中国式现代化新征程上策马奔腾》

新华社消息|新华社播发钟华论文章《在中国式现代化新征程上策马奔腾》

新华社
2026-03-04 10:08:29
13999元iPhone17大面积褪色遭集体投诉 客服最新回应:需由售后判定 具体需到店检测

13999元iPhone17大面积褪色遭集体投诉 客服最新回应:需由售后判定 具体需到店检测

快科技
2026-03-04 10:32:10
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

健康之光
2026-02-09 14:28:50
时隔多月,刘维伟前妻再度炮轰:不是放不下,他公开带小三太伤人

时隔多月,刘维伟前妻再度炮轰:不是放不下,他公开带小三太伤人

篮球扫地僧
2026-03-04 17:34:25
2100枚核弹24小时待命,张召忠曾发出警告:一旦开战,将无处可逃

2100枚核弹24小时待命,张召忠曾发出警告:一旦开战,将无处可逃

近史博览
2026-01-22 12:52:47
这就是为什么不要欺负底层员工的原因!网友:1600万结款直接报废

这就是为什么不要欺负底层员工的原因!网友:1600万结款直接报废

另子维爱读史
2026-02-01 20:32:25
官宣24小时后,阿里不再挽留林俊旸

官宣24小时后,阿里不再挽留林俊旸

搜狐科技
2026-03-05 12:13:23
郭沫若想让月薪100的溥仪当助理,岂料溥仪用5个字,让对方红了脸

郭沫若想让月薪100的溥仪当助理,岂料溥仪用5个字,让对方红了脸

混沌录
2026-02-13 00:11:33
为什么世界上没有一个面积在300~700万平方公里的国家?

为什么世界上没有一个面积在300~700万平方公里的国家?

孤云朗境
2026-02-04 23:52:06
“我拼了命也得要这个孩子”,吉林63岁超高龄妈妈顺利生产

“我拼了命也得要这个孩子”,吉林63岁超高龄妈妈顺利生产

大象新闻
2026-03-04 17:03:11
2026年政府工作报告:城乡居民基础养老金月最低标准再提高20元!

2026年政府工作报告:城乡居民基础养老金月最低标准再提高20元!

闪电新闻
2026-03-05 15:03:55
王新军没想到,离婚16年,单身至今的前妻和儿子早已走上另一条路

王新军没想到,离婚16年,单身至今的前妻和儿子早已走上另一条路

子芫伴你成长
2026-03-04 22:31:52
接受国民党征召参选花莲县长,游淑贞返回选区获民众热情迎接

接受国民党征召参选花莲县长,游淑贞返回选区获民众热情迎接

海峡导报社
2026-03-05 11:34:03
伊朗犯下10月7日的致命失误,导致其失去一切

伊朗犯下10月7日的致命失误,导致其失去一切

山河路口
2026-03-01 20:25:18
户口在农村的恭喜了!2026年3大调整,事关钱袋子,早看早知道!

户口在农村的恭喜了!2026年3大调整,事关钱袋子,早看早知道!

爱下厨的阿椅
2026-03-03 18:22:36
2026-03-05 15:48:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
235883文章数 743785关注度
往期回顾 全部

科技要闻

阿里内部邮件回应:批准林俊旸辞职

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

小鹏第二代VLA如何破解智驾不敢用的技术困局?

态度原创

亲子
数码
健康
公开课
军事航空

亲子要闻

手外纪事|第50期《宝宝多指不是哪都可切,希望一次解决孩子问题

数码要闻

显示器市场迎重量选手!TCL显示器国内首秀三箭齐发:出手即顶配

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

2026年中国国防预算增长7%

无障碍浏览 进入关怀版