网易首页 > 网易科技 > 网易科技 > 正文

马斯克的最贵模型Grok4,能碾压人类博士,但“三观不正”他没提

0
分享至
划重点
  • 01 Grok 4发布了两个版本:Grok 4和 Grok 4 Heavy;
  • 02 Grok 4目前只限付费用户使用,最强的 Grok 4 Heavy 订阅费达300美元/月;
  • 03 此前相传的 Grok 4 Code 并未正式公布, 可能在8月发;
  • 04 Grok 4 同时开放了 API 的权限,定价每百万 tokens 输入3美元,输出 15 美元;
  • 05 xAI 路线图:8月发编码模型、9月发多模态代理、10月发视频生成模型。

出品 | 网易科技《态度》栏目

作者 | 袁宁

编辑 | 丁广胜

相比GPT 5的迟迟未到,以及DeepSeek的一次次小更新。跳过“3.5”,马斯克直接甩出版本“4”。

北京时间7月10日中午,马斯克的人工智能公司 xAI 终于发了最新模型Grok4——不过,发布会依然迟到一个多小时。

值得注意的是,在Grok4发布的前一周,xAI才刚刚再获百亿美元融资,估值飙至1130亿,仅次于 OpenAI的3000亿美元,远超 Claude 背后 Anthropic 的615亿美元。

不知道是不是被Grok反犹言论引发的争议影响,这次发布会中,马斯克看起来没有往日兴奋。

但这并没有影响他在直播中火力全开:Grok 4被他描述为“比所有研究生都聪明”,“全面超越博士水准,没有例外”,甚至放话称它将在明年开始“发明新技术”。

两个版本,最高订阅费300美元/月

此次发布的 Grok 4分为两个版本

其中Grok 4为标准版本,支持单代理推理;Grok 4 Heavy为多代理版本。两者均为纯推理模型,上下文窗口最高支持256K tokens。

费用方面,Grok 4目前仅面向付费用户开放,而SuperGrok Heavy 版本的订阅费甚至高达300美元/月,远超 OpenAI Pro 200美元/月的费用。

同时,xAI 也同步开放了 Grok 4的 API 权限,支持文字与视觉输入、文字输出,定价为每百万 tokens 输入3美元、输出15美元。

拿下“人类最后的考试”最高分

了解了模型的基本信息,下面来看最直观的各个测评得分。这部分在正式发布之前,X上就陆续有博主爆料。现在答案终于揭晓。

首先是Grok 4在“人类的最后考试” HLE(Human Level Evaluation) 中的表现。这个测试包含2500个专家级问题,涵盖上百个学科,被称为超高难度基准测试。

数据显示,Grok 4无工具版本达到25.4%(也就是解决了25.4%的问题),使用工具后升至于38.6%。

Grok 4 Heavy甚至取得了44.4% 的成绩,直接大幅超越Google Gemini 2.5 Pro 26.9%的成绩。

此外,在各项主流测评榜中,Grok 4 Heavy 也几乎都拿下第一。其中GPQA得分88-89,刷新记录;在AIME25数学竞赛题中,Grok 4 Heavy 更是几乎取得满分。

官方称,Grok 4的训练量是 Grok 2的100倍,其中推理相关数据的训练量更是提升了10倍。

用工具来理解世界

xAI 表示,Grok 4的强项是“用工具来理解世界,并用来完成任务”。发布会上展示了多项具象能力,包括:

现实预测:分析 Polymarket 上的棒球比赛赔率,识别赔率误差并计算出 Alpha;

科学模拟生成:生成黑洞碰撞的 HTML 动画,调用文献检索、代码生成、图形渲染等多个工具;

主观概念理解:识别“最古怪的员工头像”,展现出对“古怪”这种模糊定义的理解;

语音生成:新增五种拟人化声音,“Eve”可即兴演唱歌剧,端到端延迟减半,语音更自然。

发布会上,xAI 还公布了接下来几个月的产品节奏:

  • 8月:专用编码模型(Grok Code)上线;
  • 9月:发布多模态代理(Multi-modal Agent);
  • 10月:发布视频生成模型(Video Generation Model);

模型之外,系统问题仍待解

然而,就在发布会前一周,Grok 聊天机器人却因一系列激进内容上了头条。

Grok 3在 X 平台连发数条反犹言论,称赞希特勒、使用“MechaHitler”作为自称,甚至被网友截图记录其对用户发布仇恨内容。

xAI 被迫紧急删除相关帖子,并发声明称“将积极处理不当内容,禁止仇恨言论”。

而这场争议正好发生在马斯克宣称 Grok “重大升级”的同一周——7月4日,他在 X 上写道,“你们应该能感受到变化”。两天后,Grok 的提示词更新为:

“不会回避政治不正确的表达,只要有证据支撑。”但在后续更新中,该提示词被移除。

这些问题的背后是 xAI 的独特路径——借助社交平台 X 上亿级用户的实时行为数据,xAI 构建起一个“内容即数据、平台即分发”的 AI 闭环生态。

自3月份完成对 X 的全资收购后,xAI 更是将 Grok 系列深度绑定在平台底层。

此次发布会上,马斯克并没有对争议问题进行直接回应。

Grok 4无疑是一项突出的技术成就。但它的发布,也再次提醒我们:

当模型在表现出博士后级别推理能力的同时,也仍可能发出极端言论,真正的问题早已不只是技术维度,而是整个训练、部署、治理机制的系统问题。

在 AI 正以每月为单位发生跃迁的时代,如何在创造力与约束之间找到边界?如何保证“聪明的大脑”不成为“失控的扩音器”?

这,或许与模型SOTA 一样值得关注。

延伸阅读
相关推荐
热点推荐
受贿2.36亿余元,十四届全国政协原常委苟仲文一审被判死缓

受贿2.36亿余元,十四届全国政协原常委苟仲文一审被判死缓

界面新闻
2025-12-08 17:01:51
特斯拉上海超级工厂第400万辆整车下线:星光金Model Y L

特斯拉上海超级工厂第400万辆整车下线:星光金Model Y L

凤凰网科技
2025-12-08 14:29:07
原国务委员、第八届全国人大常委会副委员长王丙乾同志逝世,享年100岁

原国务委员、第八届全国人大常委会副委员长王丙乾同志逝世,享年100岁

新京报政事儿
2025-12-08 15:40:30
经济赔偿231.86万!网传广东一61人公司倒闭,员工称老板血本无归

经济赔偿231.86万!网传广东一61人公司倒闭,员工称老板血本无归

火山詩话
2025-12-08 16:09:18
浙大1999年出生的研究员任博导,本科毕业才4年,学院回应

浙大1999年出生的研究员任博导,本科毕业才4年,学院回应

极目新闻
2025-12-08 11:50:36
存在不当影射行为,郭德纲被约谈!

存在不当影射行为,郭德纲被约谈!

微微热评
2025-12-08 00:51:45
它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

坠入二次元的海洋
2025-12-08 05:50:41
不装了,美国准备发动战争,但在开战前,特朗普要解决三个大问题

不装了,美国准备发动战争,但在开战前,特朗普要解决三个大问题

议纪史
2025-12-07 16:55:08
湖南烟花店老板放烟花自杀事件后续来了:真相大白,令人唏嘘

湖南烟花店老板放烟花自杀事件后续来了:真相大白,令人唏嘘

复转这些年
2025-12-07 18:02:55
江西丰城一女护士患癌请病假遭拒?卫健委通报

江西丰城一女护士患癌请病假遭拒?卫健委通报

界面新闻
2025-12-08 16:29:53
万科,又出大事了?

万科,又出大事了?

混知房产
2025-12-08 13:14:41
美媒称乌东战局正发生急剧变化

美媒称乌东战局正发生急剧变化

参考消息
2025-12-08 12:53:03
已售650万,央视曝光:全是假的!网友怒了:丧良心

已售650万,央视曝光:全是假的!网友怒了:丧良心

据说无据
2025-12-08 09:30:56
用围巾擦地的女乘客找到了!苏州地铁:已和她取得联系,正约时间送出礼物

用围巾擦地的女乘客找到了!苏州地铁:已和她取得联系,正约时间送出礼物

极目新闻
2025-12-07 16:35:20
王迅老师不幸逝世,官网已变黑白

王迅老师不幸逝世,官网已变黑白

wuhu派
2025-12-08 08:47:33
解放军已进台海,赖清德做最坏打算,资产移交美,郑丽文开始算账

解放军已进台海,赖清德做最坏打算,资产移交美,郑丽文开始算账

书纪文谭
2025-12-08 13:36:31
台湾GDP增速大幅上调,创十多年来新高

台湾GDP增速大幅上调,创十多年来新高

小院之观
2025-12-08 06:05:07
周星驰《鹿鼎记》票房惨淡首日仅18万:情怀牌为何突然失灵?

周星驰《鹿鼎记》票房惨淡首日仅18万:情怀牌为何突然失灵?

城市乡村
2025-12-08 10:13:29
贵州榕江“荒野求生赛”主办方致歉,求生赛1号选手道歉:“安全员骚扰女选手”是不实言论

贵州榕江“荒野求生赛”主办方致歉,求生赛1号选手道歉:“安全员骚扰女选手”是不实言论

大风新闻
2025-12-08 10:24:07
中国武术大师扇耳光落下终身残疾?一只眼歪了,双眼无法同步移动

中国武术大师扇耳光落下终身残疾?一只眼歪了,双眼无法同步移动

念洲
2025-12-08 08:13:11
2025-12-08 17:59:00

科技要闻

外面有人挖,家里有人跑:苹果乱成了一锅粥

头条要闻

泰柬边境近日再起争端 阿努廷、洪森分别发声

头条要闻

泰柬边境近日再起争端 阿努廷、洪森分别发声

体育要闻

一位大学美术生,如何用4年成为顶级跑者?

娱乐要闻

林俊杰AAA颁奖礼,韩娱爱豆均站起鞠躬

财经要闻

重磅!政治局会议定调明年经济工作

汽车要闻

纯电全尺寸大六座 凯迪拉克"小凯雷德"申报图曝光

态度原创

时尚
家居
教育
房产
公开课

除了大衣,今年最火的外套一定就是它了!

家居要闻

有限無界 打破惯有思维

教育要闻

是不是只有我在内耗?补习班,到底该不该跟别人分享?

房产要闻

碧桂园,开始甩卖海口家底!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×