网易首页 > 网易科技 > 网易科技 > 正文

马斯克的最贵模型Grok4,能碾压人类博士,但“三观不正”他没提

0
分享至
划重点
  • 01 Grok 4发布了两个版本:Grok 4和 Grok 4 Heavy;
  • 02 Grok 4目前只限付费用户使用,最强的 Grok 4 Heavy 订阅费达300美元/月;
  • 03 此前相传的 Grok 4 Code 并未正式公布, 可能在8月发;
  • 04 Grok 4 同时开放了 API 的权限,定价每百万 tokens 输入3美元,输出 15 美元;
  • 05 xAI 路线图:8月发编码模型、9月发多模态代理、10月发视频生成模型。

出品 | 网易科技《态度》栏目

作者 | 袁宁

编辑 | 丁广胜

相比GPT 5的迟迟未到,以及DeepSeek的一次次小更新。跳过“3.5”,马斯克直接甩出版本“4”。

北京时间7月10日中午,马斯克的人工智能公司 xAI 终于发了最新模型Grok4——不过,发布会依然迟到一个多小时。

值得注意的是,在Grok4发布的前一周,xAI才刚刚再获百亿美元融资,估值飙至1130亿,仅次于 OpenAI的3000亿美元,远超 Claude 背后 Anthropic 的615亿美元。

不知道是不是被Grok反犹言论引发的争议影响,这次发布会中,马斯克看起来没有往日兴奋。

但这并没有影响他在直播中火力全开:Grok 4被他描述为“比所有研究生都聪明”,“全面超越博士水准,没有例外”,甚至放话称它将在明年开始“发明新技术”。

两个版本,最高订阅费300美元/月

此次发布的 Grok 4分为两个版本

其中Grok 4为标准版本,支持单代理推理;Grok 4 Heavy为多代理版本。两者均为纯推理模型,上下文窗口最高支持256K tokens。

费用方面,Grok 4目前仅面向付费用户开放,而SuperGrok Heavy 版本的订阅费甚至高达300美元/月,远超 OpenAI Pro 200美元/月的费用。

同时,xAI 也同步开放了 Grok 4的 API 权限,支持文字与视觉输入、文字输出,定价为每百万 tokens 输入3美元、输出15美元。

拿下“人类最后的考试”最高分

了解了模型的基本信息,下面来看最直观的各个测评得分。这部分在正式发布之前,X上就陆续有博主爆料。现在答案终于揭晓。

首先是Grok 4在“人类的最后考试” HLE(Human Level Evaluation) 中的表现。这个测试包含2500个专家级问题,涵盖上百个学科,被称为超高难度基准测试。

数据显示,Grok 4无工具版本达到25.4%(也就是解决了25.4%的问题),使用工具后升至于38.6%。

Grok 4 Heavy甚至取得了44.4% 的成绩,直接大幅超越Google Gemini 2.5 Pro 26.9%的成绩。

此外,在各项主流测评榜中,Grok 4 Heavy 也几乎都拿下第一。其中GPQA得分88-89,刷新记录;在AIME25数学竞赛题中,Grok 4 Heavy 更是几乎取得满分。

官方称,Grok 4的训练量是 Grok 2的100倍,其中推理相关数据的训练量更是提升了10倍。

用工具来理解世界

xAI 表示,Grok 4的强项是“用工具来理解世界,并用来完成任务”。发布会上展示了多项具象能力,包括:

现实预测:分析 Polymarket 上的棒球比赛赔率,识别赔率误差并计算出 Alpha;

科学模拟生成:生成黑洞碰撞的 HTML 动画,调用文献检索、代码生成、图形渲染等多个工具;

主观概念理解:识别“最古怪的员工头像”,展现出对“古怪”这种模糊定义的理解;

语音生成:新增五种拟人化声音,“Eve”可即兴演唱歌剧,端到端延迟减半,语音更自然。

发布会上,xAI 还公布了接下来几个月的产品节奏:

  • 8月:专用编码模型(Grok Code)上线;
  • 9月:发布多模态代理(Multi-modal Agent);
  • 10月:发布视频生成模型(Video Generation Model);

模型之外,系统问题仍待解

然而,就在发布会前一周,Grok 聊天机器人却因一系列激进内容上了头条。

Grok 3在 X 平台连发数条反犹言论,称赞希特勒、使用“MechaHitler”作为自称,甚至被网友截图记录其对用户发布仇恨内容。

xAI 被迫紧急删除相关帖子,并发声明称“将积极处理不当内容,禁止仇恨言论”。

而这场争议正好发生在马斯克宣称 Grok “重大升级”的同一周——7月4日,他在 X 上写道,“你们应该能感受到变化”。两天后,Grok 的提示词更新为:

“不会回避政治不正确的表达,只要有证据支撑。”但在后续更新中,该提示词被移除。

这些问题的背后是 xAI 的独特路径——借助社交平台 X 上亿级用户的实时行为数据,xAI 构建起一个“内容即数据、平台即分发”的 AI 闭环生态。

自3月份完成对 X 的全资收购后,xAI 更是将 Grok 系列深度绑定在平台底层。

此次发布会上,马斯克并没有对争议问题进行直接回应。

Grok 4无疑是一项突出的技术成就。但它的发布,也再次提醒我们:

当模型在表现出博士后级别推理能力的同时,也仍可能发出极端言论,真正的问题早已不只是技术维度,而是整个训练、部署、治理机制的系统问题。

在 AI 正以每月为单位发生跃迁的时代,如何在创造力与约束之间找到边界?如何保证“聪明的大脑”不成为“失控的扩音器”?

这,或许与模型SOTA 一样值得关注。

延伸阅读
相关推荐
热点推荐
洪森又火了,这次不是因为佩通坦,而是因为他的座上宾——陈志!

洪森又火了,这次不是因为佩通坦,而是因为他的座上宾——陈志!

忠于法纪
2025-10-18 08:53:26
一人住上海希尔顿,冰箱25元可乐喝了,在楼下花3元买了一瓶塞…

一人住上海希尔顿,冰箱25元可乐喝了,在楼下花3元买了一瓶塞…

宝哥精彩赛事
2025-12-21 00:40:35
医生发现:早期脑梗不是眼模糊,而是频繁出现5个异常,要警惕!

医生发现:早期脑梗不是眼模糊,而是频繁出现5个异常,要警惕!

蜉蝣说
2025-12-19 22:15:31
美国夫妇没想到家里这些日用品竟导致他们不孕不育,全部扔掉后,奇迹发生了

美国夫妇没想到家里这些日用品竟导致他们不孕不育,全部扔掉后,奇迹发生了

英国那些事儿
2025-12-19 23:19:50
官宣!四川新增三所公办大学

官宣!四川新增三所公办大学

户外钓鱼哥阿勇
2025-12-21 00:37:55
小米SU7将太阳识别成红灯!

小米SU7将太阳识别成红灯!

电动知家
2025-12-20 12:22:10
杜兰特真怒了!甩手跺脚不满申京,死亡凝视乌度卡,沉默震耳欲聋

杜兰特真怒了!甩手跺脚不满申京,死亡凝视乌度卡,沉默震耳欲聋

嘴炮体坛
2025-12-19 17:37:59
山楂搭一宝,打通全身淤!连着喝3天,消化快,小腹也不鼓了!

山楂搭一宝,打通全身淤!连着喝3天,消化快,小腹也不鼓了!

江江食研社
2025-12-14 20:30:08
0比2脆败!狂输10比21!26岁国羽名将又被吊打,网友:没培养价值

0比2脆败!狂输10比21!26岁国羽名将又被吊打,网友:没培养价值

篮球看比赛
2025-12-20 11:21:43
好起来了,利物浦各项赛事连续6场不败+近三场全胜

好起来了,利物浦各项赛事连续6场不败+近三场全胜

懂球帝
2025-12-21 03:35:34
“数十万份”爱泼斯坦案文件将公布 美司法部:全部披露尚需数周

“数十万份”爱泼斯坦案文件将公布 美司法部:全部披露尚需数周

环球网资讯
2025-12-20 06:34:48
发现一个悲哀现象:中国的长寿老人,几乎都是子女用生命在托举

发现一个悲哀现象:中国的长寿老人,几乎都是子女用生命在托举

犀利辣椒
2025-10-16 06:22:46
C罗电影首秀,加盟《速度与激情11》剧组

C罗电影首秀,加盟《速度与激情11》剧组

澎湃新闻
2025-12-18 15:06:27
泰国为何要攻打柬埔寨,你了解这个缘由的话,换你你也打

泰国为何要攻打柬埔寨,你了解这个缘由的话,换你你也打

没有偏旁的常庆
2025-12-20 13:30:42
超越C罗!一年间从低谷到巅峰,姆巴佩是皇马唯一的希望?

超越C罗!一年间从低谷到巅峰,姆巴佩是皇马唯一的希望?

范动舍长
2025-12-21 02:42:46
日本彻底目瞪口呆,美国也完全难以置信,辽宁已成全球瞩目中心

日本彻底目瞪口呆,美国也完全难以置信,辽宁已成全球瞩目中心

小鬼头体育
2025-12-20 09:23:57
中方通告泰柬,第三国或卷入冲突,洪森已备B计划,柬军丢盔卸甲

中方通告泰柬,第三国或卷入冲突,洪森已备B计划,柬军丢盔卸甲

音乐时光的娱乐
2025-12-19 13:04:21
王少杰自宣遭重伤!球迷送祝福,官宣第3轮最佳阵容,1人创纪录

王少杰自宣遭重伤!球迷送祝福,官宣第3轮最佳阵容,1人创纪录

老吴说体育
2025-12-20 11:26:51
全程不到五六秒钟!门口的狗被套脖偷走!广东狗主人气愤报警:还蹭了我的车!

全程不到五六秒钟!门口的狗被套脖偷走!广东狗主人气愤报警:还蹭了我的车!

广东活动
2025-12-20 06:06:53
【观察】给联盟打样!森林狼献祭流打法逼出雷霆硬伤

【观察】给联盟打样!森林狼献祭流打法逼出雷霆硬伤

体坛周报
2025-12-20 16:46:36
2025-12-21 04:31:00

科技要闻

许四清:具身智能的"ChatGPT时刻"还未到来

头条要闻

台北致4人身亡嫌犯被指是"大陆籍" 蒋万安回应

头条要闻

台北致4人身亡嫌犯被指是"大陆籍" 蒋万安回应

体育要闻

我开了20年大巴,现在是一名西甲主帅

娱乐要闻

2026央视跨年晚会阵容曝光,豪华阵仗

财经要闻

求解“地方财政困难”

汽车要闻

岚图推进L3量产测试 已完成11万公里实际道路验证

态度原创

旅游
数码
艺术
公开课
军事航空

旅游要闻

30 年沉淀!盱眙天泉湖藏着冬日限定秘境,红杉雾景美到窒息

数码要闻

一屏多用:华为Mate X7 / XTs折叠屏手机“变身”智能手卡

艺术要闻

投资26亿!广州“独角兽”的总部大楼,跃出地面!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

泽连斯基:前线局势愈发艰难

无障碍浏览 进入关怀版
×