网易首页 > 网易科技 > IT业界 > 正文

马斯克发布Grok 4大模型,最贵版本月费2000元

0
分享至
核心提示
  • 01 马斯克旗下的xAI公司发布了其最新的旗舰AI模型Grok 4和性能更强的Grok 4 Heavy。同时,xAI还推出了一项名为SuperGrok Heavy的全新AI订阅计划,定价为每月300美元,订阅者可抢先体验新模型及功能。
  • 02 xAI称,Grok 4在多项基准测试中展现了领先水平,其得分在“人类最后一道考题”和ARC-AGI-2测试中超过了谷歌Gemini和OpenAI Claude等竞品。
  • 03 xAI称,Grok 4具备超人水平的推理能力、深度集成的工具使用、增强的实时网络访问以及对互联网文化的理解力,并最终目标是能通过人形机器人与物理世界互动。

7月10日消息,北京时间今日中午,在比原定时间推迟一小时后,埃隆·马斯克 (Elon Musk) 旗下xAI发布了其最新的旗舰AI模型Grok 4,并推出了一项全新的AI订阅计划——每月300美元的SuperGrok Heavy。

Grok是xAI用以对标OpenAI的ChatGPT和谷歌Gemini等模型的产品,能够分析图像并回答问题。

外界对Grok 4的期望很高。xAI这款最新的AI模型将直接对垒OpenAI即将推出的GPT-5,后者预计将在今年夏末发布。

“对于学术问题,Grok 4在每个学科上都超过了博士水平,无一例外,”埃隆·马斯克在直播中说道。“它有时可能缺乏常识,也尚未发明新技术或发现新物理学,但这只是时间问题。”

xAI于周三发布了两款模型:Grok 4和Grok 4 Heavy——后者是该公司的“多智能体版本”,性能更强。

Grok 4 特性如下:

•【超凡的推理与解决能力】Grok4在xAI的Colossus超级计算机上进行了训练,其训练量是Grok2的100倍。在强化学习(RL)方面,它投入的计算量比任何其他模型都多出10倍。据称,该模型能够从第一性原理出发进行思考并纠正自身错误,在多项推理基准测试中表现出色。在通常用于测试人们推理能力的基准测试中,Grok4达到了博士水平。其多智能体版本Grok4Heavy在美国数学邀请赛(AIME25)中取得了满分。Grok4在所有学科的学术问题上都表现出优于博士水平的能力。xAI中强调Grok4的推理能力已达到超人水平。

•【为开发者而生的编码变体】xAI团队目前正在大力开发编码模型。他们最近训练了一个专门的编码模型,该模型将既快速又智能,并计划在未来几周内与开发者分享。

•【集成的工具使用与现实交互】Grok4将工具使用能力深度融入了训练中,这与Grok3仅依靠泛化能力不同,从而显著提升了模型使用这些工具的能力,解决了前代在工具使用上“更弱且不可靠”的问题。未来,Grok最终将能够通过人形机器人(如Optimus)与物理世界互动,从而能够制定假设并验证其真伪。

•【领先的语音交互体验】Grok4的语音功能在端到端延迟速度上提升了2倍(延迟缩短了一半),提供了更灵敏、自然、流畅且不易打断的对话体验。新的声音模型具有卓越的自然度和韵律。

•【增强的实时网络访问】Grok4具备强大的工具使用能力,能够访问网络并实时抓取数据。Grok可以在聊天过程中提供最新信息,而无需用户打开独立的标签页或浏览器。与Grok3相比,Grok4的工具使用能力更为原生和可靠。

•【对互联网文化的理解能力】Grok4能够理解主观且带有幽默感的问题,例如判断“最奇怪的资料照片”,这需要其理解问题的隐含意义并从互联网上找到对应的信息和判断。其语音模式下的Eve也能进行富有感情和幽默感的对话。

xAI声称,Grok 4在多项基准测试中展现了前沿水准,其中包括“人类最后一道考题” (Humanity’s Last Exam),这个考试通过数千个关于数学、人文学科和自然科学等主题的众包问题,来衡量AI的能力。据xAI称,Grok 4在不使用“工具”的情况下,在该测试中得分率为25.4%,超过了谷歌Gemini 2.5 Pro的21.6%,以及OpenAI的o3 (high)的21%。

xAI还声称,配备“工具”的Grok 4 Heavy取得了44.4%的高分,超过了同样使用工具、得分为26.9%的Gemini 2.5 Pro。

此外,非营利组织Arc Prize表示,Grok在他们的ARC-AGI-2测试中取得了新的SOTA(State-of-the-Art,即当前最佳水平)分数——这是另一个高难度基准,由类似拼图的难题组成,需要AI识别视觉模式——得分率为16.2%。这几乎是排名第二的商业AI模型Claude Opus 4得分的两倍。

除了Grok 4和Grok 4 Heavy,xAI还推出了其迄今最昂贵的AI订阅计划、名为SuperGrok Heavy的每月300美元的订阅服务。该计划的订阅者将能抢先体验Grok 4 Heavy,并优先使用新功能。此计划与其他主要AI提供商如OpenAI、谷歌和Anthropic推出的超高端会员服务类似,但xAI目前提供了其中最昂贵的订阅选项。

SuperGrok Heavy的订阅者或许能提前体验到xAI计划在未来数月推出的一些新产品。该公司周三表示,一款AI编码模型将于8月问世,一个多模态智能体将于9月推出,而视频生成模型则定于10月。

xAI正通过其API发布Grok 4,以吸引开发者基于该模型构建应用。该公司提到,其企业业务部门成立仅两个月,但计划与各大超大规模云服务商合作,通过他们的云平台提供Grok。

尽管Grok在基准测试中表现出了领先水平,但当xAI试图将Grok作为ChatGPT、Claude和Gemini的真正竞争者向企业推销时,它可能很难摆脱近期的这些负面事件。企业是否准备好连同其所有缺陷一并接纳Grok,仍有待观察。

Grok 4的发布,恰逢马斯克旗下公司经历动荡的一周。周三早些时候,在X公司任职约两年后,其首席执行官琳达·亚卡里诺 (Linda Yaccarino) 宣布辞职。目前,X尚未公布她的继任者。

巧合的是,雅卡里诺的离职,发生于几天前Grok的官方自动化X账号曝出丑闻之后:该账号在回复用户时发表了攻击性帖子。xAI不得不短暂限制该Grok账号,并删除了这些内容。

马斯克和xAI的领导层基本上回避了对此事件的讨论,而是将焦点放在了Grok 4的性能和能力上。(易句)

(本文由AI翻译,网易编辑负责校对)

延伸阅读
相关推荐
热点推荐
中国啤酒一哥的总部“搬家”深圳,新大楼形如啤酒罐!

中国啤酒一哥的总部“搬家”深圳,新大楼形如啤酒罐!

GA环球建筑
2025-12-15 19:50:23
网红冯提莫直播间换装被封,有网友质疑系直播“擦边”,工作人员回应:封禁10分钟后又再播了

网红冯提莫直播间换装被封,有网友质疑系直播“擦边”,工作人员回应:封禁10分钟后又再播了

扬子晚报
2025-12-15 22:48:32
43岁男子刺死父亲一审获刑7年,称儿时母亲遭父亲欺负自杀,父子积怨已久

43岁男子刺死父亲一审获刑7年,称儿时母亲遭父亲欺负自杀,父子积怨已久

红星新闻
2025-12-15 19:53:31
钱再多有啥用?巩俐带77岁老公回北京,雪中骑一辆车,笑容藏不住

钱再多有啥用?巩俐带77岁老公回北京,雪中骑一辆车,笑容藏不住

洲洲影视娱评
2025-12-13 19:57:10
常规时间狂砍40分!小牛状元爆发了,真没选错

常规时间狂砍40分!小牛状元爆发了,真没选错

德译洋洋
2025-12-16 12:51:24
泽连斯基最大化利用了筹码;欧尔班成众矢之的

泽连斯基最大化利用了筹码;欧尔班成众矢之的

寰宇大观察
2025-12-15 15:47:36
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
金正恩公开承认:朝鲜士兵在俄罗斯牺牲,120天海外行动细节曝光

金正恩公开承认:朝鲜士兵在俄罗斯牺牲,120天海外行动细节曝光

策略述
2025-12-15 21:23:55
湖北郧西通报3名员工聚餐饮酒中毒:食堂误将工业酒精当白酒,1人死亡2人救治中

湖北郧西通报3名员工聚餐饮酒中毒:食堂误将工业酒精当白酒,1人死亡2人救治中

界面新闻
2025-12-15 21:56:31
许何曝母亲何晴临终场景:昏迷多日终于清醒,握他的手问他好不好

许何曝母亲何晴临终场景:昏迷多日终于清醒,握他的手问他好不好

娱乐圈圈圆
2025-12-15 20:19:18
猪肚再次成为讨论对象!研究发现:常吃猪肚,可能会获取3大益处

猪肚再次成为讨论对象!研究发现:常吃猪肚,可能会获取3大益处

九哥聊军事
2025-12-15 21:18:17
130万大军滞留国外回不了家?国库告急养不起,杨勇上将连夜呈上一份绝密方案,毛主席看后只批了两个字:同意

130万大军滞留国外回不了家?国库告急养不起,杨勇上将连夜呈上一份绝密方案,毛主席看后只批了两个字:同意

文史明鉴
2025-12-14 19:06:21
天上人间付红琼被执行死刑,押法场时高喊:这辈子值了

天上人间付红琼被执行死刑,押法场时高喊:这辈子值了

纪实录
2024-11-07 22:02:36
美国著名演员去世!

美国著名演员去世!

下水道男孩
2025-12-14 23:33:39
前11月北京市查处违反中央八项规定精神问题1284起

前11月北京市查处违反中央八项规定精神问题1284起

新京报
2025-12-16 08:48:07
心态崩盘!乌度卡和申京怒喷裁判,火箭队被掘金队拉开比分

心态崩盘!乌度卡和申京怒喷裁判,火箭队被掘金队拉开比分

章眽八卦
2025-12-16 12:08:11
中俄通婚剧增,若不了解俄罗斯女性生理缺陷,婚后可能会很痛苦。

中俄通婚剧增,若不了解俄罗斯女性生理缺陷,婚后可能会很痛苦。

百态人间
2025-12-14 05:15:04
特斯拉市值增超3700亿元,马斯克身家跃升至6770亿美元!加密货币全网超19万人爆仓,47亿元蒸发!美联储,大消息

特斯拉市值增超3700亿元,马斯克身家跃升至6770亿美元!加密货币全网超19万人爆仓,47亿元蒸发!美联储,大消息

每日经济新闻
2025-12-16 06:19:04
演员何晴家庭背景曝光!父亲是江山县体委干部,母亲是湘西苗族人

演员何晴家庭背景曝光!父亲是江山县体委干部,母亲是湘西苗族人

小徐讲八卦
2025-12-15 09:16:53
中央定调!养老保险缴费年限将延长,灵活就业缴纳20年社保划算吗

中央定调!养老保险缴费年限将延长,灵活就业缴纳20年社保划算吗

甜柠聊史
2025-12-16 10:33:29
2025-12-16 13:23:00

科技要闻

马斯克彻底放手!特斯拉股价一夜狂欢

头条要闻

牛弹琴:泰柬往死里打让世界有3个没想到 中国也很头疼

头条要闻

牛弹琴:泰柬往死里打让世界有3个没想到 中国也很头疼

体育要闻

杨瀚森18+10首次两双 关键攻防统治G联赛

娱乐要闻

温峥嵘回应卖面膜争议,已报警刑事立案

财经要闻

浙金中心暴雷始末:祥源控股设计的骗局?

汽车要闻

智联网功能升级 方程豹钛3迎第四次OTA升级

态度原创

教育
房产
旅游
数码
公开课

教育要闻

全国高校毕业生薪资排名:前三名清华交大北大,央财竟然超北邮

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

旅游要闻

【外眼看云南】冬日暖阳中的古城慢时光,缅甸、泰国博主镜头里的大理"风花雪月"治愈之旅

数码要闻

RTX 5070 Ti一周内狂涨价600+元!RTX 5070也在涨

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×