- 01 Grok 3 包括Grok 3 Reasoning 和 Grok 3 mini Reasoning。
- 02 Grok3 的推理模式加入了DeepSearch,可以检索互联网和 X 上的信息进行响应。
- 03 X 的 Premium+ 订阅者将首先获得 Grok 3。
- 04 SuperGrok 的价格为每月 30 美元或每年 300 美元。
- 05 最快一周后——Grok 将获得“语音模式”。
- 06 实行代际开源,即当下一个版本完全发布时,将开源Grok的上一个版本。
出品 | 网易科技《态度》栏目
作者 | 袁 宁
编辑 | 丁广胜
刚刚,马斯克的人工智能初创公司 xAI 通过直播的形式,实时演示展示了他口中的“地球上最聪明的人工智能”—— Grok-3。
一、依旧是大力出奇迹
首先,根据直播演示,Grok 3并非单一模型,而更像是一个模型家族。其中,轻量级版本Grok 3 mini主打实时响应,虽会牺牲部分精度,但推理速度较标准版提升5倍;Grok 3 Reasoning则采用类人脑“慢思考”机制,通过多层事实核查规避AI幻觉。
xAI高管团队详细阐述了Grok的构建历程。他们表示:“要打造顶尖AI,自建数据中心是唯一途径。由于我们想尽快推出Grok 3,时间异常紧迫。最终我们决定在短短四个月内建成数据中心。”
据xAI透露,团队仅用122天就完成了首批10万块GPU的部署并投入运行,“这堪称壮举”。
此外,他们还披露了将H100计算集群规模翻倍。“为此我们启动了二期工程,仅用92天就实现了容量倍增。所有这些算力资源都被持续用于产品迭代优化,”xAI高管说道。
二、号称超越GPT-4o、DeepSeekV3
据xAI披露,Grok 3在多项基准测试中超越GPT - 4o以及DeepSeekV3。
在评估数学问题解决能力的AIME测试中表现优异,在采用博士级物理、生物、化学试题的GPQA评估体系里同样领先。
早期版本在Chatbot Arena(一个通过用户投票对比AI模型响应质量的众包测试平台)中也展现出强劲竞争力。
现场演示环节,工程师仅用“开发结合俄罗斯方块和星际争霸玩法的2D游戏”这一自然语言指令,Grok3完成核心代码生成与调试。
此前,马斯克就曾表示,Grok3在数学逻辑测试中表现远超当前所有公开模型,包括OpenAI的GPT-4o和DeepSeek R1。例如,Grok3已能独立完成高等数学难题的推导,并计划在2025年应用于SpaceX的发射窗口优化,以提升火箭轨道计算的精度与效率。
三、可以通过 Grok 应用程序访问
“X 的 Premium+ 订阅的订阅者将首先获得 Grok 3的访问权限,我们还推出了一个名为 Super Grok 的单独订阅。”马斯克在演示中表示。目前尚不清楚 Grok 3最初是免费提供给所有用户,还是仅提供给 Premium 和 Premium+ 用户。
用户可以要求 Grok 3进行“Think”,或者利用“Big Brain” 模式进行,对于更困难的推理。xAI表示推理模型最适合数学、科学和编程相关问题。
SuperGrok 的价格为每月30美元或每年300美元,可解锁额外的推理和 DeepSearch 查询,并提供无限的图像生成功能。
马斯克表示,未来,最快一周后Grok 将获得“语音模式”。几周后,Grok 3模型将与 DeepSearch 功能一起出现在xAI企业API中。
“我们的一般方法是,当下一个版本完全发布时,我们将开源Grok的上一个版本,”马斯克表示。
此刻距离马斯克“用AI理解宇宙本质”的终极目标还有多远?
让我们等Grok 3再飞一会。