网易首页 > 网易号 > 正文 申请入驻

Grok 4遥遥领先,但马斯克想要得更多

0
分享至

  • 这是一场停不下来的豪赌。


Grok4真的很强

近期马斯克发布了“世界上最强的AI模型”,有人直言道AGI在这里已经实现了。xAI 发布了两个版本,分别是 Grok 4 和 Grok 4 Heavy。两者都是推理模型,前者是单代理版本,Grok-4 Heavy 则是多代理版本,支持四个代理同时工作。

“Grok 4 是在所有学科里都达到研究生水平的,甚至比大多数 PhD 都强。”直播晚点 1 小时后,马斯克首先给 Grok 最新一代的水平如此定位。

除了在 SAT、GRE 考试中取得近乎完美的成绩,在「人类终极考试(HLE)」测试里,Grok 4 现在的得分比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。相比Kimi(以中文处理见长),Grok4的多语言支持更全面,尤其在英语和编码混合任务中领先。Kimi虽快,但Grok4的深度思考能力让它在科研场景中更可靠。

在编码与软件工程方面:SWE-Bench基准:Grok4约60%以上,高于GPT-4.5的54.6%、Gemini 2.5 Pro的类似分数。Claude 4虽达72.7%,但Grok4在代码分析和bug修复上更高效,识别准确率达89%。与Kimi比较,Grok4的工具使用原生集成,让它在编程自动化上更流畅,适合开发者。

xAI团队在直播中透露,Grok 4的训练量是Grok 2的100倍,在强化学习(RL)阶段投入的算力,是市面上其他任何模型的10倍以上。发布会介绍,Grok 4 的订阅费为 30 美元/月,更强大的Grok 4 Heavy 版本的费用为300 美元/月,Grok 3 维持免费开放。

马斯克认为,Grok4的更新目标是“成为尽可能追求真相的AI”。 他还设想通过该模型与类人机器人结合,在今年年底或明年发现新技术,甚至新物理定律。“这让人既兴奋又紧张,我希望自己能活着见证它的诞生。”马斯克说。

但是从目前体验过的博主评价来看,评价也是非常两极分化。有网友认为多代理投票当然准,只是又慢又烧钱。Grok 4 也并非无敌,它在图像理解和生成上仍逊于 OpenAI、Anthropic 等对手。也有人认为目前阶段AI贵才能好,像DeepseeK R1那样在后续推广之后可以实现,眼下最要紧的是推出更强的AI占领市场。


xAI大力出奇迹但维持不易

01 烧钱,马斯克是专业的

过去有一个说法如果创业者没有10亿美元就不要参与大模型创业,过去国内外总有些创业者不服,但几年下来我们看到“六小龙”的说法不再热门,国外除了OpenAI就是大厂的模型。而现如今这一门槛已经被马斯克最高拉到“月销10亿美元”。

上月外媒披露,因xAI研发尖端AI模型、构建数据中心及采购专用芯片,每月支出高达10亿美元。财务预测显示:2024年总支出预计达130亿美元,营收仅5亿美元;2026年营收或增至20亿美元,但仍难覆盖成本缺口。

xAI的财务需求主要源于其激进的硬件战略。与依赖租赁算力的竞争对手不同,xAI坚持自建基础设施。马斯克甚至宣布计划打造一台配备100万个英伟达Blackwell GPU的超级计算机,预计耗资50亿至625亿美元(约合人民币4500亿元),有望成为史上最昂贵的AI基础设施项目。

有分析师认为,马斯克正采取“烧钱换领先”的战略,试图通过大规模融资、硬件投资和快速迭代,在AI军备竞赛中超越OpenAI、Anthropic和Google DeepMind。然而,能否在资金耗尽前实现技术突破,仍是未知数。

硬件成本高企只是一方面,xAI在数据训练方面也是与众不同,采用了合成数据训练这一办法,先用AI生产数据,再用于模型训练,其成本远高于同行。其训练数据集总量约 4 万亿 tokens,使用新 MinHash-GPU 管道去重,近似重复率 <1%。

合成数据虽好但也会出现幻觉过高,数据反复利用之后会出现“以讹传讹”导致更大的错误。或许跟合成数据有关,现在Grok上面询问很多问题的时候会优先考虑马斯克的观点。大量 X 用户发布的实测结果也显示确实存在这一倾向,比如在数据科学家 Jeremy Howard 发布的一段视频中,Grok 在思维链中明确表示,正在考虑马斯克的观点。马斯克诚然是一位顶尖牛人,但在这几年也发表了不少“涉政争议言论”,以至于出现了“抵制马斯克”的活动。在大模型中过多偏向某一位人物显然会给平台带来不小竞争问题。

此外,还有一点是为多数人所忽视的。xAI负担有马斯克收购推特时产生的一些银行债务,年初xAI以全股票交易的方式收购了X(推特),对X的估值为330亿美元。同时xAI也承担了X之前的债务。

马斯克一方面已经置换了部分银行的高息债,一方面希望推过推高估值来缓解资金压力。有媒体报道xAI即将启动第三次大规模融资,目标估值直指2000亿美元。

据悉,此次融资谈判已进入初步阶段,最快将于下月启动。这将是xAI在不到两个月内的第三次大规模融资:今年6月,通过二级股票发行筹集300亿美元;7月,通过贷款和现金投资获得100亿美元资金。

当然从更大的层面来看,马斯克眼中对标的是OpenAI,既然OpenAI都能估值3000亿美元,那么xAI估值2000亿美元是只低不高。更何况马斯克一向认为xAI才是能实现真正AGI的企业,至于能值多少那就要看马斯克的吆喝了。

02 长期领先异常困难

上半年大模型发展整体上在从“规模竞赛”转向“效率与场景深耕”,涌现出来了不少在架构创新。训练效率、以及多模态能力方面具有突破性表现的模型。比如Claude4代码生成能力领先行业,支持20万token输入,成为开发者首选。Gemini2.5Pro拥有业内最长处理能力最高支持200万token上下文,当然还有DeepSeek R1在全世界旋起一阵旋风让低成本和高质量成为可能。

相反今年2月份发布的Grok3刚开始也只是各种跑分“屠榜”,但最终留下来的印象却只有大尺度的聊天内容,也并没有如马斯克所愿推动Grok用户大幅增长。所以马斯克需要整个大的,证明xAI不是明日黄花已经跟不上了。

马斯克此前在X上频频为Grok模型预热,但Grok 3.5模型最终跳票,一度引发对模型能力的怀疑。4 月底,马斯克就在 X上预告,Grok 3.5Beta版下周将上线,主打专业问答能力,特别是工程、编程类问题。但直到5月中旬,马斯克才出来回应称,“还有点粗糙,再打磨一周。”马斯克在6月27日再次提到Grok,表示在和xAI团队通宵打磨模型,进展不错,即将发布的模型被命名为Grok 4。也就是说马斯克和团队选择跳过Grok 3.5,“端”出更高的迭代版本,针对模型跳票后外界的质疑,看起来是一个很好的挽救方案。

今年新发布的模型几乎都是至少有一项或者多项跑分超过GPT模型的,这背后的道理也不难理解,那就是现如今的模型差异只有数量级没有指数级。也就是说OpenAI的大模型虽然有先发优势,但是其它几家大模型也是各有所长,你追我赶,OpenAI的 ChatGPT大模型并没有形成绝对的优势。

马化腾曾表示,AI技术和应用是条非常长的赛道,各个公司的竞争和发展更像是一场马拉松,而非短跑。暂时的领先和落后都说明不了太多的问题。

马斯克所谓的真正的完全体的AI或者AGI,更像是一种争夺AI定义权的话术。微软眼中的AGI是指能够产生1000亿美元以上的利润,并对行业产生重塑性革命。马斯克认为Grok 可能会在今年年底发现新的可用技术,明年发现新的物理学,可以深度参与特斯拉制造和擎天柱机器人的大脑设计。

但真正的AGI是什么尚有争议,何谈实现真正AGI?xAI的现状有点像马斯克过去所有创业的“复刻”版:前期疯狂烧钱、疯狂拉融资、大胆画饼,然后看能否赌中未来。然而,在当今AI战场,光有热血和资金远远不够,还得有真正过硬的产品和落地能力。

03 马斯克打算怎么做

虽然此次Grok 4短暂领先了,但今年夏天OpenAI也将发布其最新旗舰模型GPT-5,这一领先优势能保持多久并不确定。海外大厂对于AI模型也是势在必得,微软、亚马逊、谷歌和Meta四大巨头去年的总资本支出为2300亿美元,2025年这些公司的投资计划则高达3200亿美元,在财报中管理层纷纷表示,计划增加对AI技术和数据中心建设的投资。

那么就要考虑马斯克的优势是什么了,是有钱吗?当然不是,几家大厂也不遑多让,马斯克的优势在于由特斯拉和X构建起来的商业帝国。上次收购X为xAI带来两大核心优势:数据资源,X平台的海量用户帖子和机器人生成内容,可直接用于训练Grok,省去高昂的外部数据采购成本;算力共享,X此前采购的AI芯片集群,现由xAI调配使用,进一步降低硬件投入。

xAI向投资者承诺,公司将于2027年实现盈利。摩根士丹利预测,其2029年收入或突破130亿美元。若成真,xAI将比竞争对手OpenAI提前两年迈入盈利阶段——后者预计最早2029年才能实现正现金流。

不过,这一乐观预测建立在多重假设之上:Grok快速普及并深度集成至X平台;成功开拓企业级AI工具市场;与特斯拉的自动驾驶等业务协同落地。目前,xAI的营收几乎全部依赖X Premium订阅服务,2024年预期收入仅5亿美元,远不足以覆盖运营成本。相比之下:OpenAI 2024年预计营收127亿美元,ChatGPT用户超1亿,并深度嵌入微软生态,而Grok活跃用户只有两千万人;Anthropic等对手也在加速商业化。


写在最后

马斯克又像过去一样开启新一场豪赌,高杠杆、高风险、高回报。xAI如果按照基本面来分析那无疑是惨淡的,应该停止疯狂烧钱,但谁让它是马斯克的xAI,关于未来的宏大构想似乎又可信了。

参考资料:

马斯克发布“地球最强AI模型” 来源:CSDN

xAI每月狂烧10亿美金? 来源:深网腾讯新闻

马斯克曝光的Grok 4,学会了第一性原理 来源:极客公园

马斯克新发布全球最强模型含金量如何 来源:第一财经

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
医保大变革!4月1日执行,取消备案、全家共济、药店可报销

医保大变革!4月1日执行,取消备案、全家共济、药店可报销

复转这些年
2026-03-26 09:27:58
教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

今朝牛马
2026-03-26 20:22:18
张本智和回击中国网友:我是自愿加入日本籍的,凭啥让我滚出四川?哭诉:那是我老家

张本智和回击中国网友:我是自愿加入日本籍的,凭啥让我滚出四川?哭诉:那是我老家

乒乓网国球汇
2026-03-27 00:03:40
日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

知法而形
2026-03-25 18:38:56
一觉醒来,大量美军逃匿!伊朗全力搜捕!美议长透露重要信息

一觉醒来,大量美军逃匿!伊朗全力搜捕!美议长透露重要信息

安安说
2026-03-26 13:00:12
周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

爆角追踪
2026-03-26 08:56:24
郭正亮直播突发脸歪嘴斜,连夜就医引全网担忧:别像张雪峰那样拼

郭正亮直播突发脸歪嘴斜,连夜就医引全网担忧:别像张雪峰那样拼

行者聊官
2026-03-26 11:56:25
商务部:中方将自5月1日起对所有非洲建交国全面实施零关税举措

商务部:中方将自5月1日起对所有非洲建交国全面实施零关税举措

界面新闻
2026-03-26 16:08:24
我国航空发动机领域著名专家严红病逝,年仅57岁

我国航空发动机领域著名专家严红病逝,年仅57岁

澎湃新闻
2026-03-26 11:40:26
宋喆出狱后现状:县城搬菜月入三千,前妻杨慧横店开公司年入千万

宋喆出狱后现状:县城搬菜月入三千,前妻杨慧横店开公司年入千万

一盅情怀
2026-03-26 14:47:59
广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

大象新闻
2026-03-26 13:53:02
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
罗技中国致歉

罗技中国致歉

界面新闻
2026-03-26 23:25:51
砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

娱乐圈的笔娱君
2026-03-26 12:15:32
中共中央批准,开除刘慧党籍

中共中央批准,开除刘慧党籍

新京报
2026-03-26 17:14:17
翻到张雪峰2016年婚纱照,瞬间看哭了!

翻到张雪峰2016年婚纱照,瞬间看哭了!

魔都姐姐杂谈
2026-03-26 22:06:50
岛上设陷阱,海上堵两头!伊朗布下天罗地网,曼德海峡将成美国经济新“放血点”?

岛上设陷阱,海上堵两头!伊朗布下天罗地网,曼德海峡将成美国经济新“放血点”?

红星新闻
2026-03-26 18:34:31
勇敢发声!科威特记者联合国痛批“反以仪式”

勇敢发声!科威特记者联合国痛批“反以仪式”

Nee看
2026-03-26 14:15:21
联大通过决议,宣布“最严重反人类罪”

联大通过决议,宣布“最严重反人类罪”

澎湃新闻
2026-03-26 11:03:06
2026-03-27 03:48:49
首席商业评论 incentive-icons
首席商业评论
深究商业逻辑,助力价值成长。
7353文章数 100975关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
教育
房产
手机
公开课

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版