网易首页 > 网易号 > 正文 申请入驻

Grok 4遥遥领先,但马斯克想要得更多

0
分享至

  • 这是一场停不下来的豪赌。


Grok4真的很强

近期马斯克发布了“世界上最强的AI模型”,有人直言道AGI在这里已经实现了。xAI 发布了两个版本,分别是 Grok 4 和 Grok 4 Heavy。两者都是推理模型,前者是单代理版本,Grok-4 Heavy 则是多代理版本,支持四个代理同时工作。

“Grok 4 是在所有学科里都达到研究生水平的,甚至比大多数 PhD 都强。”直播晚点 1 小时后,马斯克首先给 Grok 最新一代的水平如此定位。

除了在 SAT、GRE 考试中取得近乎完美的成绩,在「人类终极考试(HLE)」测试里,Grok 4 现在的得分比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。相比Kimi(以中文处理见长),Grok4的多语言支持更全面,尤其在英语和编码混合任务中领先。Kimi虽快,但Grok4的深度思考能力让它在科研场景中更可靠。

在编码与软件工程方面:SWE-Bench基准:Grok4约60%以上,高于GPT-4.5的54.6%、Gemini 2.5 Pro的类似分数。Claude 4虽达72.7%,但Grok4在代码分析和bug修复上更高效,识别准确率达89%。与Kimi比较,Grok4的工具使用原生集成,让它在编程自动化上更流畅,适合开发者。

xAI团队在直播中透露,Grok 4的训练量是Grok 2的100倍,在强化学习(RL)阶段投入的算力,是市面上其他任何模型的10倍以上。发布会介绍,Grok 4 的订阅费为 30 美元/月,更强大的Grok 4 Heavy 版本的费用为300 美元/月,Grok 3 维持免费开放。

马斯克认为,Grok4的更新目标是“成为尽可能追求真相的AI”。 他还设想通过该模型与类人机器人结合,在今年年底或明年发现新技术,甚至新物理定律。“这让人既兴奋又紧张,我希望自己能活着见证它的诞生。”马斯克说。

但是从目前体验过的博主评价来看,评价也是非常两极分化。有网友认为多代理投票当然准,只是又慢又烧钱。Grok 4 也并非无敌,它在图像理解和生成上仍逊于 OpenAI、Anthropic 等对手。也有人认为目前阶段AI贵才能好,像DeepseeK R1那样在后续推广之后可以实现,眼下最要紧的是推出更强的AI占领市场。


xAI大力出奇迹但维持不易

01 烧钱,马斯克是专业的

过去有一个说法如果创业者没有10亿美元就不要参与大模型创业,过去国内外总有些创业者不服,但几年下来我们看到“六小龙”的说法不再热门,国外除了OpenAI就是大厂的模型。而现如今这一门槛已经被马斯克最高拉到“月销10亿美元”。

上月外媒披露,因xAI研发尖端AI模型、构建数据中心及采购专用芯片,每月支出高达10亿美元。财务预测显示:2024年总支出预计达130亿美元,营收仅5亿美元;2026年营收或增至20亿美元,但仍难覆盖成本缺口。

xAI的财务需求主要源于其激进的硬件战略。与依赖租赁算力的竞争对手不同,xAI坚持自建基础设施。马斯克甚至宣布计划打造一台配备100万个英伟达Blackwell GPU的超级计算机,预计耗资50亿至625亿美元(约合人民币4500亿元),有望成为史上最昂贵的AI基础设施项目。

有分析师认为,马斯克正采取“烧钱换领先”的战略,试图通过大规模融资、硬件投资和快速迭代,在AI军备竞赛中超越OpenAI、Anthropic和Google DeepMind。然而,能否在资金耗尽前实现技术突破,仍是未知数。

硬件成本高企只是一方面,xAI在数据训练方面也是与众不同,采用了合成数据训练这一办法,先用AI生产数据,再用于模型训练,其成本远高于同行。其训练数据集总量约 4 万亿 tokens,使用新 MinHash-GPU 管道去重,近似重复率 <1%。

合成数据虽好但也会出现幻觉过高,数据反复利用之后会出现“以讹传讹”导致更大的错误。或许跟合成数据有关,现在Grok上面询问很多问题的时候会优先考虑马斯克的观点。大量 X 用户发布的实测结果也显示确实存在这一倾向,比如在数据科学家 Jeremy Howard 发布的一段视频中,Grok 在思维链中明确表示,正在考虑马斯克的观点。马斯克诚然是一位顶尖牛人,但在这几年也发表了不少“涉政争议言论”,以至于出现了“抵制马斯克”的活动。在大模型中过多偏向某一位人物显然会给平台带来不小竞争问题。

此外,还有一点是为多数人所忽视的。xAI负担有马斯克收购推特时产生的一些银行债务,年初xAI以全股票交易的方式收购了X(推特),对X的估值为330亿美元。同时xAI也承担了X之前的债务。

马斯克一方面已经置换了部分银行的高息债,一方面希望推过推高估值来缓解资金压力。有媒体报道xAI即将启动第三次大规模融资,目标估值直指2000亿美元。

据悉,此次融资谈判已进入初步阶段,最快将于下月启动。这将是xAI在不到两个月内的第三次大规模融资:今年6月,通过二级股票发行筹集300亿美元;7月,通过贷款和现金投资获得100亿美元资金。

当然从更大的层面来看,马斯克眼中对标的是OpenAI,既然OpenAI都能估值3000亿美元,那么xAI估值2000亿美元是只低不高。更何况马斯克一向认为xAI才是能实现真正AGI的企业,至于能值多少那就要看马斯克的吆喝了。

02 长期领先异常困难

上半年大模型发展整体上在从“规模竞赛”转向“效率与场景深耕”,涌现出来了不少在架构创新。训练效率、以及多模态能力方面具有突破性表现的模型。比如Claude4代码生成能力领先行业,支持20万token输入,成为开发者首选。Gemini2.5Pro拥有业内最长处理能力最高支持200万token上下文,当然还有DeepSeek R1在全世界旋起一阵旋风让低成本和高质量成为可能。

相反今年2月份发布的Grok3刚开始也只是各种跑分“屠榜”,但最终留下来的印象却只有大尺度的聊天内容,也并没有如马斯克所愿推动Grok用户大幅增长。所以马斯克需要整个大的,证明xAI不是明日黄花已经跟不上了。

马斯克此前在X上频频为Grok模型预热,但Grok 3.5模型最终跳票,一度引发对模型能力的怀疑。4 月底,马斯克就在 X上预告,Grok 3.5Beta版下周将上线,主打专业问答能力,特别是工程、编程类问题。但直到5月中旬,马斯克才出来回应称,“还有点粗糙,再打磨一周。”马斯克在6月27日再次提到Grok,表示在和xAI团队通宵打磨模型,进展不错,即将发布的模型被命名为Grok 4。也就是说马斯克和团队选择跳过Grok 3.5,“端”出更高的迭代版本,针对模型跳票后外界的质疑,看起来是一个很好的挽救方案。

今年新发布的模型几乎都是至少有一项或者多项跑分超过GPT模型的,这背后的道理也不难理解,那就是现如今的模型差异只有数量级没有指数级。也就是说OpenAI的大模型虽然有先发优势,但是其它几家大模型也是各有所长,你追我赶,OpenAI的 ChatGPT大模型并没有形成绝对的优势。

马化腾曾表示,AI技术和应用是条非常长的赛道,各个公司的竞争和发展更像是一场马拉松,而非短跑。暂时的领先和落后都说明不了太多的问题。

马斯克所谓的真正的完全体的AI或者AGI,更像是一种争夺AI定义权的话术。微软眼中的AGI是指能够产生1000亿美元以上的利润,并对行业产生重塑性革命。马斯克认为Grok 可能会在今年年底发现新的可用技术,明年发现新的物理学,可以深度参与特斯拉制造和擎天柱机器人的大脑设计。

但真正的AGI是什么尚有争议,何谈实现真正AGI?xAI的现状有点像马斯克过去所有创业的“复刻”版:前期疯狂烧钱、疯狂拉融资、大胆画饼,然后看能否赌中未来。然而,在当今AI战场,光有热血和资金远远不够,还得有真正过硬的产品和落地能力。

03 马斯克打算怎么做

虽然此次Grok 4短暂领先了,但今年夏天OpenAI也将发布其最新旗舰模型GPT-5,这一领先优势能保持多久并不确定。海外大厂对于AI模型也是势在必得,微软、亚马逊、谷歌和Meta四大巨头去年的总资本支出为2300亿美元,2025年这些公司的投资计划则高达3200亿美元,在财报中管理层纷纷表示,计划增加对AI技术和数据中心建设的投资。

那么就要考虑马斯克的优势是什么了,是有钱吗?当然不是,几家大厂也不遑多让,马斯克的优势在于由特斯拉和X构建起来的商业帝国。上次收购X为xAI带来两大核心优势:数据资源,X平台的海量用户帖子和机器人生成内容,可直接用于训练Grok,省去高昂的外部数据采购成本;算力共享,X此前采购的AI芯片集群,现由xAI调配使用,进一步降低硬件投入。

xAI向投资者承诺,公司将于2027年实现盈利。摩根士丹利预测,其2029年收入或突破130亿美元。若成真,xAI将比竞争对手OpenAI提前两年迈入盈利阶段——后者预计最早2029年才能实现正现金流。

不过,这一乐观预测建立在多重假设之上:Grok快速普及并深度集成至X平台;成功开拓企业级AI工具市场;与特斯拉的自动驾驶等业务协同落地。目前,xAI的营收几乎全部依赖X Premium订阅服务,2024年预期收入仅5亿美元,远不足以覆盖运营成本。相比之下:OpenAI 2024年预计营收127亿美元,ChatGPT用户超1亿,并深度嵌入微软生态,而Grok活跃用户只有两千万人;Anthropic等对手也在加速商业化。


写在最后

马斯克又像过去一样开启新一场豪赌,高杠杆、高风险、高回报。xAI如果按照基本面来分析那无疑是惨淡的,应该停止疯狂烧钱,但谁让它是马斯克的xAI,关于未来的宏大构想似乎又可信了。

参考资料:

马斯克发布“地球最强AI模型” 来源:CSDN

xAI每月狂烧10亿美金? 来源:深网腾讯新闻

马斯克曝光的Grok 4,学会了第一性原理 来源:极客公园

马斯克新发布全球最强模型含金量如何 来源:第一财经

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈岚任四川省委宣传部副部长、省委网信办主任

陈岚任四川省委宣传部副部长、省委网信办主任

汲古知新
2026-02-24 23:25:54
伊朗外长:希望在最短时间内与美国达成公平协议

伊朗外长:希望在最短时间内与美国达成公平协议

每日经济新闻
2026-02-25 07:26:59
龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

她时尚丫
2026-02-17 22:41:30
Tesla特斯拉(春招)招聘公告!

Tesla特斯拉(春招)招聘公告!

实习僧
2026-02-25 14:40:30
湖北精神病院骗保案曝光,23 人落马,看完太气人!

湖北精神病院骗保案曝光,23 人落马,看完太气人!

老特有话说
2026-02-25 22:48:27
第3次击败TOP20!吴易昺双抢七挑落世界第12,强势跻身16强

第3次击败TOP20!吴易昺双抢七挑落世界第12,强势跻身16强

全景体育V
2026-02-25 14:13:49
超过这个年龄,精子会断崖式衰老,且会传给下一代!

超过这个年龄,精子会断崖式衰老,且会传给下一代!

果壳
2026-02-24 20:12:03
欧冠16强出炉:意甲保独苗,明晚抽签静候豪门大战

欧冠16强出炉:意甲保独苗,明晚抽签静候豪门大战

体坛周报
2026-02-26 07:23:12
感谢不演之恩,《镖人》她明明是“替补”,最后却演成经典!

感谢不演之恩,《镖人》她明明是“替补”,最后却演成经典!

糊咖娱乐
2026-02-25 16:51:13
秦岚在大街上被偶遇,身材前凸后翘,不得不说,魏大勋眼光真好

秦岚在大街上被偶遇,身材前凸后翘,不得不说,魏大勋眼光真好

老吴教育课堂
2026-02-25 02:43:37
彭博社消息,Unity考虑出售中国业务,估值或超10亿美元

彭博社消息,Unity考虑出售中国业务,估值或超10亿美元

游戏干线
2026-02-25 22:04:54
《镖人》看懂知世郎的过往,才知老莫为何要刀马护送知世郎回长安

《镖人》看懂知世郎的过往,才知老莫为何要刀马护送知世郎回长安

小七追剧站
2026-02-20 22:02:24
再也不小瞧“空气炸锅”了!果然,只要思路打开,就好用到离谱

再也不小瞧“空气炸锅”了!果然,只要思路打开,就好用到离谱

美家指南
2026-02-24 15:48:11
俄罗斯警告:核大国可能发生直接冲突

俄罗斯警告:核大国可能发生直接冲突

参考消息
2026-02-25 15:19:05
纱仓真菜、天使萌、桃乃木香奈、相泽南、水川润 日美女明星动态

纱仓真菜、天使萌、桃乃木香奈、相泽南、水川润 日美女明星动态

鹿鹿156
2026-02-26 02:15:43
闫学晶被曝新动态,求赵本山拉一把被拒,老赵当年就看出来了

闫学晶被曝新动态,求赵本山拉一把被拒,老赵当年就看出来了

非常先生看娱乐
2026-02-06 17:35:21
若遭降级,热刺恐面临19名球员离队的巨变

若遭降级,热刺恐面临19名球员离队的巨变

星耀国际足坛
2026-02-25 23:16:59
荷兰彻底傻眼!中国子公司宣布:正式换国内供应商,不再合作!

荷兰彻底傻眼!中国子公司宣布:正式换国内供应商,不再合作!

小陆搞笑日常
2026-02-26 04:59:16
2026年动迁大戏上演,普陀、静安成了主角,徐汇哑火了?

2026年动迁大戏上演,普陀、静安成了主角,徐汇哑火了?

环线房产咨询
2026-02-25 12:03:29
本科已严重饱和的五个专业,1、临床医学,2、法学,3、计算机

本科已严重饱和的五个专业,1、临床医学,2、法学,3、计算机

明智家庭教育
2026-01-31 10:29:14
2026-02-26 08:44:49
首席商业评论 incentive-icons
首席商业评论
深究商业逻辑,助力价值成长。
7328文章数 100950关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

亲子
艺术
本地
时尚
房产

亲子要闻

育儿思路 双语学习

艺术要闻

一幅眼花缭乱草书:从书法创作到青少年书法教育的思考

本地新闻

津南好·四时总相宜

伦敦时装周|2026秋冬流行趋势早知道

房产要闻

海南楼市春节热销地图曝光!三亚、陵水又杀疯了!

无障碍浏览 进入关怀版