网易首页 > 网易号 > 正文 申请入驻

年费最高超2万元!20万GPU训出Grok 4,马斯克的“野心”被质疑,木头姐:20万亿美元蛋糕正被xAI和OpenAI等瓜分

0
分享至

当地时间7月9日,马斯克旗下xAI的下一代大模型Grok 4系列正式发布。

马斯克在发布会上强调,Grok 4是目前世界上最聪明的AI。他还称,Grok 4在所有学科上都超越了博士水平,没有例外。不过,Grok 4的订阅费相当昂贵,最高达3000美元/年(约合人民币21530元)。

大模型性能评估平台Artificial Analysis的全套基准测试成绩表明,Grok 4已经成为当前领先的AI模型,总成绩达到了73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus等模型。

但马斯克对于Grok 4的野心远不止于此,他此前表示,要用具有高级推理能力的Grok 4重写人类知识库,补充缺失的内容,纠正错误的知识,再基于新的“干净而准确”的知识库重新训练AI。不过,这一说法也遭到了业界人士的质疑。

被称为“木头姐”的凯西·伍德(Cathie Wood)表示,Grok虽然起步较晚,但在性能上很快追赶上o3 pro等头部模型,这得益于训练集群的合理布局。在Grok 4亮相前一周,xAI刚刚完成新一轮百亿美元融资。截至目前,xAI累计融资额已超过200亿美元。

图片来源:xAI直播发布会截图

“世界最强AI”,年费最高达3000美元

当地时间7月9日,原定于太平洋时间晚上8点的Grok 4线上发布会,延迟了几乎整整一小时。发布会开始不久,马斯克便高调宣称,“这(Grok 4)是世界上最强的AI”。

他强调,Grok 4在所有主要学科上的表现都已超越博士水平。虽然它目前尚不具备发明新理论或提出原创技术的能力,但马斯克认为,这只是时间问题。他大胆预言,Grok有望在今年年底具备发明新技术的能力,到明年则几乎能够拥有发现新物理规律的实力。

据介绍,本次发布的Grok 4系列模型包括Grok 4和Grok 4 Heavy两个版本,均为推理模型。其中,Grok 4为单智能体模型,而Grok 4 Heavy为多智能体版本,支持多个智能体并行思考,能够调用更大规模的计算资源以完成更复杂、更精密的任务。

大模型性能评估平台Artificial Analysis的全套基准测试成绩表明,Grok 4已经成为当前领先的AI大模型,总成绩达到了73分,领先于o3-pro、Gemini 2.5 Pro等模型。

图片来源:Artificial Analysis

此外,在“人类终极考试”(HLE,Humanity's Last Exam)中,Grok 4系列模型也取得了亮眼的成绩。最新版“人类终极考试”包含2500道专家级难度的问题,涵盖数学、物理等多个领域。

据xAI介绍,今年早些时候,大多数模型在该测试中的准确率得分在10%以下。而Grok 4在不使用任何工具的情况下,得分为25.4%,超过了Gemini 2.5 Pro的21.6%和o3的21%。使用工具,Grok 4的成绩进一步提升至38.6%,Grok 4 Heavy的成绩更是达到了44.4%,几乎是Gemini 2.5 Pro的两倍

图片来源:xAI直播截图

除了“人类终极考试”,Grok 4和Grok 4 Heavy在其他基准测试中同样表现突出。Grok 4系列在GPQA测试中得分均接近90%,在AIME25数学竞赛题上,Grok 4 Heavy更是取得了满分的成绩

在以高难度著称的ARC-AGI通用人工智能测试中,Grok 4在v2 Semi Private挑战中获得15.9%的分数,几乎是第二名Claude Opus 4得分的两倍。

图片来源:xAI直播截图

除了在基准测试上表现亮眼外,Grok 4语音能力也得到了增强。据介绍,Grok 4的语音模式相较于上一代,端到端的延迟更低,还支持五种音色。

目前,Grok 4已经上线,不过需要付费使用,且订阅费相当昂贵。据xAI官网,付费模式分为年付和月付两种。Grok 4的订阅年费为300美元(约合人民币2153元),而要想使用更强大的Grok 4 Heavy版本,则需要订阅SuperGrok Heavy套餐,年费高达3000美元(约合人民币21530元)

图片来源:xAI官网

下一步,xAI预计还将发布代码模型、多模态智能体以及视频生成模型。


马斯克宣称Grok 4将“重写人类知识库”被质疑

Grok 4的推出伴随着不小的争议。直播前夕,Grok 3曾因传播不当言论引发外界批评。有声音认为,xAI若不能在未来几周内提供更具结构性的模型安全机制,并公布更透明的训练方式,Grok 4或很难摆脱“高性能之下的高风险”。

对此,马斯克强调,Grok 4的目标是“成为尽可能追求真相的AI”

在马斯克看来,许多模型的训练数据本身就充斥着错误与垃圾信息。他此前宣称,要用具有高级推理能力的Grok 4重写人类知识库,补充缺失的内容,纠正错误的知识,再基于新的“干净而准确”的知识库重新训练AI。

图片来源:X

不过,有观点指出,马斯克正试图打造一个能够体现自己观点的模型。Cohere联合创始人尼克·弗罗斯特(Nick Frosst)直言,“他(马斯克)正努力打造一个反映其个人信念的模型。这肯定会让模型对用户来说更差,除非用户恰好认同他的所有信念,且只希望模型复述这些内容。”

从技术层面看,马斯克的构想或同样存在一些问题。谷歌DeepMind研究副总裁奥里奥尔·文亚尔斯(Oriol Vinyals)指出,如果从训练数据中剔除所有错误,模型可能会丧失检测和修复新错误的能力

图片来源:X

累计融资200亿美元!“木头姐”:xAI有望脱颖而出

尽管外界频有争议,但资本市场却给出了一些积极的反馈。

作为业内头号马斯克“铁粉”的网红基金经理、有着“木头姐”之称的凯西·伍德(Cathie Wood)在最新一期播客节目中表示,Grok虽然起步较晚,但在性能上很快追赶上o3 pro等头部模型,这得益于训练集群的合理布局,确保了训练的高效

据悉,Grok 4的整个训练过程就动用了全球最大的AI训练农场“巨像”超算集群,20万个GPU一起开工。

而且,Grok 4发布的前一周,xAI又完成了百亿美元融资。目前,xAI累计融资额已超过200亿美元。4月底有报道称,xAI控股公司正在与投资者洽谈,计划为其整合后的xAI及社交媒体业务X平台筹集约200亿美元资金。若交易达成,该公司估值将突破1200亿美元。

充裕的资金也为xAI的算力布局提供了坚实保障。xAI在田纳西州孟菲斯建成的超算集群“巨像”(Colossus)已经部署了20万块GPU,硬件成本高达70亿美元,功耗达300兆瓦,相当于25万户家庭的用电量。此外,xAI还计划建一个拥有100万块GPU的新设施。

凯西·伍德称,AI基础模型及相关市场规模庞大,而xAI有望在这一领域脱颖而出。她指出,借助星链等渠道,xAI获得了强大的分发优势。而随着xAI旗下模型持续迭代,X平台的信息价值也将同步提升。X可被视为一个以揭示真相为目标的信息平台,而xAI则专注于通过AI技术揭示真相。两者的协同合作,能让xAI触达更广泛的用户群体,进而形成数据优势。”

方舟投资认为,基础模型的企业市场规模将达到15万亿到20万亿美元。目前,该公司投资了xAI、OpenAI和Anthropic。凯西·伍德表示,他们相信,这三家公司在技术上处于领先地位,虽然未来可能会涌现更多专注于不同领域的语言模型并做得更好,但这三家公司目前仍具有显著的竞争优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国米免签卡塞米罗解析:利弊权衡之下,典礼中场能否在意甲重逢?

国米免签卡塞米罗解析:利弊权衡之下,典礼中场能否在意甲重逢?

宝哥爱足球
2026-03-25 22:51:46
加图索:有些球员几乎站都站不稳但是没回家,而是留在了这里

加图索:有些球员几乎站都站不稳但是没回家,而是留在了这里

懂球帝
2026-03-26 04:09:06
给机关事业单位退休人员发生活补贴合理合规,看看这些地方的做法

给机关事业单位退休人员发生活补贴合理合规,看看这些地方的做法

郭爱华追问教育
2026-03-25 06:25:09
同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

铭记历史呀
2026-03-26 11:13:56
油车车主“真情流露”:就算油价8块8,我也不想买电车!

油车车主“真情流露”:就算油价8块8,我也不想买电车!

少数派报告Report
2026-03-25 09:51:04
伦纳德:最佳阵容奖项是很棒的个人荣誉 每个人都在为之努力

伦纳德:最佳阵容奖项是很棒的个人荣誉 每个人都在为之努力

北青网-北京青年报
2026-03-26 20:39:08
老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

贱议你读史
2026-03-06 23:28:50
连乌度卡都对他放弃了!火箭锋线新援的表现看起来真是太糟糕了?

连乌度卡都对他放弃了!火箭锋线新援的表现看起来真是太糟糕了?

稻谷与小麦
2026-03-27 00:15:06
“重大转变”!外媒:特朗普改变立场,将接受民主党提议重启美国土安全部部分部门

“重大转变”!外媒:特朗普改变立场,将接受民主党提议重启美国土安全部部分部门

环球网资讯
2026-03-25 23:13:02
电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

封面新闻
2026-03-26 18:56:02
命中迪莫纳,伊朗终于等来了致命机会

命中迪莫纳,伊朗终于等来了致命机会

深度报
2026-03-25 22:44:24
一觉醒来天塌了!美国突然发现,命脉被中国控制,这仗还怎么打?

一觉醒来天塌了!美国突然发现,命脉被中国控制,这仗还怎么打?

谷盟a
2026-03-24 13:43:01
延期投入运营!停滞20年,南京“金色烂尾楼”

延期投入运营!停滞20年,南京“金色烂尾楼”

科学发掘
2026-03-26 11:24:02
谭瑞松,被判死缓

谭瑞松,被判死缓

新京报政事儿
2026-03-25 17:17:03
巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

懂球帝
2026-03-26 06:43:02
狂轰51分创纪录!中国男篮又一18岁超级新星崛起:场均39+4冲冠

狂轰51分创纪录!中国男篮又一18岁超级新星崛起:场均39+4冲冠

李喜林篮球绝杀
2025-11-17 12:10:02
2026年1-2月,中国进口了全球46%的芯片,但出口了25%的芯片

2026年1-2月,中国进口了全球46%的芯片,但出口了25%的芯片

互联网.乱侃秀
2026-03-23 10:47:40
假如台州市政治中心还在临海,台州市会是个什么样子呢?

假如台州市政治中心还在临海,台州市会是个什么样子呢?

据说说娱乐
2026-03-26 12:47:01
巴足协主席:安帅续约接近完成;不会干预内马尔是否入选问题

巴足协主席:安帅续约接近完成;不会干预内马尔是否入选问题

懂球帝
2026-03-27 03:29:06
1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

文史明鉴
2026-03-25 19:14:13
2026-03-27 03:43:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1519792文章数 2724761关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
房产
本地
健康
公开课

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版