网易首页 > 网易号 > 正文 申请入驻

反击梁文锋,马斯克的“半成品”够格吗?

0
分享至



起猛了,差点分不清马斯克和奥特曼。

北京时间2月18日中午,马斯克旗下人工智能公司xAI搞了一场直播,进行新一代模型Grok 3的介绍和现场演示。



气氛很轻松,马斯克和xAI团队的三名成员,围坐在一张小桌前,背后是用来展示的大屏幕。不管是这个形式,还是这个画面,都让人联想到OpenAI。只不过xAI走的是暗黑极客风,OpenAI则是温馨家居风。



这倒也不奇怪,毕竟马斯克从创办xAI伊始,就死死盯住OpenAI的背影狂追。

而看起来小小的发布会,在一个小时的时间里实则杀机满满:

*Grok 3在多项基准测试中,击败了竞争对手,包括DeepSeek的V3和OpenAI的GPT-4o;

*推出名为“DeepSearch”的智能搜索引擎,由推理模型Grok 3 Reasoning和Grok 3 mini Reasoning驱动;

*Grok 3将显示详细的思维链,和DeepSeek R1和OpenAI的o3-mini相似;

*将“尽快”加入语音模式。

xAI的发展迅猛,2023年7月成立,11月就发布了首个大模型Grok。次年5月,xAI完成60亿美元B轮融资,12月又宣布完成60亿美元C轮融资,估值超过400亿美元。

从去年9月,xAI建成包含10万张英伟达H100的集群Colossus开始,外界就在期待xAI的下一代大模型的发布。从去年年底,“跳票”到今年年初,外界又多了新的变数,一边是OpenAI开启算力基础建设的“星际之门”,一边是DeepSeek掀起低成本推理模型热潮,Grok 3的发布顶着巨大的压力。

在Grok 3发布之前,马斯克做足了预热,称其“聪明得吓人”“(是)最聪明的AI”,但从发布会来看,xAI尚未结束追赶态。马斯克的AI路,还未到一马平川之境。

就在马斯克鼓足热情发布Grok 3之际,奥特曼也暗戳戳来抢热度,在X(推特前身)上发起投票,询问网友对于OpenAI下一个开源项目的看法,是做一个相当小但仍需要在GPU上运行的o3-mini级模型更有用,还是做一个能做得最好的手机大小的端侧模型更有用。

超3万名参与投票的网友中,超过一半的票投向了端侧模型。毕竟,赶在奥特曼前面,大热的DeepSeek,已经抢先掀起了一波在智能手机和新能源汽车等终端,部署端侧模型的浪潮。

Grok 3发布会之前,外界也很关心特斯拉汽车是否会接入Grok。1月初,马斯克曾经给出肯定的回答,称Grok会登陆特斯拉。但可惜的是,本次发布会中,马斯克并未回应特斯拉接入Grok的相关问题。

A

发布会一开始,xAI就着重谈了谈Grok 3背后的Colossus超算。

该超算包含10万张英伟达H100芯片,建立仅用三个月,是马斯克的一大“伟业”。连黄仁勋都表示,这堪称“奇迹”。

在发布会上,xAI表示训练进行到第92天时,集群的规模拓展到了20万张芯片。这是该消息首次被披露。



得益于新计算集群,马斯克在直播演讲表示:“Grok 3 的能力比 Grok 2 高出10倍。”



据xAI介绍,Grok 3 在包括 AIME(评估模型在数学问题样本上的表现)和 GPQA(使用博士级物理、生物和化学问题评估模型)在内的基准测试中胜过 GPT-4o。此外,Grok 3的早期版本在Chatbot Arena中也获得了有竞争力的分数,是有史以来第一个突破1400分的模型。这是一项众包测试,让不同的 AI 模型相互竞争,并让用户投票选出他们喜欢的答案。



准确地说,Grok 3是一系列模型。

Grok 3的较小版本Grok 3 mini可以更快地回答问题,但会牺牲一些准确性。

另外两个版本 Grok 3 Reasoning和Grok 3 mini Reasoning,旨在仔细“思考”问题然后再提供解决方案,类似于OpenAI的o3-mini和DeepSeek 的 R1 等“推理”模型。

推理模型在给出结果之前会彻底检查自己,这有助于它们避免通常会绊倒模型的一些陷阱。

xAI表示,Grok 3 Reasoning在几个流行的基准测试中超越了OpenAI的o3-mini 的最佳版本——o3-mini-high,其中包括一个名为 AIME 2025的较新的数学基准测试。



推理模型可通过 Grok 应用程序访问。用户可以要求 Grok 3“思考(Think)”,或者利用“大脑(Big Brain)”模式进行推理,该模式需要额外的计算。xAI 认为推理模型最适合数学、科学和编程相关的问题。

另一个明显冲着OpenAI和DeepSeek来的是“DeepSearch”,直译是“深度搜索”。这是一个AI代理,由xAI的推理模型驱动,扫描互联网和X平台来分析信息。演示显示,DeepSearch包含研究、头脑风暴和数据分析等选项,会展示“思考”过程和计划响应的方式。

就在两周前,OpenAI推出AI代理“DeepResearch”,直译“深度研究”。

与 DeepSeek R1和现在的OpenAI o3-mini 一样,Grok 3将显示详细的思维链,让用户可以看到聊天机器人是如何思考问题的。马斯克证实,xAI 会稍微模糊思维,这样其他公司就不能直接复制xAI的聊天机器人。



顺带一提,马斯克表示,在 Grok 应用中,推理模型的一些“想法”被模糊化,以防止“蒸馏”,即AI模型开发人员从另一个模型中提取知识的方法。最近,DeepSeek 被指控蒸馏 OpenAI 的模型来创建自己的模型。

当然啦,新产品还是得“会员抢先用”。

X的Premium+级别的订户将首先获得 Grok 3,其他功能则由xAI的新计划SuperGrok提供。SuperGrok 的价格为每月30美元或每年300美元,可解锁额外的推理和 DeepSearch 查询,并提供无限的图像生成。

马斯克表示,未来(最快一周后),Grok 将获得“语音模式”,这将为 Grok 提供合成语音。几周后,Grok 3 模型将与 DeepSearch 功能一起出现在xAI 的企业API中。几个月后,马斯克表示,xAI 将开源 Grok 2。

“我们的一般做法是,当下一个版本完全发布时,我们将开源最后一个版本(Grok)。”马斯克说。“当 Grok 3 成熟稳定时,可能在几个月内,我们就会开源 Grok 2。”

B

从演示及xAI给出的基准测试结果来看,Grok 3确实实力不俗,但这场发布会还是略有“仓促”之感。

一向乐于画饼、擅长于把80分宣传成101分的马斯克,也在这次发布会时给用户“打预防针”:“这只是一个测试版本,刚开始可能会有些不完美。如果你想要更完善的版本,可能需要等上一周。”

此外,语音模式没有发布也值得注意。发布前的几个小时,希冯·齐利斯(Shivon Zilis)——Neuralink高管,同时也是和马斯克育有一对双胞胎的孩子妈,在X上大赞和Grok 3进行的对话,称“是我一生中最出乎意料、最值得的时光之一”,公开了Grok 3有语音功能。



但随后马斯克回复称语音模式还有一些问题,还需要一周左右时间才能发布。在发布会上,结束时压轴的也是一小段Grok 3语音对话的画面,看起来语音模式是被临时从这次发布会中取消的。



大家都明白这次发布对马斯克和xAI来说都很重要,Grok 3必须支棱。

Grok 3原本定于去年年底推出,但被推迟。根据马斯克的说法,Grok 3在今年一月初完成了训练。

按理说这样的推迟并不算久,但刚跨进新年,今年一月接连发生两件大事:一是OpenAI宣布携手软银和甲骨文,共建“星际之门”,预计投入5000亿美元夯实AI基建。二是中国杀出个DeepSeek,其推理模型R1因低成本高性能表现惊艳大洋彼岸的硅谷。

可能也正因如此,马斯克这次硬是整出了苹果发布会的排场,在Grok 3发布之前就预热不断。马斯克在各个场合以及X上都大赞新一代模型,以视频接入迪拜世界政府峰会时称“Grok 3 的表现优于我们所知的任何已发布产品”,周末在X上宣称Grok 3是“地球上最聪明的AI”。

这也可以解释为什么这次语音模式没有完全准备好、Grok 3也尚处于测试阶段,xAI就急着隆重召开发布会——同行的獠牙,八成已经闪得马斯克睡不着觉了。

C

马斯克不停地强调“再等一周”,但一周之内世界会发生什么真不好讲。

在DeepSeek于1月底开始打出知名度之后,OpenAI的应对措施就火速跟上,先是给免费用户开放o3-mini,又发布DeepResearch深度研究的功能。此外,OpenAI的CEO山姆·奥特曼(Sam Altman)前不久还发布长推文,公布GPT-5的计划。

在更大的竞争场中,中国的科技大厂如腾讯、百度等,以及出海的中国初创AI公司如MiniMax,都纷纷接入DeepSeek的模型,眼瞅着有打造“技术共同体”之态,形成竞争合力。

好在马斯克也有打造“马斯克共同体”的潜力。其名下企业众多,借由xAI正在加速彼此打通的进程。



图源:AI制作

一开始,似乎是马斯克名下其他几个企业当“扶弟魔”,喂养xAI。陆续传出过特斯拉显卡、X平台数据被xAI使用的消息。如今xAI也有了回馈的趋势。

Grok从一开始就是X(前推特)订阅用户的“特权”,在去年底,Grok开始提供给X的免费用户,甚至是未注册用户,只是模型选择与提问数量的限制有高低之分。今年1月,Grok的独立应用也在苹果商店上线,正式和ChatGPT展开角逐。

本次直播期间,打开X的APP,相关入口在顶部高亮显示。托X的福,这场直播在进行半个小时后就已经有200万次观看,一小时后这个数字达到300万。从前期宣传、发布会直播到后期嵌入,马斯克算是把X玩明白了。

要知道,据X官方消息,2024年3月时平台日活2.5亿,月活5.5亿。相比而言,据《纽约时报》,ChatGPT去年6月的月活为3.5亿。X对于xAI来说,是一个巨大的流量池。

此次发布会之前,外界也很关心特斯拉汽车是否会接入Grok。还是在1月初,马斯克曾经给出肯定的回答,称Grok会登陆特斯拉,你可以和特斯拉对话,提出任何要求。

但可惜的是,本次发布会中没有涉及特斯拉接入Grok的问题,倒是有一名xAI的工作人员问马斯克Grok何时会被接入SpaceX的火箭,马斯克回答“两年”。

不管怎样,xAI接下来一周,都得祈祷AI界不要再有“炸场”的同行。再稍久一些的未来,则得期待Grok 3的表现足以打动华尔街,毕竟xAI正在考虑以750亿美元估值融资100亿美元,而与此同时,OpenAI据传正在进行一轮400亿美元的融资,目标估值冲着3400亿美元而去。

Grok 3是否是“地球上最聪明的AI”,又是否能长久成为“地球上最聪明的AI”,好戏还在后头。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《北上》直到华子得脑瘤,才知,为何思艺回花街、星池和华子恋爱

《北上》直到华子得脑瘤,才知,为何思艺回花街、星池和华子恋爱

体育官已上任
2025-03-22 09:35:05
快船128-108击退灰熊,赛后迎来四个好消息,泰伦卢别复出了!

快船128-108击退灰熊,赛后迎来四个好消息,泰伦卢别复出了!

篮球资讯达人
2025-03-22 13:31:34
和解!大S最后想跟汪小菲忘掉恩仇,感动得要给她买块最大的墓地

和解!大S最后想跟汪小菲忘掉恩仇,感动得要给她买块最大的墓地

玫瑰讲娱
2025-03-22 14:29:04
73岁老人哭诉:这辈子最错误的事情,莫过于自己存钱养老

73岁老人哭诉:这辈子最错误的事情,莫过于自己存钱养老

蝉吟槐蕊
2025-03-21 12:19:26
深海科技第一龙头,中央汇金重仓2.6亿股,4元低价,或迎10倍暴涨

深海科技第一龙头,中央汇金重仓2.6亿股,4元低价,或迎10倍暴涨

白鸽论事
2025-03-22 08:53:18
你曾经开过最烂的车是哪款车?网友:这个车0到100加速,少说30秒

你曾经开过最烂的车是哪款车?网友:这个车0到100加速,少说30秒

美好客栈大掌柜
2025-03-19 00:20:04
售楼小姐自述:离职一年后才敢和丈夫同房,至今仍害怕路过富人区

售楼小姐自述:离职一年后才敢和丈夫同房,至今仍害怕路过富人区

历史八卦社
2025-03-16 23:09:35
汪小菲彻底翻身!大S遗愿曝光,汪要买大墓地被无视!S妈要750万

汪小菲彻底翻身!大S遗愿曝光,汪要买大墓地被无视!S妈要750万

美食阿鳕
2025-03-22 12:14:39
《哪吒2》延长上映至4月30日

《哪吒2》延长上映至4月30日

新京报
2025-03-21 10:29:14
离大谱!小玥儿姐弟搬出大S豪宅住进汪小菲家,具俊晔坚持不返韩

离大谱!小玥儿姐弟搬出大S豪宅住进汪小菲家,具俊晔坚持不返韩

沧海一书客
2025-03-20 13:42:43
知名女主播周二珂称自己已经财富自由,不想直播给自己压力,网友:主播真赚啊!

知名女主播周二珂称自己已经财富自由,不想直播给自己压力,网友:主播真赚啊!

美食阿鳕
2025-03-20 06:51:47
最美模特阿部なつき身材引发AI误认热议!

最美模特阿部なつき身材引发AI误认热议!

大为看点丶
2025-03-05 16:45:03
48秒98!21岁游泳天才拿下100米自由泳第一,潘展乐竞争对手来了

48秒98!21岁游泳天才拿下100米自由泳第一,潘展乐竞争对手来了

体坛知道分子
2025-03-22 06:30:08
我把爸妈的新农合交了,我妈第一句话就问:没给你弟弟一家交吗?

我把爸妈的新农合交了,我妈第一句话就问:没给你弟弟一家交吗?

陶三讲故事
2025-03-21 07:55:34
台媒一直美化具俊晔,吴宗宪一番话揭开真因:S妈送他的糖衣炮弹

台媒一直美化具俊晔,吴宗宪一番话揭开真因:S妈送他的糖衣炮弹

美食阿鳕
2025-03-18 01:34:36
马斯克“女儿”登上杂志封面,目前在东京留学,经济独立不靠父亲

马斯克“女儿”登上杂志封面,目前在东京留学,经济独立不靠父亲

涵豆说娱
2025-03-21 19:57:26
菲律宾总长公开宣布中国为“敌人”,下一刻遭遇前所未有的耻辱

菲律宾总长公开宣布中国为“敌人”,下一刻遭遇前所未有的耻辱

安安说
2025-03-20 20:02:34
一夜之间,大街小巷都在卖!有人一口气吃一盒,吃完又满满的罪恶!医生紧急提醒

一夜之间,大街小巷都在卖!有人一口气吃一盒,吃完又满满的罪恶!医生紧急提醒

鲁中晨报
2025-03-21 09:56:13
上海3人搭顺风车去江苏,拒绝司机加价后,竟被丢在高速上!司机:钱没到位!

上海3人搭顺风车去江苏,拒绝司机加价后,竟被丢在高速上!司机:钱没到位!

上海圈
2025-03-21 18:33:54
中共七大评选中央委员,周恩来的票数为什么很低

中共七大评选中央委员,周恩来的票数为什么很低

【历史客栈】
2025-03-21 10:01:17
2025-03-22 15:15:00
字母榜 incentive-icons
字母榜
让未来不止于大。
1794文章数 7984关注度
往期回顾 全部

科技要闻

蔚来一年巨亏224亿!李斌解释了一个半小时

头条要闻

70%稀土进口来自中国 特朗普下令大幅增产关键矿产

头条要闻

70%稀土进口来自中国 特朗普下令大幅增产关键矿产

体育要闻

“沙特很弱”,谁给你的错觉?

娱乐要闻

《浪姐6》人缘姐出炉,叶童首当其冲

财经要闻

财报里的电商三巨头:AI豪赌

汽车要闻

二代Hi4将引领四驱平权 让消费者都消费的起

态度原创

手机
教育
时尚
本地
军事航空

手机要闻

小直屏双摄旗舰!一加13T要来了:已三证齐全

教育要闻

北京初中数学竞赛题,学霸经过换元轻松搞定

春日通勤王者:乐福鞋+牛仔裤解锁三种高阶穿法

本地新闻

用AI唤醒花花世界|锡城春光正当时,一半花开一半诗

军事要闻

第47任总统特朗普要造新战机F-47

无障碍浏览 进入关怀版