网易首页 > 网易号 > 正文 申请入驻

史上最强 Grok 3 发布:马斯克,成了!

0
分享至

来源:笔记侠整理

01

Grok 3,地表最强AI?

就在今天,埃隆·马斯克扔出“大招”,正式发布新一代聊天机器人Grok 3,与OpenAI o1、DeepSeek-V3/R1等模型一决高下。

在此之前,马斯克称其为“地球上最聪明的人工智能”。

发布会开场时,马斯克解释了Grok这一名字的来历:Grok这个词来自罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。这是一个火星词,意思是充分而深刻地理解某事。随后,xAI在发布会上简单粗暴地摆起了数字。

随后,xAI在发布会上简单粗暴地摆起了数字。

Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

图 | Grok 3的数学、科学和编程基准测试成绩(来源:xAI)

同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。

xAI还现场演示了Grok 3的推理+编程能力,其中一个问题是“生成3D动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。

经过近两分钟的思考,Grok 3生成了可以直接跑起来的python代码,3D动画可以运行,但是否正确还有待验证。

Grok 3的最后一个新功能是代理/智能体(Agent)。发布会演示的是新产品DeepSearch,基于Grok 3的搜索引擎。

它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够返回正确的信息”。

在演示中,它还能基于搜索资料给出一些推测性的结论。

发布会中,xAI谈到,Grok 3由Colossus超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源——是Grok 2的10倍。

据介绍,xAI最开始搭建这个10万GPU集群用了122天,后续拓展到20万集群仅用了92天。

马斯克表示,这一显著的算力提升让Grok 3能够更高效地处理庞大数据集,缩短训练时间,并提升AI模型的准确性。

据介绍,在训练方法上,xAI采取了一些新的策略来优化Grok 3的能力,包括合成数据集、自我纠错机制和强化学习。

Grok 3的推出标志着xAI在AI竞赛中的又一次重大尝试。凭借强大的计算能力、优化的训练方法以及对逻辑推理的改进,马斯克寄希望于它能在AI市场上占据一席之地。

不过,在这场AI诸神之战中,这并不是一个容易实现的目标。

02

6个月完成10倍升级,

Grok 3背后的第一性原理

从特斯拉到Space X,再到xAI,马斯克在不断颠覆这个世界。

而这背后,离不开他极力推崇的决策框架:第一性原理。

马斯克曾说:“运用第一性原理而不是比较思维,思考问题是非常重要的。我们在生活中总是倾向于比较,别人已经做过或者正在做的事情,我们也都去做,这样发展的结果只能产生细小的迭代发展。”

举个例子,特斯拉研制电动汽车期间,曾遇到一个难题:电池成本居高不下。当时储能电池的市场价格是每千瓦时600美元,这个市场价格很稳定,短期内不会有太大的变动。

但是马斯克从第一性原理角度进行思考:电池组到底是由什么材料组成的?这些电池原料的市场价格是多少?如果我们购买这些原材料然后组合成电池,需要多少钱?这个答案是,每千瓦时只需要80美元。

从最本质出发,研究电池都是由什么材料组成,再推算这些原材料加在一起的价格,从而得到电池的最低价格,通过这样的思维方式,马斯克让电动车的商业化成为可能。

多数人考虑问题的出发点是这件事情的现有情况是既定事实,我无法改变,但是马斯克的想法是,如果这件事在物理层面行得通,那么我也能做成。

再举个例子,马斯克在Space X成立之初,面临成本难题。因为美国国家航空航天局向波音公司采购用于发射卫星或者宇宙飞船的大型运载火箭,单次发射成本高达16亿美元。

因为“运载火箭只能进行一次性使用”,这在传统的火箭运载技术中基本是“行业共识”,而这大大降低了美国国家航空航天局向外太空进行探索的速度与效率。

要想实现“到2050年将100万人送往火星工作和生活”的伟大理想,埃隆·马斯克又是如何解决这一重大难题的呢?

第一步:“挖”思维盲区

“运载火箭只能一次性使用”这一传统火箭运载技术中的“行业共识”被马斯克从思维盲区中揪出来了。

在普通人看来,这种集体共识、信念与假设,就是隐形存在的教条,而马斯克在心里反复追问:“这个共识成立吗?总是成立吗?有没有例外?能打破吗?除非……”用层层追问的好奇心与逻辑思维抓住了火箭升空成本问题的本质,他说:

“只能使用一次的消耗性运载火箭,看起来就像是航空公司在每次完成飞行时丢掉他们的客机,而可重复使用的火箭则可以节省巨额成本。”

第二步:“破”思维边界

找到火箭升空成本问题的本质后,SpaceX经历多年艰苦研发与巨资投入,在一次又一次推迟发射与试飞失败,并面临现金流断裂的情况下,终于在2018年2月实现了可重复利用的猎鹰重型火箭的成功试飞,创造了航天领域的奇迹。

猎鹰重型火箭成功试飞,让火箭的单次发射成本从16亿美元降到了9000万美元,只有传统一次性运载火箭成本的5%。这为马斯克移民火星的伟大理想助力向前迈进了一大步。

面对移民火星火箭发射成本居高不下的问题,马斯克深挖通过第一性原理找到“成本”背后真正的阻碍问题,破除了“一次性使用”的心智界限。

而在Grok 3的训练上,马斯克和xAI团队也是靠着第一性原理,从最基本的假设出发,快速试错,才能在6个月的事件内,实现计算能力的10倍增长。

03

DeepSeek和Grok 3的区别

xAI(Grok 3)和深度求索(DeepSeek)的出发点就不太一样。

xAI的目标是加速人类的科学发现,让Grok 3成为一个“宇宙通识者”,能帮人类解答从物理学到哲学的各种问题。

而深度求索更多是冲着技术性能和成本效率去的,特别在编程、数学推理这类具体任务上表现得很抢眼。

1.训练目标和风格

Grok:Grok 3的训练数据是个“大杂烩”,涵盖了广泛的知识领域,目的是让Grok 3尽可能全面、灵活,能应对各种奇怪的问题。Grok 3的训练过程可能更注重语言的流畅性和对话的自然感,而不是单纯追求某个领域的极致性能。

DeepSeek:DeepSeek的训练目标更聚焦,尤其是V3用了混合专家模型(MoE),这是一种聪明的方法,能让模型在处理具体任务时只激活一部分参数,节省计算资源。R1则进一步强化了推理能力,比如解决复杂的数学或代码问题。DeepSeek的训练明显更偏向技术优化,追求高效率和低成本。

2.数据和方法

Grok:Grok 3的数据来源很广,可能包括科学文献、公开文本,甚至一些对话数据,目的是让Grok 3更贴近人类的表达方式。

DeepSeek:DeepSeek V3号称用了14.8万亿个token(文本片段)训练,涵盖多语言,特别是数学和编程相关的数据。DeepSeek还用了FP8低精度计算和多token预测这样的创新,减少内存占用,加快训练速度。R1甚至直接用强化学习(RL)从V3基础上提炼推理能力,这种“蒸馏”方法挺有意思。

3.资源和成本

Grok:Grok 3的训练可能更依赖高端硬件,比如NVIDIA的最新GPU,成本比DeepSeek多。

DeepSeek:他们厉害的地方在于用相对“弱势”的硬件(NVIDIA H800,比H100差一档)训练出了顶级模型。V3 reportedly 只花了558万美元,靠的是算法优化和自研框架,而不是堆砌昂贵的硬件。

4.结果上的差异

Grok:更像个“聊天大师”,适合探讨开放性问题,提供有趣的思路。如果问Grok 3宇宙的意义,他可能会给你一个既深刻又带点调侃的回答。

DeepSeek:更像“技术专家”,如果你扔给它一道复杂的数学题或者一段代码调试任务,它可能会直接给出精确解法,效率很高。

参考资料:1.《Grok 3来了!马斯克宣称“地球上最聪明的AI”,20万张GPU能否颠覆AI格局?》,DeepTech深科技;2.《马斯克:第一性原理,是最好的思考方式》,笔记侠。

THE END

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2年1300万美元!斯马特与火箭达成签约协议 再次联手乌度卡冲冠

2年1300万美元!斯马特与火箭达成签约协议 再次联手乌度卡冲冠

罗说NBA
2026-07-01 19:36:52
乌军进攻频率大增,俄志愿者领导人曝光俄军伤亡过百万

乌军进攻频率大增,俄志愿者领导人曝光俄军伤亡过百万

史政先锋
2026-07-01 17:43:26
樊振东正式加盟德甲豪门杜塞尔多夫,将于8月22日迎来主场首秀

樊振东正式加盟德甲豪门杜塞尔多夫,将于8月22日迎来主场首秀

懂球帝
2026-07-01 23:33:09
交易已达成,湖人队从爵士换来沃克·凯斯勒并签下1.3亿美元合同

交易已达成,湖人队从爵士换来沃克·凯斯勒并签下1.3亿美元合同

好火子
2026-07-01 23:50:11
双星鞋业家族内斗新进展:84岁创始人一审败诉,曾曝其儿子儿媳抢公章“夺权”

双星鞋业家族内斗新进展:84岁创始人一审败诉,曾曝其儿子儿媳抢公章“夺权”

红星新闻
2026-07-01 19:19:57
不是洪明浦!美加墨世界杯“最差”主教练出炉,国足也曾被他坑过

不是洪明浦!美加墨世界杯“最差”主教练出炉,国足也曾被他坑过

篮球圈里的那些事
2026-07-01 19:30:10
曝黄晓明深夜和长发美女约会!女方鲜嫩又漂亮,撞脸Baby

曝黄晓明深夜和长发美女约会!女方鲜嫩又漂亮,撞脸Baby

叶公子
2026-07-01 21:03:37
上海一百万豪车停在地库,竟被“蚂蚁搬家式”拆光卖了,监控显示:嫌疑人来了十几次,每次拆完零部件都罩好车衣;三人已被警方抓获

上海一百万豪车停在地库,竟被“蚂蚁搬家式”拆光卖了,监控显示:嫌疑人来了十几次,每次拆完零部件都罩好车衣;三人已被警方抓获

大风新闻
2026-07-01 15:38:10
135公里刀片刺绳,泰山到底在防谁?

135公里刀片刺绳,泰山到底在防谁?

民言民语
2026-06-30 10:00:28
河南古墓惊现“不存在的时间”,考古专家:很正常

河南古墓惊现“不存在的时间”,考古专家:很正常

牛马搞笑
2026-07-01 09:48:12
四川一名大学生发了几条短信被广州电信“保护性停机” 多个App受影响 要想恢复得奔波数千公里线下办理

四川一名大学生发了几条短信被广州电信“保护性停机” 多个App受影响 要想恢复得奔波数千公里线下办理

信网
2026-07-01 16:29:16
绝不就地甩卖!中资企业硬核撤离印尼

绝不就地甩卖!中资企业硬核撤离印尼

安安说
2026-07-01 11:35:17
女生硕士研究生毕业,与近百张证书合影,当事人:本硕期间获得奖学金等共计五六万

女生硕士研究生毕业,与近百张证书合影,当事人:本硕期间获得奖学金等共计五六万

潇湘晨报
2026-07-01 17:21:20
基尼奥内斯1球1助,墨西哥2-0完胜南美劲旅,强势晋级世界杯16强

基尼奥内斯1球1助,墨西哥2-0完胜南美劲旅,强势晋级世界杯16强

侧身凌空斩
2026-07-01 12:01:39
Shams:康利一年合同加盟凯尔特人,成为第14位征战20个赛季的NBA球员

Shams:康利一年合同加盟凯尔特人,成为第14位征战20个赛季的NBA球员

懂球帝
2026-07-01 23:33:09
7 月 1 日起全国生育待遇全面调整,普通人生娃养娃终于能松口气

7 月 1 日起全国生育待遇全面调整,普通人生娃养娃终于能松口气

一口娱乐
2026-06-30 20:24:43
湖南“六旬父亲背8个土鸡蛋接考”后续:儿子已报考湖南农大,觉得这个学校很温暖,很有人文关怀

湖南“六旬父亲背8个土鸡蛋接考”后续:儿子已报考湖南农大,觉得这个学校很温暖,很有人文关怀

极目新闻
2026-07-01 22:19:13
Shams:湖人先签后换4年1.3亿美元得到凯斯勒,送出两首轮+两首轮互换

Shams:湖人先签后换4年1.3亿美元得到凯斯勒,送出两首轮+两首轮互换

懂球帝
2026-07-01 23:55:26
印度裔抱团、代码被锁死、公司停摆,张江事件的致命教训!

印度裔抱团、代码被锁死、公司停摆,张江事件的致命教训!

A活着
2026-07-01 17:03:00
57岁奥运冠军:宋凯去中国足协升官发财!疆超主教练睡队员家长

57岁奥运冠军:宋凯去中国足协升官发财!疆超主教练睡队员家长

念洲
2026-07-01 09:06:46
2026-07-02 00:03:00
互联网思维 incentive-icons
互联网思维
每天推送精选互联网圈深度文章
6123文章数 87234关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

六旬父亲背8个土鸡蛋接考后续:儿子报考大学已确定

头条要闻

六旬父亲背8个土鸡蛋接考后续:儿子报考大学已确定

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

房产
艺术
游戏
时尚
公开课

房产要闻

洞察新局 | 2026年天河置业红盘图鉴

艺术要闻

西安美术学院,2026届油画系硕士研究生毕业作品选(二)

索尼停产PS实体版!外媒怒赞任天堂:钥匙卡是对的

7月,穿好看的衣服,看最美的风景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版