作者 |肖恩
编辑 |德新
![]()
xAI的启发
![]()
做 AI 到底要花多少钱?
OpenAI 2025 年现金消耗约 80 亿美元,服务器租赁成本超过 140 亿。Anthropic 刚和微软、英伟达签下 300 亿美元的算力采购协议。Google 每年投给 DeepMind 的预算也在 30 亿美元以上,这还不含内部云资源。
这些数字已经够夸张了。但放到 xAI 面前,仍然显得保守。
xAI 每个月烧掉 10 亿美元。2025 年前九个月,现金支出 78 亿;全年预计亏损 130 亿,收入只有 10 亿。
更值得关注的不是财务报表,而是它的做法。
2024 年夏天,xAI 从海外买下一座停运发电厂,拆成 35 台燃气轮机运到孟菲斯。原因很简单:等不及电网审批,先自己发电。122 天后,第一期集群上线,10 万张 GPU;一年后扩到 55 万张。
电不够怎么办?和 SpaceX 合并,把数据中心往太空推,直接吃太阳能。
这已经不是典型软件公司的打法,而是重工业逻辑。
模型优势会被追平,基础设施差距往往不会。xAI 正把 AI 竞争拉进另一个维度。
![]()
为「理解宇宙」而生
![]()
xAI 的起点,在 2018 年马斯克退出 OpenAI 董事会的那一刻。
2015 年,他和 Sam Altman 在硅谷的 Rosewood 酒店见面,决定一起建一个非营利的 AI 实验室。目标是通用人工智能,但要安全、开源、不被任何公司垄断。马斯克不仅出了钱,还亲自挖人——Ilya Sutskever 就是他从 Google 拉来的。
三年后,分歧浮出水面,马斯克退出了 OpenAI 董事会。官方说法是「避免和特斯拉的利益冲突」。
真实原因没那么简单。据多方报道,马斯克当时认为 OpenAI 已经「致命地落后于 Google」,提出由他接管公司、亲自掌舵。Sam Altman 和其他创始人拒绝了。马斯克转身离开,还撤回了一笔计划中的大额捐款。
之后几年,OpenAI 转型成了营利公司,和微软深度绑定,GPT-4 闭源。马斯克的批评越来越激烈:这完全背离了当初的使命。2024 年,他直接把 OpenAI 告上法庭。
但在那之前,他已经决定自己干了。
2023 年 4 月,马斯克在 Tucker Carlson 的节目上第一次提出「TruthGPT」的概念:
「我要做一个最大限度追求真理的 AI,目标是理解宇宙的本质。这可能是通往安全的最佳路径——一个试图理解宇宙的 AI,不太可能毁灭人类,因为人类是宇宙中有趣的一部分。」
三个月后,xAI 正式亮相。
2023 年 7 月 12 日,马斯克发了一条推:「宣布成立 @xAI,目标是理解现实。」
日期是故意选的。7 + 12 + 23 = 42——《银河系漫游指南》里「生命、宇宙和一切的终极答案」。这是马斯克最喜欢的科幻小说之一。这种极客式的彩蛋贯穿 xAI 的基因。他们的 AI 叫 Grok,名字来自科幻小说《异乡异客》,意思是「深刻地、直觉地理解某事」。Logo 是一个风格化的「G」,看起来像一只眼睛——或者像宇宙中的奇点。
创始团队只有 12 个人,但来头都不小,几乎每个人都从 Google、DeepMind 或 OpenAI 出来。马斯克的招聘方式也很硬核:不用猎头,技术人员直接看代码和能力。他在 X 上发招聘帖:「加入 xAI,如果你相信我们的使命——理解宇宙,这需要最大限度地追求真理,不管它是否流行,是否政治正确。」
这句话定义了 xAI 的气质。它不是要做一个更好的聊天机器人,不是要和 ChatGPT 抢市场。它的野心是理解物理世界的运行规律。
听起来像哲学口号,但马斯克的公司在做的事——让汽车自己开、让机器人干活、让火箭可回收——都需要这种能力。
xAI 成立九个月后,发布了第一个模型。
2024 年 8 月,Grok-2 上线,补齐视觉和图像生成;2025 年 2 月,Grok-3 发布。Grok-3 的训练规模约 20 万张 GPU,算力约为 Grok-2 的 10 倍,参数 1.7 万亿,上下文窗口 100 万 token。发布当天在 Chatbot Arena 拿到 1402 分,成为首个跨过 1400 Elo 的模型。
它更关键的变化不是跑分,而是训练范式。xAI 在预训练阶段大规模引入强化学习,让模型具备回溯和纠错能力。这套方法让 Grok-3 在数学和物理推理上拉开了差距。
2025 年 7 月,Grok-4 发布,原生多模态,覆盖文本、图像和语音。AIME 2025 上,Grok-4 Heavy 拿到 100%。训练成本估算约 5 亿美元,用电规模接近一个 4000 人小镇的全年水平。
马斯克给 Grok-4 的定位是:“像物理学家一样从第一性原理思考。”
2026 年 2 月,Grok Imagine 1.0 发布。它能把静态图转成 6 - 15 秒的视频,也能文生 10 秒 720p 视频,并同步音效和对话。上线 30 天,用户生成视频 12.45 亿条。
和 Sora 相比,Grok Imagine 更强调场景物理一致性,不只做像素预测。这条路线和 xAI 的母命题是一致的:理解规律,而不只是复现表象。
Grok 的意义也在这里。它不只是榜单分数,而是能力是否能落到系统里。
![]()
从模型到系统——xAI 的能力边界
![]()
xAI 现在早就不止是一个聊天模型,能力边界已经在往真实世界扩展。
先看模型层。
Grok 的核心优势是实时性。它直接接入 X(Twitter)的数据流,能看到全球用户正在发的每一条推文。2025 年 2 月,xAI 推出了 DeepSearch 功能:每次查询最多触发 10 轮检索,从几十个网页和 X 帖子中提取信息,然后综合成答案。
这与传统大模型形成明显差异。依赖静态训练语料的模型存在知识截止点,而 Grok 的优势在于“时间维度”。很多场景里,差异不在“会不会答”,而在“答得是否及时”。品牌公关、金融交易、选举追踪都吃这一点。
再看物理载体。
2025 年 7 月 12 日,Grok 正式上车。特斯拉软件版本 2025.26 开始推送,Model 3、Model Y、Model S、Model X 和 Cybertruck 都能用。
这是大模型第一次真正进入量产汽车的座舱。
在车内,Grok 的意义并不只是“更聪明的语音助手”。传统语音助手基于预设指令匹配,而 Grok 属于生成式 AI,它理解语义、生成回应,并能够在对话中保持上下文。
你可以和它连续交流,追问细节,模糊表达也能得到回应。这种交互方式,本质上改变了车内的人机协作逻辑。
这样说你可能没有直观的感受,如果看过我们在美国实测 Grok 的视频,就能理解它到底有多强。
目前 Grok 还不能直接控制车辆。它的定位是「对话伙伴」,还不是「车辆控制助手」。
但这条边界在移动。
马斯克已经确认,Grok 会成为 Optimus 机器人的「声音和大脑」——Optimus 负责移动和操作,Grok 负责理解环境和响应指令。2025 年 9 月,Optimus V2 已经集成了 Grok 语音 AI。
未来你和 Optimus 交流,不需要专门的 App 或者预设指令,直接说话就行。
FSD 未来也会接入 Grok。特斯拉的自动驾驶系统需要理解复杂的交通场景:前车在减速,可能要右转;右边有行人在犹豫要不要过马路;施工路段需要临时改道。这些判断需要对物理世界的因果推理能力——正是 Grok-4 在训练的方向。
马斯克说,未来 FSD 在遇到复杂场景时,可能会「询问」Grok 来辅助决策。
当 xAI进入车端、机器人,甚至未来更复杂的物理系统后,它就不再只是信息生成工具,而是马斯克整个体系的“智能中枢”。
![]()
AI 竞争的尽头:能源竞争
![]()
xAI 能力跳升,背后是能源和基础设施的硬堆栈。
回到 xAI 建发电厂的故事。
为什么要自己发电?因为训练大模型需要的电力已经超出了正常基础设施的供给能力。
2024 年 7 月,xAI 在孟菲斯启动 Colossus 超算中心的建设。传统数据中心需要 2 - 3 年,xAI 的目标是几个月。
他们的做法是:边建边装,设备到了就往里塞,电力不够就自己发。从海外买了一座停运的发电厂,拆成 35 台燃气轮机运到美国,420 兆瓦。电网不够用,就用特斯拉 Megapack 储能削峰填谷。
122 天后,第一期上线:10 万张 H100 GPU。这个速度打破了所有行业记录。
2025 年 6 月,扩张到 20 万张 GPU:15 万张 H100,5 万张 H200,还有 3 万张 GB200。92 天翻一倍。
2026 年 1 月,55.5 万张 GPU。投资 180 亿美元。全球最大的单体 AI 训练集群,没有之一。Meta 最大的集群大约 5 万张 H100,Colossus 是它的 11 倍。
功耗呢?目前大约 300 兆瓦,目标是 2 吉瓦——相当于两座核电站。为了给冷却塔供水,孟菲斯电力公司(MLGW)专门在建一座灰水处理厂,预计日用水量超过 500 万加仑。
环保组织曾指控 xAI「没有拿到排放许可就开始运营」。马斯克的回应是:继续扩张。目标是 100 万张 GPU,2026 年底。
这是一种什么心态?
传统公司的逻辑是:先拿许可,再建设施,按部就班。xAI 的逻辑是:速度就是一切,流程是障碍,绕过它。
但地球上的电力快撑不住了。所以马斯克的下一步是太空。
2026 年 2 月 SpaceX 收购 xAI 之后,计划浮出水面:在轨道上建数据中心。
SpaceX 已经向 FCC 提交申请,计划发射 100 万颗卫星,部署在 500-2000 公里的轨道上。这些卫星不只是通信节点,而是分布式计算节点。太阳能在轨道上 24 小时可用,没有云层遮挡,发电效率是地面的数倍。散热靠辐射——太空本身就是 3 开尔文的冷源。
如果能做到年发射 100 万吨卫星,按每吨 100 千瓦算力计算,每年能给全球 AI 算力增加 100 吉瓦。
马斯克把这叫「迈向卡尔达肖夫 II 型文明的第一步」——利用恒星的全部能量。
当然,太空数据中心的工程难度极高。
宇宙辐射会破坏芯片,导致数据错误和硬件退化。散热只能靠辐射,每千瓦需要 2-4 平方米的散热器面积,结构成本很高。如果真的发射 100 万颗卫星,凯斯勒效应的风险会急剧上升——太空垃圾连锁碰撞,可能让整个轨道带变得不可用。
目前在轨卫星总数约 1.18 万颗,其中 7000 多颗是 Starlink。再加 100 万颗?不敢想象要怎么管理。
但这不是重点。
重点是马斯克在用一种「先开枪再瞄准」的方式重新定义竞争规则。当其他公司还在算 ROI 的时候,他已经把基础设施的门槛拉到了一个荒谬的高度。
![]()
对中国公司的关键一课
![]()
xAI 的故事,对中国汽车和机器人公司最大的启发,不是“复制马斯克”,而是看清下一阶段真正比什么。
第一,AI 大模型是核心,不是配件。
看看马斯克在做什么。Tesla 的逻辑是「AI 系统 + 汽车作为载体」,Optimus 的逻辑是「AI 大脑 + 机器人作为躯体」。Grok 不是单一产品,而是一层能复用到多个终端的底层能力。
这个趋势在中国也能看到。
2026 年 1 月,理想汽车做了一次关键的组织架构调整:研发体系重组为三个团队——基座模型、软件本体、硬件本体,并正式启动人形机器人业务。
李想在全员会上说得很直接:「2026 年是所有想成为 AI 头部公司上车的最后一年。最晚 2028 年,L4 一定能落地。全球能同时布局基座模型、芯片、操作系统、具身智能的公司不会超过三家,理想要成为其中一家。」
AI 大模型的重要性被提到了新的高度。
同一时期,千里科技也在今年开启了自己的 AI 战略,和阶跃星辰合作,用大模型赋能智能驾驶和座舱,完成“AI + 车”的战略版图。
谁掌握了大模型,谁就掌握了两个市场的入口。
第二,算力基建是硬仗,能源是胜负手。
为了建成 10 万张 GPU 的集群,xAI 自己买发电厂,自己装电池,边建边干,最后仅用时 122 天。
这个做法指向了一个核心问题:算力竞争最终是能源竞争,而基建则是这场竞争的胜负手。
这方面中国有自己独特的优势,西部有丰富的风电、光伏和水电资源,自然冷却条件好,电价低。早在几年前政府就提出了「东数西算」的思路,把算力搬到能源富集的地方,而不是把能源送到算力中心。
但执行层面还有很多问题。电力和算力的协同调度能力够不够?跨省电力输送的损耗怎么解决?数据中心的审批流程能不能加速?
但是时间不等人,谁能更快、更便宜地把电变成算力,谁就占据先机。
第三,垂直整合是终局。
xAI 的护城河不只是模型,而是「数据 + 算力 + 能源 + 载体」的闭环。
X 提供实时数据,Tesla 提供车端和机器人场景,Megapack 提供能源缓冲,SpaceX 提供未来算力外延。xAI 在中间做模型、推理和调度,把四条线拧成一条系统能力曲线。
它最难复制的,不是某个模型更强,而是“模型-数据-算力-能源-场景”被放进了同一个闭环。中国企业要学的,不是照抄马斯克,而是把这个闭环拆开补齐。短期内不可能拥有 X、Tesla、SpaceX 的全套资源,但可以先把关键齿轮咬合起来。
首先是组织重构。模型、智驾、座舱、机器人不能继续各自为战。理想把基座模型单列出来,本质是把 AI 从“功能部门”升级为“公司底座”。谁统一模型路线、谁管理数据标准、谁调度算力资源,必须有明确的一号位。
其次是做真正的数据闭环。很多公司数据并不少,缺的是高价值数据的回流效率。线上问题能否快速完成采样、标注、训练、验证和部署,决定了模型是“持续进化的产品”,还是“停在演示里的能力”。
最后是把算力和能源放在同一张战略表。算力采购只是起点,训练上限最终由电力接入、储能、冷却和运维稳定性决定。
未必需要照搬 xAI 的激进做法,但必须承认:后半场的 AI 竞争,本质上是能源系统能力竞争。
“垂直整合是终局”并不等于都要变成马斯克帝国。它真正的含义是:企业必须对关键链路拥有足够控制力。即便不做全栈自研,也要在基座模型、数据闭环、算力调度上建立主导权。
这条路并不轻松。组织重构、数据闭环、算力与能源协同,任何一环都需要高投入和长期执行。但中国企业也有自己的优势:完整制造业体系、丰富应用场景、以及持续推进的算力与能源基础设施。
xAI 领先的是起跑身位,不是终局结果。最后谁能胜出,现在还远没有定论。
![]()
结语
xAI 的冲击不在于“又发了一个模型”,而在于它把 AI 竞争从软件竞赛拉进了重工业竞赛。
在这个维度里,参数能追平,功能能复制,人才会流动;但系统能力很难速成。组织怎么协同,数据怎么闭环,电力怎么保障,算力怎么调度,场景怎么反哺模型,都要靠时间和纪律。
对中国车企来说,问题已经不是“要不要接入大模型”,而是“要不要把自己重构成一家 AI 基础设施公司”。
谁更早完成这次重构,谁就更有机会在下一轮汽车与机器人融合竞争里拿到先手。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.