网易首页 > 网易号 > 正文 申请入驻

揭秘马斯克超级算力工厂:30亿美元买一张第五代大模型"入场券"

0
分享至

作者|郑松毅

编辑|杨锦

运营编辑|王一晴

“算力将成为未来最宝贵的财富之一,会成为未来的‘货币。”——OpenAI CEO山姆·奥特曼曾这样定义算力的价值。而在这场硝烟四起军备竞赛中,马斯克也不愿做落后的一方。

The Information近日报道,马斯克向投资人透露了建造超级算力工厂(Gigafactory of Compute)的计划,为AI聊天机器人Grok的下一版本提供算力支持。

xAI 新建的“超级算力工厂”本质上是一个超级计算机,和 Meta 为训练 AI 模型而构建的 GPU 集群类似,即单个数据中心内通过线缆连接的众多服务器芯片,以便它们能以高效的方式同时运行复杂计算。

这是继特斯拉超级工厂、储能超级工厂后,马斯克建立的又一超级工厂。马斯克的超级计算工厂计划连接10万块英伟达H100 GPU。

相比之下,Meta的Research SuperCluster (RSC) 是目前世界上最大的AI超级计算集群,由约2.4万块英伟达H100组成。

马斯克的超级计算工厂建成后,规模至少是目前最大GPU集群的四倍。

据了解,这家超级计算工厂的选址最需要考虑的因素是电力供应,10万GPU规模的数据中心可能需要100兆瓦的专用电力。为了降低成本,其很可能建在特斯拉总部,德克萨斯州奥斯汀市。

每块英伟达H100 GPU售价高达3万美金,10万块总金额则高达30亿美元。算力竞争刻不容缓,xAI也正在加紧“筹粮”。

当地时间5月27日,xAI宣布获B轮融资60亿美元。本轮融资完成后,包括最新注入的现金在内,其估值将超过240亿美元。

从融资状况来看,外界给予了xAI这家初创公司相当看好。话说回来,马斯克此番大费周章,买马囤粮的操作是为哪般?超级计算机究竟能为大模型解决什么瓶颈问题?

第五代大模型的“入场券”

马斯克在2023年7月正式宣布xAI成立,xAI专注于人工智能技术发展,旨在向OpenAI和谷歌发起挑战。去年11月,xAI推出首款AI大模型聊天机器人Grok。

浙江大学计算机科学与技术学院教授汤斯亮向搜狐科技介绍,无论是模型训练还是用模型提供服务,都离不开算力的支持。当前最新的开源模型在通用能力上已经接近GPT-4为代表的第四代模型,因此从某种程度来说,目前的闭源第四代大模型基本已无技术“护城河”。更大规模、支持多模态输入、能力更强的第五代大模型(以GPT-5为代表以GPT-5为代表)将会形成新的技术壁垒,而在探索第五代大模型更多技术技术及其应用之时,算力尤为重要。

“马斯克现在的布局,是为了让Grok模型不掉出第一梯队。”

不光是xAI在布局超算,OpenAI和微软正在合作建造一个代号为“星际之门”(Stargate)的超级计算机项目,预计耗资高达1000亿美元,计划2028年上线。

“从xAI、微软等科技大厂争相布局算力基础设施的行动上来看,Scaling laws原理仍在主导现有大模型的开发,即更大(参数)规模的模型,在多个方面的性能表现仍在持续提升, 在‘大力’面前,‘奇迹’仍在发生,大算力支撑下的大模型能力想法还在被期待还未达到上限。”

很多人疑问,执着于追求模型规模的意义何在?

目前人工智能领域的普遍共识是越大的模型在泛化能力方面具有越大的优势,即在模型的训练优化过程中,大模型有更大的可能找到更优的结果。如深度学习中的“大乐透理论”所揭示的,模型越大包含的可能性就越多,就越能找到通向更强智能的“彩票”。这也解释了为什么业界一直在追求更大的模型规模。

汤斯亮解释道,尽管现在模型的规模在持续变大,但最新的模型在实际的训练和使用过程中大模型由神经网络构成,但在实际工作中,如同人类的大脑,只有一小部分神经元是激活高度活跃的。这种稀疏激活减少了计算的复杂性,从而提高模型效率计算量,因此模型的规模与其对应的算力并不一定成固定比例,但肯定是正相关的。

而想要追求更大规模的模型,拿得出足够的算力才算是拿到“入场券”。

他介绍,训练GPT-3所用算力约为1张英伟达A100(相当于3千到5千张英伟达H100 GPU),GPT-4所用算力约为GPT-3的10倍以上,即3万到5万块英伟达H100 GPU。下一代GPT-5的算力需求可能会是GPT-4的10倍。这样看来,10万块英伟达H100 GPU并不多。

值得注意的是,随着模型规模越发庞大,训练所需资源增加,今天AI赛道上的这些“玩家”都意识到了“抱团取暖”的道理。过去一年,美国已出现多个巨头+模型公司的深度联盟。如,微软+OpenAI,亚马逊+Anthropic等。

xAI此次也想借力于Oracle进一步提升大模型研发效率。Oracle是全球云服务市场的主要参与者之一,利用Oracle强大的云基础设施和数据管理能力,以支持xAI在人工智能研究和开发中的计算需求。

训练成本一直是倍受关注的问题,汤斯亮推测,“xAI基于运营成本考虑,可能会将算力托管在Oracle的云端。”

从叠卡到架构设计的较量

既然大家都在追求用更强的算力打造规模更大的模型,那是不是简单粗暴的叠卡(GPU),就能成为AI界的领袖了?

“当然不是”,汤斯亮肯定的回答道,“并不是说卡越多就越强,如何能把卡的算力充分利用,需要计算任务以及软硬件的相互协同。”

“越多的加速卡就意味着越多的卡间与集群间的通讯,以及更多的预处理,这些都将带来大量的额外开销。当额外开销增多的时候,加速就会受限。”

他打了一个比方,一个人就能很快完成的任务如果非要分给四个人去做,过程中开会拉齐进度的沟通成本和时间成本都会造成效率损失。“总的来说大模型的训练想要加速,不仅仅是靠增加加速卡的数量,也需要与之匹配的计算架构,以及与之匹配的计算任务,这样才能最大限度的利用算力增幅。”

“从总体算力来说,马斯克构建超级算力工厂肯定会带来算力大幅提升。现在最大的GPU集群有2.4万块英伟达H100 GPU,一下子提升4倍后,比如原来训练一个大模型需要一个月的时间,在最理想的情况下,现在用1周多的时间就训练完成了。”汤斯亮说。

谈及中国算力现状,汤斯亮坦言,国内能拿得出这个算力数量级的卡的厂商少之又少。就算有这些卡,也无法都拿出去训练大模型,因为还要用于支持别的业务。

这是一个在全球AI算力竞争特殊时期,充满矛盾感的故事——它激烈又沉默,团结又精明,美好又残酷。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
脚是心梗的放大镜?忠告:脚部出现这几种表现,要尽快就医!

脚是心梗的放大镜?忠告:脚部出现这几种表现,要尽快就医!

岐黄传人孙大夫
2025-12-25 09:56:07
伊朗动荡第9天,风云突变,多路武装发动攻击,占领近50个城镇

伊朗动荡第9天,风云突变,多路武装发动攻击,占领近50个城镇

高博新视野
2026-01-05 18:06:45
冷空气还要持续多久?海南升温时间确定

冷空气还要持续多久?海南升温时间确定

鲁中晨报
2026-01-09 16:13:03
建议大家:假如工资允许,咬咬牙添置“这5样”,幸福感加倍提升

建议大家:假如工资允许,咬咬牙添置“这5样”,幸福感加倍提升

家居设计师苏哥
2025-12-29 13:46:17
大陆不急于统一台湾,背后是有大战略?长文分析大陆对台四大战略

大陆不急于统一台湾,背后是有大战略?长文分析大陆对台四大战略

阿胡
2024-01-17 10:53:34
被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

听我说球
2026-01-08 08:47:49
本分与表演,假发与短裤:王石与段永平的认知鸿沟

本分与表演,假发与短裤:王石与段永平的认知鸿沟

数局
2025-12-14 17:00:19
近19万套新房积压!2026东莞抛售潮将至,房东该如何快速出货?

近19万套新房积压!2026东莞抛售潮将至,房东该如何快速出货?

大龙哥的哥
2026-01-09 12:01:42
误打误撞把病治好是啥体验?网友:华佗在世都要甘拜下风啊

误打误撞把病治好是啥体验?网友:华佗在世都要甘拜下风啊

带你感受人间冷暖
2025-07-21 00:15:06
全球首批1.8nm处理器登场,英特尔抢在了台积电前面

全球首批1.8nm处理器登场,英特尔抢在了台积电前面

DeepTech深科技
2026-01-06 21:33:26
西超杯冲突大反转!维尼修斯出言挑衅在先,西蒙尼不满阿隆索

西超杯冲突大反转!维尼修斯出言挑衅在先,西蒙尼不满阿隆索

奥拜尔
2026-01-09 17:03:49
日本签字了,高市选定中日主战场,对华开第二枪,解放军开始巡海

日本签字了,高市选定中日主战场,对华开第二枪,解放军开始巡海

小祁谈历史
2026-01-07 10:39:18
日本选手炮轰WTT:想参加奥运会,就必须参加WTT,樊振东早就想到

日本选手炮轰WTT:想参加奥运会,就必须参加WTT,樊振东早就想到

体育就你秀
2026-01-09 07:10:03
CCTV直播!国乒2人出局!周启豪战张本智和 多哈冠军赛1月9日赛程

CCTV直播!国乒2人出局!周启豪战张本智和 多哈冠军赛1月9日赛程

好乒乓
2026-01-09 12:27:05
建文帝下落之谜被解开?后世争议600余年,其实朱棣早就找到答案

建文帝下落之谜被解开?后世争议600余年,其实朱棣早就找到答案

铭记历史呀
2026-01-09 08:47:01
岛内担心赖清德被捕,沉默4天后,大陆通知全世界,统派大佬扛旗

岛内担心赖清德被捕,沉默4天后,大陆通知全世界,统派大佬扛旗

素年文史
2026-01-08 16:29:05
直到70岁米雪秒了54岁陈松伶,我才明白什么是:有钱难买老来俏!

直到70岁米雪秒了54岁陈松伶,我才明白什么是:有钱难买老来俏!

翰飞观事
2026-01-08 19:39:00
内维尔:阿森纳那么猛的火力都没赢简直是对利物浦防守的肯定

内维尔:阿森纳那么猛的火力都没赢简直是对利物浦防守的肯定

懂球帝
2026-01-09 13:15:05
闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

小徐讲八卦
2026-01-08 09:00:40
WTT冠军赛:大爆冷!男单世界第3被淘汰,新科世界杯冠军2:3出局

WTT冠军赛:大爆冷!男单世界第3被淘汰,新科世界杯冠军2:3出局

国乒二三事
2026-01-09 10:45:15
2026-01-09 18:28:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4638文章数 9175关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

10岁抗癌"小王子"病情加重:用药都已无效 不能吃饭

头条要闻

10岁抗癌"小王子"病情加重:用药都已无效 不能吃饭

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

英伟达的野心:做一套自动驾驶的“安卓系统”

态度原创

家居
艺术
房产
旅游
公开课

家居要闻

木色留白 演绎现代自由

艺术要闻

Sean Yoro:街头艺术界的“冲浪高手”

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

旅游要闻

冬日入川,踏雪寻暖,赴一场冰与火的诗意邀约|长图

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版