网易首页 > 网易号 > 正文 申请入驻

揭秘马斯克超级算力工厂:30亿美元买一张第五代大模型"入场券"

0
分享至

作者|郑松毅

编辑|杨锦

运营编辑|王一晴

“算力将成为未来最宝贵的财富之一,会成为未来的‘货币。”——OpenAI CEO山姆·奥特曼曾这样定义算力的价值。而在这场硝烟四起军备竞赛中,马斯克也不愿做落后的一方。

The Information近日报道,马斯克向投资人透露了建造超级算力工厂(Gigafactory of Compute)的计划,为AI聊天机器人Grok的下一版本提供算力支持。

xAI 新建的“超级算力工厂”本质上是一个超级计算机,和 Meta 为训练 AI 模型而构建的 GPU 集群类似,即单个数据中心内通过线缆连接的众多服务器芯片,以便它们能以高效的方式同时运行复杂计算。

这是继特斯拉超级工厂、储能超级工厂后,马斯克建立的又一超级工厂。马斯克的超级计算工厂计划连接10万块英伟达H100 GPU。

相比之下,Meta的Research SuperCluster (RSC) 是目前世界上最大的AI超级计算集群,由约2.4万块英伟达H100组成。

马斯克的超级计算工厂建成后,规模至少是目前最大GPU集群的四倍。

据了解,这家超级计算工厂的选址最需要考虑的因素是电力供应,10万GPU规模的数据中心可能需要100兆瓦的专用电力。为了降低成本,其很可能建在特斯拉总部,德克萨斯州奥斯汀市。

每块英伟达H100 GPU售价高达3万美金,10万块总金额则高达30亿美元。算力竞争刻不容缓,xAI也正在加紧“筹粮”。

当地时间5月27日,xAI宣布获B轮融资60亿美元。本轮融资完成后,包括最新注入的现金在内,其估值将超过240亿美元。

从融资状况来看,外界给予了xAI这家初创公司相当看好。话说回来,马斯克此番大费周章,买马囤粮的操作是为哪般?超级计算机究竟能为大模型解决什么瓶颈问题?

第五代大模型的“入场券”

马斯克在2023年7月正式宣布xAI成立,xAI专注于人工智能技术发展,旨在向OpenAI和谷歌发起挑战。去年11月,xAI推出首款AI大模型聊天机器人Grok。

浙江大学计算机科学与技术学院教授汤斯亮向搜狐科技介绍,无论是模型训练还是用模型提供服务,都离不开算力的支持。当前最新的开源模型在通用能力上已经接近GPT-4为代表的第四代模型,因此从某种程度来说,目前的闭源第四代大模型基本已无技术“护城河”。更大规模、支持多模态输入、能力更强的第五代大模型(以GPT-5为代表以GPT-5为代表)将会形成新的技术壁垒,而在探索第五代大模型更多技术技术及其应用之时,算力尤为重要。

“马斯克现在的布局,是为了让Grok模型不掉出第一梯队。”

不光是xAI在布局超算,OpenAI和微软正在合作建造一个代号为“星际之门”(Stargate)的超级计算机项目,预计耗资高达1000亿美元,计划2028年上线。

“从xAI、微软等科技大厂争相布局算力基础设施的行动上来看,Scaling laws原理仍在主导现有大模型的开发,即更大(参数)规模的模型,在多个方面的性能表现仍在持续提升, 在‘大力’面前,‘奇迹’仍在发生,大算力支撑下的大模型能力想法还在被期待还未达到上限。”

很多人疑问,执着于追求模型规模的意义何在?

目前人工智能领域的普遍共识是越大的模型在泛化能力方面具有越大的优势,即在模型的训练优化过程中,大模型有更大的可能找到更优的结果。如深度学习中的“大乐透理论”所揭示的,模型越大包含的可能性就越多,就越能找到通向更强智能的“彩票”。这也解释了为什么业界一直在追求更大的模型规模。

汤斯亮解释道,尽管现在模型的规模在持续变大,但最新的模型在实际的训练和使用过程中大模型由神经网络构成,但在实际工作中,如同人类的大脑,只有一小部分神经元是激活高度活跃的。这种稀疏激活减少了计算的复杂性,从而提高模型效率计算量,因此模型的规模与其对应的算力并不一定成固定比例,但肯定是正相关的。

而想要追求更大规模的模型,拿得出足够的算力才算是拿到“入场券”。

他介绍,训练GPT-3所用算力约为1张英伟达A100(相当于3千到5千张英伟达H100 GPU),GPT-4所用算力约为GPT-3的10倍以上,即3万到5万块英伟达H100 GPU。下一代GPT-5的算力需求可能会是GPT-4的10倍。这样看来,10万块英伟达H100 GPU并不多。

值得注意的是,随着模型规模越发庞大,训练所需资源增加,今天AI赛道上的这些“玩家”都意识到了“抱团取暖”的道理。过去一年,美国已出现多个巨头+模型公司的深度联盟。如,微软+OpenAI,亚马逊+Anthropic等。

xAI此次也想借力于Oracle进一步提升大模型研发效率。Oracle是全球云服务市场的主要参与者之一,利用Oracle强大的云基础设施和数据管理能力,以支持xAI在人工智能研究和开发中的计算需求。

训练成本一直是倍受关注的问题,汤斯亮推测,“xAI基于运营成本考虑,可能会将算力托管在Oracle的云端。”

从叠卡到架构设计的较量

既然大家都在追求用更强的算力打造规模更大的模型,那是不是简单粗暴的叠卡(GPU),就能成为AI界的领袖了?

“当然不是”,汤斯亮肯定的回答道,“并不是说卡越多就越强,如何能把卡的算力充分利用,需要计算任务以及软硬件的相互协同。”

“越多的加速卡就意味着越多的卡间与集群间的通讯,以及更多的预处理,这些都将带来大量的额外开销。当额外开销增多的时候,加速就会受限。”

他打了一个比方,一个人就能很快完成的任务如果非要分给四个人去做,过程中开会拉齐进度的沟通成本和时间成本都会造成效率损失。“总的来说大模型的训练想要加速,不仅仅是靠增加加速卡的数量,也需要与之匹配的计算架构,以及与之匹配的计算任务,这样才能最大限度的利用算力增幅。”

“从总体算力来说,马斯克构建超级算力工厂肯定会带来算力大幅提升。现在最大的GPU集群有2.4万块英伟达H100 GPU,一下子提升4倍后,比如原来训练一个大模型需要一个月的时间,在最理想的情况下,现在用1周多的时间就训练完成了。”汤斯亮说。

谈及中国算力现状,汤斯亮坦言,国内能拿得出这个算力数量级的卡的厂商少之又少。就算有这些卡,也无法都拿出去训练大模型,因为还要用于支持别的业务。

这是一个在全球AI算力竞争特殊时期,充满矛盾感的故事——它激烈又沉默,团结又精明,美好又残酷。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赫鲁晓夫:斯大林出卖了高岗,导致苏联失去了中国情报的宝贵来源

赫鲁晓夫:斯大林出卖了高岗,导致苏联失去了中国情报的宝贵来源

南书房
2025-07-04 15:35:03
中国是如何拥有歼20的?美国五角大楼:中国瞒了全世界!

中国是如何拥有歼20的?美国五角大楼:中国瞒了全世界!

桑启红原
2026-01-05 12:49:57
40年国军军长投日,麾下连长选择投奔八路军,10年后连长家喻户晓

40年国军军长投日,麾下连长选择投奔八路军,10年后连长家喻户晓

浩渺青史
2026-01-05 03:12:24
东莞20年:亲眼目睹工厂女工的性生活,她们的孤独压抑和肆意欢歌

东莞20年:亲眼目睹工厂女工的性生活,她们的孤独压抑和肆意欢歌

农村情感故事
2025-04-06 20:07:35
海南一空姐被穷打工仔追求,婚后一个月,她才得知丈夫真实身份

海南一空姐被穷打工仔追求,婚后一个月,她才得知丈夫真实身份

小月文史
2024-11-19 21:11:58
或将搭载V8引擎 奥迪Q9将于2026年发布

或将搭载V8引擎 奥迪Q9将于2026年发布

车质网
2026-01-05 09:27:15
认知的4大境界:达到第3大层次就是开悟,你将不再有精神内耗

认知的4大境界:达到第3大层次就是开悟,你将不再有精神内耗

失语者云骧
2024-09-13 19:49:11
2007年,傅冬菊在北京医院离世,作为推动北平和平解放的功臣,她却曾被多次催促缴纳房款

2007年,傅冬菊在北京医院离世,作为推动北平和平解放的功臣,她却曾被多次催促缴纳房款

寄史言志
2026-01-02 19:54:08
从120斤瘦猴到肌肉巨兽,李维刚到底对这张脸做了什么?

从120斤瘦猴到肌肉巨兽,李维刚到底对这张脸做了什么?

东方不败然多多
2025-12-25 13:11:43
这一夜,70岁米雪秒了78岁的汪明荃,才懂穿着得体的含金量有多高

这一夜,70岁米雪秒了78岁的汪明荃,才懂穿着得体的含金量有多高

洲洲影视娱评
2026-01-05 12:41:30
入粤始祖,后裔2700万,客家八大姓氏之一,认祖归宗凭一首诗

入粤始祖,后裔2700万,客家八大姓氏之一,认祖归宗凭一首诗

铭记历史呀
2026-01-05 03:24:58
南京将适时开展南京大胜关大桥差异化收费研究

南京将适时开展南京大胜关大桥差异化收费研究

现代快报
2026-01-04 23:02:12
山东两地迎来新任区委书记

山东两地迎来新任区委书记

滨州日报
2026-01-05 09:42:18
著名脊柱外科专家、院士候选人,被官宣双开!

著名脊柱外科专家、院士候选人,被官宣双开!

梅斯医学
2026-01-05 07:54:59
最高降4000元,小米正式官宣:1月5日,全品支持国补!

最高降4000元,小米正式官宣:1月5日,全品支持国补!

科技堡垒
2026-01-05 11:49:57
符合预断,川普战略第二步开始:武管美洲、格陵兰、颠覆神权

符合预断,川普战略第二步开始:武管美洲、格陵兰、颠覆神权

邵旭峰域
2026-01-04 11:26:35
铁饭碗碎了!辽宁公立二甲医院正式歇业,行业凛冬

铁饭碗碎了!辽宁公立二甲医院正式歇业,行业凛冬

王晓爱体彩
2026-01-05 07:29:03
随着太阳绝杀雷霆 掘金翻车,湖人逆转灰熊,NBA西部最新排名出炉

随着太阳绝杀雷霆 掘金翻车,湖人逆转灰熊,NBA西部最新排名出炉

董老师看竞技
2026-01-05 13:47:07
官方:上海海港中场徐新离队,转会加盟云南玉昆

官方:上海海港中场徐新离队,转会加盟云南玉昆

懂球帝
2026-01-05 14:19:20
王祖贤参加中医艾灸会,素颜照片曝光翻车:脸部馒化、虎背熊腰

王祖贤参加中医艾灸会,素颜照片曝光翻车:脸部馒化、虎背熊腰

小徐讲八卦
2026-01-05 08:05:06
2026-01-05 15:16:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4631文章数 9175关注度
往期回顾 全部

科技要闻

雷军新年首播:确认汽车业务降速

头条要闻

媒体:美国捉拿马杜罗后 多位专家示警赖清德

头条要闻

媒体:美国捉拿马杜罗后 多位专家示警赖清德

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

李迅雷:扩内需要把重心从"投"转向"消"

汽车要闻

不是9S是8X!极氪全新高性能旗舰SUV命名官宣

态度原创

教育
手机
房产
游戏
军事航空

教育要闻

收藏:山东2026高中综评操作教程(教师端)

手机要闻

消息称vivo、小米、苹果拿下2025年度国内市场激活销量TOP3

房产要闻

再次登顶海南楼市!超越阿那亚的,只有阿那亚!

《碧蓝航线》2025冬日快闪点燃玩家热情 三城线下嘉年华圆满落幕

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版