网易首页 > 网易号 > 正文 申请入驻

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

0
分享至

新智元报道

编辑:桃子

【新智元导读】为了争夺有限的GPU,OpenAI内部一度打得不可开交。2024年总算力投入70亿美元,但算力需求依旧是无底洞。恰恰,微软发布了全球首台GB300超算,专供OpenAI让万亿LLM数天训完。

过去一年,OpenAI在算力上斥资70亿美元。

其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。

可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。

采访中,OpenAI总裁Greg Brockman坦言,「内部如何分配GPU,简直就是一场痛苦与煎熬」。

OpenAI各个团队争抢GPU,那叫一个激烈。最头疼的是,如何去合理分配。

如今,甲骨文、英伟达、AMD等芯片巨头/云服务巨头,纷纷与OpenAI联结,能够解其燃眉之急。

这不,就连曾经最大的「金主爸爸」微软也上阵了。

纳德拉官宣,全球首个配备4600+ GB300的超算率先上线,专攻OpenAI。预计,未来将扩展到十万块GPU。

英伟达称,这一算力巨兽,可以让OpenAI不用数周,仅在数天内训练万亿参数模型。

全球首台GB300超算

数天训出万亿LLM

就在昨天,微软Azure宣布成功交付了,全球首个生产级超大规模AI集群。

它搭载了超4600个GB300 NVL72,配备通过下一代InfiniBand网络互联的Blackwell Ultra GPU。

今年早些时候,微软曾推出GB200 v6虚拟机(VM),通过大规模GB200 NVL2集群,已在OpenAI内部训练部署得到应用。

这一次,GB300 v6虚拟机再次树立了行业标杆。

该系统基于机架级设计,每个机架包含18个虚拟机,共计72个GPU:

  • 72个Blackwell Ultra GPU,搭配36个Grace CPU

  • 通过下一代Quantum-X800 InfiniBand,实现每GPU 800 Gb/s的跨机架横向扩展带宽(2x GB200 NVL72)

  • 机架内130 TB/s的NVLink带宽

  • 37TB高速内存

  • 高达1,440 PFLOPS的FP4 Tensor Core性能

全新设计,为大规模AI超算而生

为打造出最强超算,微软对计算、内存、网络、数据中心、散热和供电等技术栈的每一层,都进行了重新设计。

机架层:低延迟高吞吐

通过NVLink和NVSwitch,GB300 v6在机架层面实现了高达130TB/s的机架内数据传输速率,连接了总计37TB的高速内存,由此消除了内存和带宽瓶颈。

在大模型和长上下文场景下,推理吞吐量大幅提升,为AI智能体和多模态AI带来前所未有的响应速度和扩展性。

同时,Azure部署了采用当今最快网络 fabric——Quantum-X800 Gbp/s InfiniBand——的全连接胖树(fat-tree)无阻塞架构,能够跨机架扩展数万个GPU。

此外,Azure散热系统采用独立的「散热器单元」和「设施级冷却方案」。

在为GB300 NVL72这类高密度、高性能集群保持热稳定性的同时,最大限度地减少了水资源消耗。

软件层:全面优化

不仅如此,微软为存储、编排和调度重构的软件栈也经过全面优化,能够在超算规模上充分利用计算、网络、存储和数据中心基础设施,提供前所未有的高性能和高效率。

OpenAI GPU争夺战

一场「痛苦与煎熬」

在OpenAI内部,正上演一场GPU激烈争夺战。

上周四,Greg在一期「Matthew Berman」播客节目中,自曝管理算力资源分配的过程,令人揪心且筋疲力尽。

这太难了,你总能看到各种绝妙的点子,然后又有人带着另一个绝妙的点子来找你,你心想,这个也太棒了。

在OpenAI内部,将算力资源主要分配给「研究」和「应用产品」两个方向。

为了应对算力分配的挑战,OpenAI建立了一套相对清晰的资源分配机制:

  • 高层决策:由奥特曼和Fidji Simo组成的领导团队,决定研究团队与应用团队之间的总体算力划分;

  • 研究团队内部协调:首席科学家和研究负责人,决定研究团队资源分配;

  • 运营层:由Kevin Park领导的小型内部团队负责GPU的具体分配和调动。

OpenAI复杂算力关系网络图

Greg提到,当一个项目接近尾声时,Kevin会重新分配硬件资源,以支持新启动的项目。

算力驱动着整个团队的生产力,此事干系重大。

大家对此都非常在意。人们对「我能否分到算力」这件事所投入的精力与情感强度远超想象。

一直以来,OpenAI多次公开表达其对算力永不满足的需求。

OpenAI首席产品官Kevin Weil曾表示,「我们每次拿到新的 GPU,它们都会被立刻投入使用」。

OpenAI对算力的需求逻辑很简单——

GPU的数量直接决定了AI应用的能力上限。获得的GPU越多,所有人就能使用越多的AI。

不仅OpenAI,整个行业科技巨头也在加码算力投入。小扎透露,Meta正将「人均算力」打造为核心竞争优势。

上个月,奥特曼称,OpenAI正在推出「算力密集型服务」。

当我们以当前模型的成本,将海量算力投入到有趣的新想法上时,能创造出怎样的可能性?

这场算力争夺战中,谁手握最多的算力,将决定谁在AI竞赛中脱颖而出。

参考资料:

https://x.com/satyanadella/status/1976322455288545343

https://x.com/Azure/status/1976319720472138045 https://azure.microsoft.com/en-us/blog/microsoft-azure-delivers-the-first-large-scale-cluster-with-nvidia-gb300-nvl72-for-openai-workloads/

https://www.businessinsider.com/openai-president-allocate-gpu-compute-internally-greg-brockman-2025-10

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子4次参加高考,先后考上复旦、北大、清华,都因一恶习被劝退

男子4次参加高考,先后考上复旦、北大、清华,都因一恶习被劝退

糖逗在娱乐
2026-06-29 19:14:59
“臭名昭著”的390所大学,毕业证=废纸!

“臭名昭著”的390所大学,毕业证=废纸!

谭老师地理大课堂
2026-06-30 01:35:05
巴西补时“绝杀”,日本出局,森保一:是我水平不足

巴西补时“绝杀”,日本出局,森保一:是我水平不足

扬子晚报
2026-06-30 07:27:59
630G 机密外泄iPhone18 全套图纸从印度代工厂流出,苹果底牌全曝光

630G 机密外泄iPhone18 全套图纸从印度代工厂流出,苹果底牌全曝光

小兔子发现大事情
2026-06-30 00:34:50
日元击穿四十年底线,今年数万亿日元干预成果尽数回吐,东京深陷政策死结

日元击穿四十年底线,今年数万亿日元干预成果尽数回吐,东京深陷政策死结

华尔街见闻官方
2026-06-30 01:06:02
名帅有能!巴西队2比1绝杀逆转日本队晋级,胜利属于意大利教练安切洛蒂

名帅有能!巴西队2比1绝杀逆转日本队晋级,胜利属于意大利教练安切洛蒂

上观新闻
2026-06-30 03:28:50
12岁男生放学回家后坠亡,此前曾因涉早恋问题被老师公开批评,家长起诉学校索赔92万

12岁男生放学回家后坠亡,此前曾因涉早恋问题被老师公开批评,家长起诉学校索赔92万

大风新闻
2026-06-29 21:07:07
初婚人口跌破1000万,社会将迎来剧变

初婚人口跌破1000万,社会将迎来剧变

谭谈投研
2026-06-29 22:34:09
乌克兰36岁国防部长费多罗夫专访:人工智能和无人机正在重塑现代战场

乌克兰36岁国防部长费多罗夫专访:人工智能和无人机正在重塑现代战场

爆角追踪
2026-06-29 17:31:33
韩红道歉!发文时已泣不成声,会退出公益事业,多位名人发声挽留

韩红道歉!发文时已泣不成声,会退出公益事业,多位名人发声挽留

青梅侃史啊
2026-06-29 14:25:49
马尔代夫“隐形消费”曝光:一顿午饭384美元,中产还在为幻想买单?

马尔代夫“隐形消费”曝光:一顿午饭384美元,中产还在为幻想买单?

黑哥讲现代史
2026-06-30 00:57:35
38岁德国少帅出局后炮轰:加时绝杀被吹堪称丑闻 我不会主动辞职

38岁德国少帅出局后炮轰:加时绝杀被吹堪称丑闻 我不会主动辞职

我爱英超
2026-06-30 08:52:01
没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

顾史
2026-06-30 02:21:37
司机拿5000,执法端吞322万:虹吸执法利益链如何分配?

司机拿5000,执法端吞322万:虹吸执法利益链如何分配?

娱乐圈的笔娱君
2026-06-30 01:39:05
世界杯爆雷:佛得角队长涉嫌强奸翻译被调查,FIFA回应,或判20年

世界杯爆雷:佛得角队长涉嫌强奸翻译被调查,FIFA回应,或判20年

老欧讲大案
2026-06-29 14:50:01
民众疯抢空调,政府不准,热死也不能买?徳媒怒斥中国正摧毁欧洲

民众疯抢空调,政府不准,热死也不能买?徳媒怒斥中国正摧毁欧洲

嫹笔牂牂
2026-06-29 11:35:39
耻辱出局!德国世界杯头号罪人!一脚葬送全队晋级希望

耻辱出局!德国世界杯头号罪人!一脚葬送全队晋级希望

奶盖熊本熊
2026-06-30 08:14:19
瓜迪奥拉致德国三届世界杯止步,传控战术毁铁血战车

瓜迪奥拉致德国三届世界杯止步,传控战术毁铁血战车

老牛体育解说
2026-06-30 09:17:14
热死也不能买中国空调?德国媒体:中国正“摧毁”欧洲

热死也不能买中国空调?德国媒体:中国正“摧毁”欧洲

热血江湖旧
2026-06-29 10:42:41
审计署抽查60县,平均每个县翻出10个亿问题资金

审计署抽查60县,平均每个县翻出10个亿问题资金

风向观察
2026-06-30 10:44:34
2026-06-30 11:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15565文章数 66944关注度
往期回顾 全部

科技要闻

DeepSeek V4正式版要来 高峰期API价格翻倍

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

体育要闻

日本众将掩面痛哭 连续3届先破门却被逆转

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

亲子
游戏
时尚
健康
本地

亲子要闻

路面塌了,人和车掉进去,怪小逗和同学紧急救援!

《边缘行者2》引爆热潮!《赛博朋克2077》在线新高

“复古波点”又流行回来了!夏天简单穿就很时髦

狂吃“糯叽叽”小心肠梗阻!

本地新闻

贵州小城的新目标:举办“村超”世界杯!

无障碍浏览 进入关怀版