网易首页 > 网易号 > 正文 申请入驻

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

0
分享至


新智元报道

编辑:桃子

【新智元导读】为了争夺有限的GPU,OpenAI内部一度打得不可开交。2024年总算力投入70亿美元,但算力需求依旧是无底洞。恰恰,微软发布了全球首台GB300超算,专供OpenAI让万亿LLM数天训完。

过去一年,OpenAI在算力上斥资70亿美元。

其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。


可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。

采访中,OpenAI总裁Greg Brockman坦言,「内部如何分配GPU,简直就是一场痛苦与煎熬」。

OpenAI各个团队争抢GPU,那叫一个激烈。最头疼的是,如何去合理分配。


如今,甲骨文、英伟达、AMD等芯片巨头/云服务巨头,纷纷与OpenAI联结,能够解其燃眉之急。

这不,就连曾经最大的「金主爸爸」微软也上阵了。

纳德拉官宣,全球首个配备4600+ GB300的超算率先上线,专攻OpenAI。预计,未来将扩展到十万块GPU。


英伟达称,这一算力巨兽,可以让OpenAI不用数周,仅在数天内训练万亿参数模型。


全球首台GB300超算

数天训出万亿LLM

就在昨天,微软Azure宣布成功交付了,全球首个生产级超大规模AI集群。

它搭载了超4600个GB300 NVL72,配备通过下一代InfiniBand网络互联的Blackwell Ultra GPU。


今年早些时候,微软曾推出GB200 v6虚拟机(VM),通过大规模GB200 NVL2集群,已在OpenAI内部训练部署得到应用。

这一次,GB300 v6虚拟机再次树立了行业标杆。

该系统基于机架级设计,每个机架包含18个虚拟机,共计72个GPU:

  • 72个Blackwell Ultra GPU,搭配36个Grace CPU

  • 通过下一代Quantum-X800 InfiniBand,实现每GPU 800 Gb/s的跨机架横向扩展带宽(2x GB200 NVL72)

  • 机架内130 TB/s的NVLink带宽

  • 37TB高速内存

  • 高达1,440 PFLOPS的FP4 Tensor Core性能


全新设计,为大规模AI超算而生

为打造出最强超算,微软对计算、内存、网络、数据中心、散热和供电等技术栈的每一层,都进行了重新设计。

机架层:低延迟高吞吐

通过NVLink和NVSwitch,GB300 v6在机架层面实现了高达130TB/s的机架内数据传输速率,连接了总计37TB的高速内存,由此消除了内存和带宽瓶颈。

在大模型和长上下文场景下,推理吞吐量大幅提升,为AI智能体和多模态AI带来前所未有的响应速度和扩展性。

同时,Azure部署了采用当今最快网络 fabric——Quantum-X800 Gbp/s InfiniBand——的全连接胖树(fat-tree)无阻塞架构,能够跨机架扩展数万个GPU。

此外,Azure散热系统采用独立的「散热器单元」和「设施级冷却方案」。

在为GB300 NVL72这类高密度、高性能集群保持热稳定性的同时,最大限度地减少了水资源消耗。

软件层:全面优化

不仅如此,微软为存储、编排和调度重构的软件栈也经过全面优化,能够在超算规模上充分利用计算、网络、存储和数据中心基础设施,提供前所未有的高性能和高效率。


OpenAI GPU争夺战

一场「痛苦与煎熬」

在OpenAI内部,正上演一场GPU激烈争夺战。


上周四,Greg在一期「Matthew Berman」播客节目中,自曝管理算力资源分配的过程,令人揪心且筋疲力尽。

这太难了,你总能看到各种绝妙的点子,然后又有人带着另一个绝妙的点子来找你,你心想,这个也太棒了。

在OpenAI内部,将算力资源主要分配给「研究」和「应用产品」两个方向。


为了应对算力分配的挑战,OpenAI建立了一套相对清晰的资源分配机制:

  • 高层决策:由奥特曼和Fidji Simo组成的领导团队,决定研究团队与应用团队之间的总体算力划分;

  • 研究团队内部协调:首席科学家和研究负责人,决定研究团队资源分配;

  • 运营层:由Kevin Park领导的小型内部团队负责GPU的具体分配和调动。


OpenAI复杂算力关系网络图

Greg提到,当一个项目接近尾声时,Kevin会重新分配硬件资源,以支持新启动的项目。

算力驱动着整个团队的生产力,此事干系重大。

大家对此都非常在意。人们对「我能否分到算力」这件事所投入的精力与情感强度远超想象。

一直以来,OpenAI多次公开表达其对算力永不满足的需求。

OpenAI首席产品官Kevin Weil曾表示,「我们每次拿到新的 GPU,它们都会被立刻投入使用」。

OpenAI对算力的需求逻辑很简单——

GPU的数量直接决定了AI应用的能力上限。获得的GPU越多,所有人就能使用越多的AI。


不仅OpenAI,整个行业科技巨头也在加码算力投入。小扎透露,Meta正将「人均算力」打造为核心竞争优势。


上个月,奥特曼称,OpenAI正在推出「算力密集型服务」。

当我们以当前模型的成本,将海量算力投入到有趣的新想法上时,能创造出怎样的可能性?

这场算力争夺战中,谁手握最多的算力,将决定谁在AI竞赛中脱颖而出。

参考资料:

https://x.com/satyanadella/status/1976322455288545343

https://x.com/Azure/status/1976319720472138045 https://azure.microsoft.com/en-us/blog/microsoft-azure-delivers-the-first-large-scale-cluster-with-nvidia-gb300-nvl72-for-openai-workloads/

https://www.businessinsider.com/openai-president-allocate-gpu-compute-internally-greg-brockman-2025-10

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

瓜哥的动物日记
2026-02-14 00:59:40
金价2月20日行情已清,春节过后,金价可能更大变盘?

金价2月20日行情已清,春节过后,金价可能更大变盘?

小陆搞笑日常
2026-02-21 03:00:15
致命一击!俄罗斯,命脉被掐住了!

致命一击!俄罗斯,命脉被掐住了!

大嘴说天下
2026-02-18 19:48:42
曼城连续21次英超主场对纽卡保持不败,且近16场全胜

曼城连续21次英超主场对纽卡保持不败,且近16场全胜

懂球帝
2026-02-21 00:38:56
炸锅!曼联疯了?5000 万撬皇马弃子,利物浦传奇恐投死敌

炸锅!曼联疯了?5000 万撬皇马弃子,利物浦传奇恐投死敌

澜归序
2026-02-21 03:30:26
中国电子战能力如何?美媒:中国电子战编队能威胁美国水面舰艇

中国电子战能力如何?美媒:中国电子战编队能威胁美国水面舰艇

阿芒娱乐说
2026-02-21 00:36:12
小妈祖被硬拉上轿,长辈拦不住,这句老话刺痛了多少人?

小妈祖被硬拉上轿,长辈拦不住,这句老话刺痛了多少人?

娱乐圈见解说
2026-02-20 10:01:15
什么是低端家庭,在一起吃一顿饭就知道了

什么是低端家庭,在一起吃一顿饭就知道了

木言观
2026-02-17 21:29:51
活得好不等于活得久

活得好不等于活得久

记忆承载
2026-02-20 11:23:15
放心吧,我们不是日本,也不会有“失去的三十年”

放心吧,我们不是日本,也不会有“失去的三十年”

六爷阿旦
2026-01-19 17:10:26
比福建舰还大!4艘万吨巨船同时出坞,美这才明白,输给中国了

比福建舰还大!4艘万吨巨船同时出坞,美这才明白,输给中国了

温读史
2026-01-09 23:42:22
换手机无需太贵!“百里挑一”的3款手机,512GB价格“更香了”

换手机无需太贵!“百里挑一”的3款手机,512GB价格“更香了”

小蜜情感说
2026-02-21 02:52:05
当之无愧!赵心童6:3击败肖恩墨菲,晋级四强,连轰破百单杆

当之无愧!赵心童6:3击败肖恩墨菲,晋级四强,连轰破百单杆

二爷台球解说
2026-02-21 00:22:46
丧夫的翁帆面相都变了,字字不提杨振宁,却句句戳进自己的心窝里

丧夫的翁帆面相都变了,字字不提杨振宁,却句句戳进自己的心窝里

趣味萌宠的日常
2025-12-29 10:21:55
四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

喜欢历史的阿繁
2026-02-07 14:21:17
被索赔22万后续!完整监控流出,真相曝光不简单,赔偿是跑不掉了

被索赔22万后续!完整监控流出,真相曝光不简单,赔偿是跑不掉了

宝哥精彩赛事
2026-02-20 12:49:50
手气爆棚!河南52岁男子打麻将连续自摸胡牌,兴奋过度,突然栽倒牌桌,送医时血压飙升至201/115mmHg

手气爆棚!河南52岁男子打麻将连续自摸胡牌,兴奋过度,突然栽倒牌桌,送医时血压飙升至201/115mmHg

芒果都市
2026-02-20 16:07:55
李嘉诚:现在不买房,三年后是捡漏还是被甩下车?句句大实话!

李嘉诚:现在不买房,三年后是捡漏还是被甩下车?句句大实话!

童童聊娱乐啊
2026-02-21 02:59:35
中国收到以色列警告,称若协助伊朗发展核武器,将面临灾难性后果

中国收到以色列警告,称若协助伊朗发展核武器,将面临灾难性后果

纪中百大事
2026-02-16 11:29:14
纽约时报承认了:生活在中国,就像生活在未来世界

纽约时报承认了:生活在中国,就像生活在未来世界

王晓爱体彩
2026-02-20 21:12:11
2026-02-21 04:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14560文章数 66632关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

健康
教育
时尚
数码
军事航空

转头就晕的耳石症,能开车上班吗?

教育要闻

170所大学,面临破产!

冬季羽绒服是最“受捧”的单品,这样选款和搭配,舒适耐看

数码要闻

AMD "Zen 6" MSDT主流桌面处理器被曝最快2027年推出

军事要闻

消息人士透露:美军赴黄海活动 解放军有效应对处置

无障碍浏览 进入关怀版