网易首页 > 网易号 > 正文 申请入驻

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

0
分享至


新智元报道

编辑:桃子

【新智元导读】为了争夺有限的GPU,OpenAI内部一度打得不可开交。2024年总算力投入70亿美元,但算力需求依旧是无底洞。恰恰,微软发布了全球首台GB300超算,专供OpenAI让万亿LLM数天训完。

过去一年,OpenAI在算力上斥资70亿美元。

其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。


可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。

采访中,OpenAI总裁Greg Brockman坦言,「内部如何分配GPU,简直就是一场痛苦与煎熬」。

OpenAI各个团队争抢GPU,那叫一个激烈。最头疼的是,如何去合理分配。


如今,甲骨文、英伟达、AMD等芯片巨头/云服务巨头,纷纷与OpenAI联结,能够解其燃眉之急。

这不,就连曾经最大的「金主爸爸」微软也上阵了。

纳德拉官宣,全球首个配备4600+ GB300的超算率先上线,专攻OpenAI。预计,未来将扩展到十万块GPU。


英伟达称,这一算力巨兽,可以让OpenAI不用数周,仅在数天内训练万亿参数模型。


全球首台GB300超算

数天训出万亿LLM

就在昨天,微软Azure宣布成功交付了,全球首个生产级超大规模AI集群。

它搭载了超4600个GB300 NVL72,配备通过下一代InfiniBand网络互联的Blackwell Ultra GPU。


今年早些时候,微软曾推出GB200 v6虚拟机(VM),通过大规模GB200 NVL2集群,已在OpenAI内部训练部署得到应用。

这一次,GB300 v6虚拟机再次树立了行业标杆。

该系统基于机架级设计,每个机架包含18个虚拟机,共计72个GPU:

  • 72个Blackwell Ultra GPU,搭配36个Grace CPU

  • 通过下一代Quantum-X800 InfiniBand,实现每GPU 800 Gb/s的跨机架横向扩展带宽(2x GB200 NVL72)

  • 机架内130 TB/s的NVLink带宽

  • 37TB高速内存

  • 高达1,440 PFLOPS的FP4 Tensor Core性能


全新设计,为大规模AI超算而生

为打造出最强超算,微软对计算、内存、网络、数据中心、散热和供电等技术栈的每一层,都进行了重新设计。

机架层:低延迟高吞吐

通过NVLink和NVSwitch,GB300 v6在机架层面实现了高达130TB/s的机架内数据传输速率,连接了总计37TB的高速内存,由此消除了内存和带宽瓶颈。

在大模型和长上下文场景下,推理吞吐量大幅提升,为AI智能体和多模态AI带来前所未有的响应速度和扩展性。

同时,Azure部署了采用当今最快网络 fabric——Quantum-X800 Gbp/s InfiniBand——的全连接胖树(fat-tree)无阻塞架构,能够跨机架扩展数万个GPU。

此外,Azure散热系统采用独立的「散热器单元」和「设施级冷却方案」。

在为GB300 NVL72这类高密度、高性能集群保持热稳定性的同时,最大限度地减少了水资源消耗。

软件层:全面优化

不仅如此,微软为存储、编排和调度重构的软件栈也经过全面优化,能够在超算规模上充分利用计算、网络、存储和数据中心基础设施,提供前所未有的高性能和高效率。


OpenAI GPU争夺战

一场「痛苦与煎熬」

在OpenAI内部,正上演一场GPU激烈争夺战。


上周四,Greg在一期「Matthew Berman」播客节目中,自曝管理算力资源分配的过程,令人揪心且筋疲力尽。

这太难了,你总能看到各种绝妙的点子,然后又有人带着另一个绝妙的点子来找你,你心想,这个也太棒了。

在OpenAI内部,将算力资源主要分配给「研究」和「应用产品」两个方向。


为了应对算力分配的挑战,OpenAI建立了一套相对清晰的资源分配机制:

  • 高层决策:由奥特曼和Fidji Simo组成的领导团队,决定研究团队与应用团队之间的总体算力划分;

  • 研究团队内部协调:首席科学家和研究负责人,决定研究团队资源分配;

  • 运营层:由Kevin Park领导的小型内部团队负责GPU的具体分配和调动。


OpenAI复杂算力关系网络图

Greg提到,当一个项目接近尾声时,Kevin会重新分配硬件资源,以支持新启动的项目。

算力驱动着整个团队的生产力,此事干系重大。

大家对此都非常在意。人们对「我能否分到算力」这件事所投入的精力与情感强度远超想象。

一直以来,OpenAI多次公开表达其对算力永不满足的需求。

OpenAI首席产品官Kevin Weil曾表示,「我们每次拿到新的 GPU,它们都会被立刻投入使用」。

OpenAI对算力的需求逻辑很简单——

GPU的数量直接决定了AI应用的能力上限。获得的GPU越多,所有人就能使用越多的AI。


不仅OpenAI,整个行业科技巨头也在加码算力投入。小扎透露,Meta正将「人均算力」打造为核心竞争优势。


上个月,奥特曼称,OpenAI正在推出「算力密集型服务」。

当我们以当前模型的成本,将海量算力投入到有趣的新想法上时,能创造出怎样的可能性?

这场算力争夺战中,谁手握最多的算力,将决定谁在AI竞赛中脱颖而出。

参考资料:

https://x.com/satyanadella/status/1976322455288545343

https://x.com/Azure/status/1976319720472138045 https://azure.microsoft.com/en-us/blog/microsoft-azure-delivers-the-first-large-scale-cluster-with-nvidia-gb300-nvl72-for-openai-workloads/

https://www.businessinsider.com/openai-president-allocate-gpu-compute-internally-greg-brockman-2025-10

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印度航空空难唯一幸存者:饱受PTSD折磨,无法与妻儿说话、工作或驾车,家族生意倒闭,20万临时赔偿金不足以支撑开支

印度航空空难唯一幸存者:饱受PTSD折磨,无法与妻儿说话、工作或驾车,家族生意倒闭,20万临时赔偿金不足以支撑开支

扬子晚报
2025-11-03 21:05:58
湖人今夏引援效果拉满!4将薪资1950万却轰74分,艾顿成最佳代表

湖人今夏引援效果拉满!4将薪资1950万却轰74分,艾顿成最佳代表

篮球资讯达人
2025-11-04 15:19:14
美国称:中国不可怕,可怕的是,中国淘汰4000年的东西他们还在用

美国称:中国不可怕,可怕的是,中国淘汰4000年的东西他们还在用

南宫一二
2025-11-04 16:14:07
许绍雄生忌,许惠菁发文延续“欢喜”精神,和爸爸相处细节太催泪

许绍雄生忌,许惠菁发文延续“欢喜”精神,和爸爸相处细节太催泪

心静物娱
2025-11-04 10:04:32
被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

草莓解说体育
2025-11-04 00:31:01
A股:资金大逃往,尾市拉抬背后,调整结束了?明天大盘怎么走?

A股:资金大逃往,尾市拉抬背后,调整结束了?明天大盘怎么走?

虎哥闲聊
2025-11-04 15:39:56
分享解剖学知识,破除多年来的G点谣传

分享解剖学知识,破除多年来的G点谣传

远方青木
2025-10-25 00:06:11
陈赓曾3次入朝,战后美军直言:他根本就不是来打仗的,为何?

陈赓曾3次入朝,战后美军直言:他根本就不是来打仗的,为何?

丞丞故事汇
2025-10-29 13:40:49
孔孝真结婚后状态依然没变,洒脱自在个性十足,找年下男果然没错

孔孝真结婚后状态依然没变,洒脱自在个性十足,找年下男果然没错

巧百搭
2025-11-04 10:04:08
邱毅喊话郑丽文道歉,再指朱立伦,蔡正元驳斥,吴敦义强硬出手

邱毅喊话郑丽文道歉,再指朱立伦,蔡正元驳斥,吴敦义强硬出手

小撇说事
2025-11-04 15:39:15
刚刚!美股大牛市,突遭警告!

刚刚!美股大牛市,突遭警告!

证券时报
2025-11-04 16:53:08
火箭4连胜后,乌度卡认可一件事,杜兰特很坦诚,申京提到阿门

火箭4连胜后,乌度卡认可一件事,杜兰特很坦诚,申京提到阿门

体坛大辣椒
2025-11-04 13:21:58
1965年,毛主席劝蒋介石回大陆,老蒋提出6个要求,毛主席:同意

1965年,毛主席劝蒋介石回大陆,老蒋提出6个要求,毛主席:同意

诺言卿史录
2025-07-17 14:23:29
冷空气自西向东横扫全国,雨水将在山东“上线”

冷空气自西向东横扫全国,雨水将在山东“上线”

齐鲁壹点
2025-11-04 16:31:42
妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

经典段子
2025-10-11 22:34:42
北京一空姐被银行行长追求,嫁给他4年才发现丈夫真实身份

北京一空姐被银行行长追求,嫁给他4年才发现丈夫真实身份

小哥很OK
2024-09-17 17:45:21
茼蒿立大功!医生调查发现:茼蒿对这5种疾病有好处,建议常吃

茼蒿立大功!医生调查发现:茼蒿对这5种疾病有好处,建议常吃

阿纂看事
2025-10-13 15:36:03
在替补后场中都算是能力较差的,火箭还得减少榜眼郎的出场时间?

在替补后场中都算是能力较差的,火箭还得减少榜眼郎的出场时间?

稻谷与小麦
2025-11-04 16:50:48
别人都给孙颖莎庆生,唯独央视不一样,发文点名王楚钦等人引热议

别人都给孙颖莎庆生,唯独央视不一样,发文点名王楚钦等人引热议

好贤观史记
2025-11-04 15:43:22
老人强坐女子腿上后续:正脸曝光,目击者透更多,上海地铁回应

老人强坐女子腿上后续:正脸曝光,目击者透更多,上海地铁回应

振华观史
2025-11-03 14:30:22
2025-11-04 17:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13783文章数 66237关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

女儿"下腰瘫"后家长起诉中国舞协:教师资格证由其颁发

头条要闻

女儿"下腰瘫"后家长起诉中国舞协:教师资格证由其颁发

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

爸爸去哪儿6孩子现状,个个不同

财经要闻

作价40亿美元!星巴克中国易主

汽车要闻

把海岸诗意织进日常 法拉利Amalfi重塑超跑生活方式

态度原创

艺术
健康
旅游
游戏
公开课

艺术要闻

何镜堂院士出手!广州再添150米新地标

超声探头会加重受伤情况吗?

旅游要闻

千城百县看中国|北京顺义:秋色惹人醉

走错一步,直接宇宙爆炸?星铁新版本的预告居然这么劲爆?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版