网易首页 > 网易号 > 正文 申请入驻

扎克伯格全力拼AGI:宣布开发两个拥有 2.4万 GPU 的超级计算集群

0
分享至

   本文为 1250 ,建议阅读 3分钟

  Meta宣布了一项重大投资:构建由两套各包含24,576块GPU的数据中心规模集群,以此支撑当前及下一代的人工智能模型训练。这些集群的设计细节涵盖了硬件、网络、存储、性能和软件等方面,专为诸如Llama 3这样的大型语言模型以及其他AI研发工作提供高效且可靠的运行环境

  Meta规划到2024年底大幅扩展其AI基础设施建设,目标是部署约35万个NVIDIA H100 GPU,整体计算能力相当于近60万个H100 GPU。面对快速发展的AI需求,Meta认识到过去或现在的解决方案可能无法满足未来挑战,因此致力于从物理层、虚拟层至软件层全方位评估与改进基础设施,旨在打造灵活可靠的新一代系统,以支持快速演进的AI模型和研究‍

  在网络方面,Meta通过定制化的软硬件和网络架构,成功处理每天数百万亿次的AI模型执行任务。其中一套集群采用基于Arista 7800系列交换机搭配Wedge400和Minipack2 OCP机架交换机构建的远程直接内存访问(RDMA)融合以太网(RoCE)网络架构;另一套则配备NVIDIA Quantum2 InfiniBand网络结构,两者均能实现400 Gbps端点互联。通过对这两种不同类型的互连进行大规模训练适用性和可扩展性评估,Meta能够为未来更大规模集群设计积累宝贵经验‍

  在计算资源上,这两套集群均采用了内部设计并已向OCP社区贡献的开源GPU硬件平台——Grand Teton。该平台集成了多代AI系统的电力、控制、计算和结构接口于一体,提升了整体性能、信号完整性和热效率,并简化了设计,使其能够迅速部署到数据中心中,方便维护和扩展。结合Open Rack电源和机架架构等内部创新,Grand Teton使得Meta能够针对当前及未来的应用场景定制化地构建新的集群‍

  在存储方面,随着生成式AI训练任务日趋多元化,图像、视频和文本数据的大量消耗导致对数据存储的需求急剧增加。Meta自主研发的Linux用户空间文件系统(FUSE)API与优化适用于闪存介质的分布式存储解决方案"Tectonic"相结合,有效解决了集群的大规模数据存储和检查点同步问题。此外,Meta还与Hammerspace合作开发并部署了一套并行网络文件系统(NFS),以满足AI集群的开发者体验需求。Hammerspace技术确保数千块GPU能够在代码变更时即时同步加载,从而支持快速迭代和高吞吐量的EB级存储容量,且不牺牲集群扩展性‍

  存储设施在GenAI集群中采用的是基于YV3 Sierra Point服务器平台升级后的最新高容量E1.S SSD,不仅提高了SSD容量,而且通过定制每机架服务器的数量,实现了吞吐量、服务器数量减少以及相关能耗效率之间的最佳平衡。这种模块化设计使存储层能够如同乐高积木般灵活扩展,适应未来集群对存储需求的增长。通过整合Tectonic与Hammerspace技术,Meta在GenAI集群的存储部署上展现出了卓越的灵活性、高性能与可扩展性,为人工智能的未来发展奠定了坚实基础

  结语

  Meta坚持开源理念,在硬件和软件层面推动开放创新,并将这一承诺付诸实践。作为开放计算项目(OCP)的创始成员,Meta将其内部设计如Grand Teton和Open Rack等贡献给社区,并不断加大对PyTorch这一行业主流AI软件框架的支持力度,继续成为其主要贡献者。同时,Meta还在AI研究领域积极推动开放创新,发起了“开放创新AI研究社区”计划,与学术界携手深入探索负责任地开发和共享AI技术,特别是聚焦于大型语言模型(LLMs)的研究

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东一男子换证需要跨省办理,一气之下对工作人员说“我在杭州没朋友,你帮我办”,没想到对方竟然答应了:68分钟全部搞定

广东一男子换证需要跨省办理,一气之下对工作人员说“我在杭州没朋友,你帮我办”,没想到对方竟然答应了:68分钟全部搞定

大象新闻
2026-02-27 17:53:47
罕见,7家顶级施工单位同一天因围标串标被全军拉黑!

罕见,7家顶级施工单位同一天因围标串标被全军拉黑!

黯泉
2026-03-04 21:52:22
母子相认现场:母亲袖口磨破舍不得扔,却给26岁儿子买新衣新鞋

母子相认现场:母亲袖口磨破舍不得扔,却给26岁儿子买新衣新鞋

匹夫来搞笑
2026-03-05 14:26:35
全球汽车市场销量数据统计更新| 2026年3月4日

全球汽车市场销量数据统计更新| 2026年3月4日

后视镜里de未来
2026-03-04 15:02:18
1949年,蒋介石离开大陆前,在成都装假牙的留影,仪器看着很先进

1949年,蒋介石离开大陆前,在成都装假牙的留影,仪器看着很先进

比利
2026-02-28 13:55:53
日本撑不住了!

日本撑不住了!

晋江电视台
2026-03-05 16:13:31
马筱梅生娃汪家忙翻,全网骂的却不是张兰,是陪了十年的小杨阿姨

马筱梅生娃汪家忙翻,全网骂的却不是张兰,是陪了十年的小杨阿姨

老吴教育课堂
2026-03-04 17:00:03
我花499找人上门安装OpenClaw,看到了AI时代最魔幻的一幕。

我花499找人上门安装OpenClaw,看到了AI时代最魔幻的一幕。

数字生命卡兹克
2026-03-04 10:14:18
费利佩:很荣幸开启国安新篇章,一起创造属于北京的精彩未来

费利佩:很荣幸开启国安新篇章,一起创造属于北京的精彩未来

懂球帝
2026-03-05 12:15:45
场均25.9分!三分53.7%!7换1神级交易

场均25.9分!三分53.7%!7换1神级交易

篮球教学论坛
2026-03-05 15:58:20
绝不姑息!国家出手逮捕的5位华人首富,原因曝光下才知罪有应得

绝不姑息!国家出手逮捕的5位华人首富,原因曝光下才知罪有应得

印度人间美味
2026-02-24 01:00:51
我去!内娱最大的性丑闻,拍出来了

我去!内娱最大的性丑闻,拍出来了

皮蛋儿电影
2026-03-04 14:39:25
15年前,那个当着全世界喝下核污染水的日本官员,如今还活着吗?

15年前,那个当着全世界喝下核污染水的日本官员,如今还活着吗?

墨兰史书
2026-02-09 23:08:35
伊朗发出威力强大的宗教追杀令:要求全球穆斯林人人追杀美以元首

伊朗发出威力强大的宗教追杀令:要求全球穆斯林人人追杀美以元首

音乐时光的娱乐
2026-03-05 11:56:33
“明明还在打仗 为何我的黄金下跌了?”专家解读

“明明还在打仗 为何我的黄金下跌了?”专家解读

新浪财经
2026-03-04 16:37:03
和孙颖莎不和?王曼昱请客漏掉莎莎,原因曝光,谁注意孙颖莎回应

和孙颖莎不和?王曼昱请客漏掉莎莎,原因曝光,谁注意孙颖莎回应

懂球社
2026-03-03 20:55:31
历史开了个玩笑:乌克兰还在硬扛,百年中立的瑞士却先撑不住了?

历史开了个玩笑:乌克兰还在硬扛,百年中立的瑞士却先撑不住了?

丁丁鲤史纪
2026-03-05 16:15:27
对门邻居装了3个摄像头,“能拍到我家客厅”,广州市民报警!最新进展

对门邻居装了3个摄像头,“能拍到我家客厅”,广州市民报警!最新进展

环球网资讯
2026-03-04 20:05:43
王晶大侃万梓良晚年凄凉!他不懂江湖规矩,演戏夸张对手很难接

王晶大侃万梓良晚年凄凉!他不懂江湖规矩,演戏夸张对手很难接

小徐讲八卦
2026-02-11 11:40:12
香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

读懂世界历史
2026-02-12 21:48:53
2026-03-05 16:52:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

阿里内部邮件回应:批准林俊旸辞职

头条要闻

伊外长披露军舰遭袭细节:300公斤弹头在船体下方爆炸

头条要闻

伊外长披露军舰遭袭细节:300公斤弹头在船体下方爆炸

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

小鹏第二代VLA如何破解智驾不敢用的技术困局?

态度原创

教育
时尚
健康
艺术
本地

教育要闻

山东1学校任免校长

打底衫,条纹的最适合春天!

转头就晕的耳石症,能开车上班吗?

艺术要闻

2026年“浩瀚草原 亮丽北疆”美展

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

无障碍浏览 进入关怀版