网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

老黄祭出新核弹B200！30倍H100单机可训15个GPT-4模型，AI迎新摩尔时代

2024-03-19 08:19:11　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：编辑部

【新智元导读】就在刚刚，老黄又来打破摩尔定律了：英伟达新核弹B200，一块能顶5个H100，30倍推理加速，能训万亿参数大模型！同时推出的AI推理微服务NIM，号称让全世界用上AI。

就在刚刚结束的GTC人工智能大会上，英伟达的新一代性能巨兽Backwell诞生了！

Blackwell B200 GPU，是如今世界上最强大的AI芯片，旨在「普惠万亿参数的AI」。

本来，H100已经使英伟达成为价值数万亿美元的公司，赶超了谷歌和亚马逊，但现在，凭着Blackwell B200和GB200，英伟达的领先优势还要继续领先。

老黄表示——「H100很好，但我们需要更大的GPU」！

新的B200 GPU，从2080亿个晶体管中能提供高达20 petaflops的FP4性能。（H100仅为4 petaflops）

而将两个B200与单个Grace CPU相结合的GB200，则可以为LLM推理工作负载提供30倍的性能，同时大大提高效率。

比起H100，GB200的成本和能耗降低了25倍！

Blackwell芯片和Hopper H100芯片的尺寸比较

这种额外的处理能力，就能让AI公司训练更大、更复杂的模型，甚至可以部署一个27万亿参数的模型。

更大的参数，更多的数据，未来的AI模型，无疑会解锁更多新功能，涌现出更多新的能力。

现在，老黄拿在手里的，或许是100亿美元。

新一代性能巨兽，深夜重磅登场

凭借H100成为全球市值第三大公司的英伟达，今天再次推出了性能野兽——Blackwell B200 GPU和GB200「超级芯片」。

它以著名数学家David Blackwell（1919-2010）命名。他一生中对博弈论、概率论做出了重要的贡献。

老黄表示，「30年来，我们一直在追求加速计算，目标是实现深度学习和AI等变革性突破。生成式AI已然成为我们这个时代的标志性技术，而Blackwell将是推动这场新工业革命的引擎」。

「我们认为这是个完美的博弈概率」。

全新B200 GPU拥有2080亿个晶体管，采用台积电4NP工艺节点，提供高达20 petaflops FP4的算力。

与H100相比，B200的晶体管数量是其（800亿）2倍多。而单个H100最多提供4 petaflops算力，直接实现了5倍性能提升。

而GB200是将2个Blackwell GPU和1个Grace CPU结合在一起，能够为LLM推理工作负载提供30倍性能，同时还可以大大提高效率。

值得一提的是，与H100相比，它的成本和能耗「最多可降低25倍」。

过去，训练一个1.8万亿参数的模型，需要8000个Hopper GPU和15MW的电力。

如今，2000个Blackwell GPU就能完成这项工作，耗电量仅为4MW。

在GPT-3（1750亿参数）大模型基准测试中，GB200的性能是H100的7倍，训练速度是H100的4倍。

GB200由2个GPU、1个CPU、一个主板组成

全新芯片其中一个关键改进是，采用了第二代Transformer引擎。

对每个神经元使用4位（20 petaflops FP4）而不是8位，直接将算力、带宽和模型参数规模提高了一倍。

与此同时，英伟达还推出了第五代NVLink网络技术。

最新的NVLink迭代增强了数万亿参数AI模型的性能，提供了突破性的每GPU双向吞吐量，促进了无缝高速通信。

这也就是第二个关键区别，只有当你连接大量这些GPU时才会出现：新一代NVLink交换机可以让576个GPU相互通信，双向带宽高达1.8TB/秒。

这就要求英伟达打造一个全新的网络交换芯片，其中包含500亿个晶体管和一些自己的板载计算：拥有3.6 teraflops FP8处理能力。

在此之前，由16个GPU组成的集群，有60%的时间用于相互通信，只有40%的时间用于实际计算。

Blackwell GPU增加了对FP4和FP6的支持

另外，Blackwell还配备了RAS引擎。

为了确保可靠性、可用性和可维护性，Blackwell GPU集成了专用引擎和基于AI的预防性维护功能，以最大限度地延长系统正常运行时间并最大限度地降低运营成本。

老黄表示，「过去8年，计算规模扩展已经增加了1000倍」。

网友：新的摩尔定律诞生了！

网友们纷纷惊叹，Blackwell再一次改变了摩尔定律。

英伟达高级科学家Jim Fan表示：Blackwell，城里的新野兽。

- DGX Grace-Blackwell GB200：单机架计算能力超过1 Exaflop。 - 从这个角度来看：老黄交付给OpenAI的第一台DGX是0.17 Petaflops。 - GPT-4-1.8T参数在2000张Blackwell上可在90天内完成训练。

新摩尔定律诞生了。

贾扬清回忆道，「我记得在Meta，当我们在一小时内（2017年）训练ImageNet时，总计算量约为1exaflop。这意味着有了新的DGX，理论上你可以在一秒钟内训练ImageNet」。

还有网友表示，「这简直就是野兽，比H100强太多」。

另有网友戏称，「老黄确认GPT-4是1.8万亿参数」。

所以，GB200的成本是多少呢？英伟达目前并没有公布。

此前据分析师估计，英伟达基于Hopper的H100芯片，每颗的成本在25,000美元到40,000美元之间，整个系统的成本高达200,000美元。

而GB200的成本，只可能更高。

新超算可训万亿参数大模型

当然，有了Blackwell超级芯片，当然还会有Blackwell组成的DGX超算。

这样，公司就会大量购入这些GPU，并将它们封装在更大的设计中。

GB200 NVL72是将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中，可实现总计720 petaflops的AI训练性能，或是1,440 petaflops（1.4 exaflops）的推理性能。

它内部共有5000条独立电缆，长度近两英里。

它的背面效果如下图所示。

机柜中的每个机架包含两个GB200芯片，或两个NVLink交换机。一共有18个GB200芯片托盘，9个NVLink交换机托盘。

老黄现场表示，「一个GB200 NVL72机柜可以训练27万亿参数的模型」。

此前传言称，GPT-4的参数规模达1.8万亿，相当于能训练近15个这样的模型。

与H100相比，对于大模型推理工作负载，GB200超级芯片提供高达30倍的性能提升。

那么，由8个系统组合在一起的就是DGX GB200。

总共有288个Grace CPU、576个Blackwell GPU、240 TB内存和11.5 exaflop FP4计算。

这一系统可以扩展到数万个GB200超级芯片，通过Quantum-X800 InfiniBand（最多144个连接）或Spectrum-X800ethernet（最多64个连接）与800Gbps网络连接在一起。

配备DGX GB200系统的全新DGX SuperPod采用统一的计算架构。

除了第五代NVIDIA NVLink，该架构还包括NVIDIA Bluefield-3 DPU，并将支持Quantum-X800 InfiniBand网络。

这种架构可以为平台中的每个GPU提供高达每秒1,800 GB的带宽。

除此之外，英伟达还发布了统一的超算平台DGX B200，用于AI模型训练、微调和推理。

它包括8个Blackwell GPU和2个第五代Intel Xeon处理器，包含FP4精度功能，提供高达144 petaflops的AI性能、1.4TB的GPU内存和64TB/s的内存带宽。

这使得万亿参数模型的实时推理速度，比上一代产品提高了15倍。

用户还可以使用DGX B200系统构建DGX SuperPOD，创建人工智能卓越中心，为运行多种不同工作的大型开发团队提供动力。

目前，亚马逊、谷歌、微软已经成为最新芯片超算的首批用户。

亚马逊网络服务，将建立一个拥有20,000 GB200芯片的服务器集群。

「不只是一个芯片，更是一个平台」

自从ChatGPT于2022年底掀起AI热潮以来，英伟达的股价已经上涨了五倍之多，总销售额增长了两倍多。

因为英伟达的GPU对于训练和部署大型AI模型至关重要，微软、Meta等大公司都已纷纷豪掷数十亿购买。

如今各大公司和软件制造商还在争先恐后地抢购Hopper H100等芯片呢，GB200就已经出了。

老黄表示，Blackwell不是一个芯片，而是一个平台的名称。

从此，英伟达不再是芯片供应商，而更像是微软、苹果这样的平台提供商，可以让其他公司在平台上构建软件。

英伟达副总裁Manuvir Das表示，GPU是可销售的商业产品，而软件，是为了帮人们用不同的方式使用GPU。

虽然英伟达现在仍然售卖GPU，但真正不同的是，英伟达现在有了商业软件业务。

新软件NIM，代表着英伟达的推理微服务。

NIM使得在英伟达的任何GPU上运行程序都变得更容易，即使是可能更适合部署但不适合构建AI的旧GPU。

也就是说，假如一名开发者有一个有趣的模型，希望向人们推广，就可以把它放到NIM中。英伟达会确保它可以在所有的GPU上运行，这样模型的受众就大大扩展了。

NIM使得部署AI变得更容易，这就更加增加了客户使用英伟达芯片的黏性。

并且，与新AI模型的初始训练相比，NIM的推理需要更少的算力。

这样，想要运行自己AI模型的公司，就能运行自己的AI模型，而不是从OpenAI等公司购买对AI结果的访问权。

需要购买基于英伟达服务器的客户，需要注册Nvidia企业版，每个GPU每年需要花费4,500美元。

英伟达将与微软或Hugging Face等人工智能公司合作，确保他们的人工智能模型经过调整，可以在所有兼容的英伟达芯片上运行。

然后，使用NIM，开发者可以在自己的服务器或基于云的英伟达服务器上，高效运行模型，而无需冗长的配置过程。

Das介绍说，在自己调用OpenAI的代码中，他只替换了一行代码，就指向了NIM。

另外，NIM软件还将帮助AI在配备GPU的笔记本电脑上运行，而不是在云端的服务器上。

NIM支持跨多个领域的AI用例，包括LLMs、视觉语言模型（VLM）以及用于语音、图像、视频、3D、药物发现、医学成像等的模型。

AI API就是未来的软件。在未来，所有LLM都可以从云端获取，从云上下载，运行它的工作站。

终极生成式AI模型

而现在，整个行业都已经为Blackwell准备好了。

2012年，将一只小猫的图片输入，AlexNet识别后输出「cat」，让世界所有人为之震惊，并高呼这改变了一切。

而现在从三个字「cat」输出10 million 像素成为了可能。仅用了10年时间，我们就可以识别文本、图像、视频。

万物都皆可数字化。

网友表示，老黄向我们展示了GenAI的终极游戏：多模态输入——多模态输出。

「这是我们总有一天都会使用的最终模型。它可以获取任何模态并生成任何模态。同时，它还能在没有每个部件的情况下工作」。

数字化的目的是让所有的目标都能成为机器学习的目标，从而让它们都能被AI生成。

比如，数字孪生地球，可以很好地帮助我们了解全球气象气候的变化。

将基因、蛋白质、氨基酸数字化，可以让人类去理解生命的力量。

在大会接近尾声时，活动迎来了一个小高潮：WALL-E机器人也登台表演了。

而生成式AI的未来应用不仅于此。

现在，有了世界最强的处理器Blackwell，新一轮技术革命即将开启。

参考资料：

https://youtu.be/Y2F8yisiS6E?list=TLGGFIbdOwQMZx4xODAzMjAyNA

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

百模大战引爆「千卡集群竞赛」，“中国英伟达”交卷了

智东西 2024-04-26 19:37:00
0 跟贴 0
北京算力基建实施方案重磅发布！重点支持采购自主可控GPU，要支撑万亿参数大模型训练

智东西 2024-04-26 00:17:21
9 跟贴 9

强化中国芯片行业的统一计划性，扭转芯片各自为政下的脆弱生态

经济观察报 2024-03-04 20:51:15
0 跟贴 0

这个扭秧歌的华人大叔，干了家10万亿公司

华商韬略 2024-01-23 10:25:08
0 跟贴 0
美国对华芯片战大获全胜？美商务部长找补，中国用实力戳穿谎言

张学昆看世界 2024-04-27 19:20:08
0 跟贴 0

中国为啥搞不出来自己的英伟达

关不羽 2024-04-23 12:25:21
162 跟贴 162

高通 X Plus 芯片发布，性能超越 M3，AI 能力是亮点

爱范儿 2024-04-26 18:39:13
2 跟贴 2
HBM 4，大战打响！

华尔街见闻官方 2024-04-27 10:59:49
0 跟贴 0

一哄而上，打不赢美国高科技

华商韬略 2024-03-14 10:07:05
3063 跟贴 3063
10000枚导弹瞄准中国，即便美航母都被击沉，美军也敢单挑我军？

早日发达 2024-04-26 11:20:12
22 跟贴 22
麦当劳退款原因写“顾客是傻x”续：已与顾客达成谅解

央广网 2024-04-27 11:50:07
38131 跟贴 38131
打脸太快了，刚说要部署核弹，立马就不认了？俄警告后果严重！

老李得娱乐 2024-04-24 12:26:27
88 跟贴 88
范曾携爱妻外出游玩！86岁打扮时髦被搀扶，徐萌皮草外套近9万

听栀子说 2024-04-24 21:27:43
1390 跟贴 1390
布林肯二度访华，望不虚此行！他能带回什么？

新民晚报 2024-04-27 09:45:19
2275 跟贴 2275
怕啥来啥？俄军大规模进攻即将展开，美军核武器或出现异动

空天力量 2024-04-27 19:55:03
1 跟贴 1
20%的杨幂+80%的泰勒长什么样？全新风格化AI来了，可兼容SD

量子位 2024-01-18 15:38:06
0 跟贴 0
外媒爆料：美军竟然在偷偷使用北斗导航原来中国已大幅超越GPS

军评陈光文 2024-04-27 09:49:56
6810 跟贴 6810
男子持木棒连续猛砸老汉头部围观者大喊"好了"阻止

奇闻吉 2024-04-27 19:10:25
2106 跟贴 2106
胆红素升高是否等同于肝病？听听医生怎么解释这个问题

平价项链合集 2024-04-27 05:57:59
3 跟贴 3
多地彩票店"刮刮乐"售空福彩、体彩：供不应求

财联社 2024-04-27 08:22:09
29775 跟贴 29775
中情局特工提醒俄罗斯，乌克兰再遭到重大失败：美军可能发射核弹

帅先工场 2024-04-26 16:46:41
39 跟贴 39
金靖官宣怀孕引爆全网，男方是《画江湖之不良人》的编导舒奕橙

娱乐寡姐 2024-04-25 13:47:49
74 跟贴 74
美媒：美抗议学生享用免费咖啡背后"金主"是索罗斯

红星新闻 2024-04-27 17:06:41
9334 跟贴 9334
特斯拉和英伟达可能成为“天作之合”

巴伦周刊 2024-04-27 12:08:33
19 跟贴 19
中国国药疫苗之父杨晓明被罢免全国人大代表职务

花非花008 2024-04-27 12:34:20
11120 跟贴 11120
任达华老婆琦琦外貌引热议：岁月留痕，自信发型成焦点

小村民 2024-04-25 11:00:07
30 跟贴 30
再这么搞下去，失业的人只会越来越多！政府该做些什么？

鹏飞深文 2024-04-27 13:40:46
9564 跟贴 9564
人物绘画︱乌克兰画家Joshua Bronaugh绘画作品

艺术名画 2024-04-27 07:05:39
2 跟贴 2
“离谱的AI扩图”火了！张张那叫一个出其不意

量子位 2023-12-05 13:17:05
343 跟贴 343
乌军接连在战场失利，中情局前员工发出警告，美军可能发射核弹

良探长娱乐 2024-04-24 21:29:41
10 跟贴 10
GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

量子位 2023-11-04 13:48:01
212 跟贴 212
独行侠2-1快船卡椒仅16分威少1分&被驱逐东契奇22+10

网易体育 2024-04-27 10:49:06
3670 跟贴 3670
28岁华人Meta软件工程师辞去37万美元工作，理由竟是

新智元 2023-11-05 12:49:48
209 跟贴 209
曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

雷科技 2023-12-20 17:03:55
669 跟贴 669
原神：克洛琳德实机演示，两个白色史莱姆吸人眼球，技能特效炫酷

千浔的屋子 2024-04-26 21:15:04
6 跟贴 6
字幕组就会多管闲事，这不是逼着我玩梗吗？

缘叶二次元 2024-04-24 21:31:16
1 跟贴 1
GPT-4找到我女朋友的过敏原

量子位 2024-01-09 13:34:53
0 跟贴 0
绝世唐门动画46集：王冬“光之女神”形态登场，粉丝们却骂声一片

二次元那些事 2024-04-26 22:07:01
66 跟贴 66
字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

量子位 2023-11-04 13:47:32
0 跟贴 0
记者实测苹果手机输入"发现石油"会自动定位:安卓也是

南方都市报 2024-04-25 08:08:16
8293 跟贴 8293

虚开发票4.43亿元！上海某供应链公司被定性虚开移送司法

虚开发票4.43亿元！上海某供应链公司被定性虚开移送司法

别人都叫我阿腈

2024-04-27 20:21:14

0-0！AC米兰全场0射正，门将6次扑救成遮羞布，尤文三轮不胜！

0-0！AC米兰全场0射正，门将6次扑救成遮羞布，尤文三轮不胜！

钉钉陌上花开

2024-04-28 03:58:50

最新！浙江大学医学院附属第一医院发现癌症潜在预测性生物标志物

最新！浙江大学医学院附属第一医院发现癌症潜在预测性生物标志物

转化医学网

2024-04-26 17:21:19

将遣返乌克兰役龄男性！波兰防长：在咖啡馆看到他们，让援乌的我们感到生气

将遣返乌克兰役龄男性！波兰防长：在咖啡馆看到他们，让援乌的我们感到生气

红星新闻

2024-04-25 20:07:13

陈凯歌获得北京电影节终身成就奖，是整个华语电影的耻辱

陈凯歌获得北京电影节终身成就奖，是整个华语电影的耻辱

Mon巧的时尚品味

2024-04-27 16:48:36

七老板成三只羊唯一不受影响主播？在线人数依然保持在3-5万左右

七老板成三只羊唯一不受影响主播？在线人数依然保持在3-5万左右

杂谈哥闲谈

2024-04-27 23:12:59

4年2.24亿，再见太阳！保罗扯掉了你的遮羞布，KD又一次看走了眼

4年2.24亿，再见太阳！保罗扯掉了你的遮羞布，KD又一次看走了眼

呆哥聊球

2024-04-27 21:42:49

中央纪委国家监委：广西通报5起群众身边不正之风和腐败问题

中央纪委国家监委：广西通报5起群众身边不正之风和腐败问题

极目新闻

2024-04-27 09:14:36

坐拥大唐不夜城、大唐芙蓉园等“摇钱树”，A股旅游龙头深夜公告：董事长被留置！

坐拥大唐不夜城、大唐芙蓉园等“摇钱树”，A股旅游龙头深夜公告：董事长被留置！

每日经济新闻

2024-04-27 00:40:14

布林肯与王毅会谈之际, 赖清德向大陆“求和”, 但开出3个条件

布林肯与王毅会谈之际, 赖清德向大陆“求和”, 但开出3个条件

王者大迷妹

2024-04-27 18:10:56

丈夫升为县长后有了新欢，抛弃我三年后，我的哥哥调来任市委书记

丈夫升为县长后有了新欢，抛弃我三年后，我的哥哥调来任市委书记

乔生桂

2024-04-15 09:21:03

苹果手机输入“发现石油”会自动定位？记者实测：安卓也这样

苹果手机输入“发现石油”会自动定位？记者实测：安卓也这样

南方都市报

2024-04-25 08:08:16

中国人不买印度制造的iPhone15？库克急了：都是大陆生产

中国人不买印度制造的iPhone15？库克急了：都是大陆生产

疯狂小菠萝

2024-04-25 18:47:44

按摩时，足浴技师问你“之前来过么？”可能在暗示你，别不当回事

按摩时，足浴技师问你“之前来过么？”可能在暗示你，别不当回事

毒舌混知所

2024-03-30 07:50:03

硬刚到底！陈震又谈小米SU7支架违法，小米回应，陈震黑历史曝光

硬刚到底！陈震又谈小米SU7支架违法，小米回应，陈震黑历史曝光

天天热点见闻

2024-04-25 20:57:09

妻子被辱母亲被打瘫痪，老实人郑永军提刀上门，灭门村霸一家

妻子被辱母亲被打瘫痪，老实人郑永军提刀上门，灭门村霸一家

苏大强专栏

2024-03-22 22:16:47

未来3年可能出现的变化：现金、房子会贬值，而这4样却可能升值！

未来3年可能出现的变化：现金、房子会贬值，而这4样却可能升值！

静海

2024-02-19 19:00:40

安徽订婚现场，新娘长相引发争议，朋友吐槽新郎：你是真的饿了！

安徽订婚现场，新娘长相引发争议，朋友吐槽新郎：你是真的饿了！

深月望城

2024-04-25 18:04:01

用微信给别人转账以后，一定要记得多加一步，否则到时候打水漂了

用微信给别人转账以后，一定要记得多加一步，否则到时候打水漂了

花小萌和你聊情感

2024-04-25 22:25:44

武磊：中超确实节奏和欧洲联赛不一样，刚回来很轻松12场进了11个

武磊：中超确实节奏和欧洲联赛不一样，刚回来很轻松12场进了11个

直播吧

2024-04-27 12:04:23

AI产业主平台领航智能+时代

10964文章数 65460关注度

往期回顾全部

科技要闻

特斯拉这款车型刚上市几天，就上调价格

头条要闻

租车开网约车遭遇车损"套路":有人扣完押金还要倒补

头条要闻

租车开网约车遭遇车损"套路":有人扣完押金还要倒补

体育要闻

9-13！斯佳辉逆转未果，无缘世锦赛八强，中国选手全部出局

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富海狮 07EV正式到店

态度原创

房产

旅游

本地

艺术

军事航空

房产要闻

海南最新房价出炉，三亚跌价最猛！

旅游要闻

散装河北，冀北、冀东、冀中、冀南如何划分？

本地新闻

蛋友碰碰会空降西安！5.1山海境等你！

艺术要闻

画廊周北京迎来第八年， “漂留” 主题聚集 30 余家艺术机构与 40 场展览

军事要闻

军事专家：福建舰距离海试为期不远

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版