网易首页 > 网易号 > 正文 申请入驻

英伟达新核弹B200发布,一台服务器顶一个超算,AI推理30倍加速

0
分享至

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

AI春晚GTC开幕,皮衣老黄再次燃爆全场。

时隔两年,英伟达官宣新一代Blackwell架构,定位直指“新工业革命的引擎” ,“把AI扩展到万亿参数”。

作为架构更新大年,本次大会亮点颇多:

  • 宣布GPU新核弹B200,超级芯片GB200
  • Blackwell架构新服务器,一个机柜顶一个超算
  • 推出AI推理微服务NIM,要做世界AI的入口
  • 新光刻技术cuLitho进驻台积电,改进产能。

8年时间,AI算力已增长1000倍。

老黄断言“加速计算到达了临界点,通用计算已经过时了”。

我们需要另一种方式来进行计算,这样我们才能够继续扩展,这样我们才能够继续降低计算成本,这样我们才能够继续进行越来越多的计算。

老黄这次主题演讲题目为《见证AI的变革时刻》,但不得不说,英伟达才是最大的变革本革。

GPU的形态已彻底改变
我们需要更大的GPU,如果不能更大,就把更多GPU组合在一起,变成更大的虚拟GPU。

Blackwell新架构硬件产品线都围绕这一句话展开。

通过芯片,与芯片间的连接技术,一步步构建出大型AI超算集群。

4nm制程达到瓶颈,就把两个芯片合在一起,以10TB每秒的满血带宽互联,组成B200 GPU,总计包含2080亿晶体管。

没错,B100型号被跳过了,直接发布的首个GPU就是B200。

两个B200 GPU与Grace CPU结合就成为GB200超级芯片,通过900GB/s的超低功耗NVLink芯片间互连技术连接在一起。

两个超级芯片装到主板上,成为一个Blackwell计算节点。

18个这样的计算节点共有36CPU+72GPU,组成更大的“虚拟GPU”。

它们之间由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接,可提供速度高达800Gb/s的网络。

在NVLink Switch支持下,最终成为“新一代计算单元”GB200 NVL72

一个像这样的“计算单元”机柜,FP8精度的训练算力就高达720PFlops,直逼H100时代一个DGX SuperPod超级计算机集群(1000 PFlops)。

与相同数量的72个H100相比,GB200 NVL72对于大模型推理性能提升高达30倍成本和能耗降低高达25倍

把GB200 NVL72当作单个GPU使用,具有1.4EFlops的AI推理算力和30TB高速内存。

再用Quantum InfiniBand交换机连接,配合散热系统组成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷机架规模架构,标准配置可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。

此外还支持增加额外的机架扩展性能。

最终成为包含32000 GPU的分布式超算集群。

老黄直言,“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。

将提供无与伦比的规模、可靠性,具有智能管理和全栈弹性,以确保不断的使用。

在演讲中,老黄还特别提到2016年赠送OpenAI的DGX-1,那也是史上第一次8块GPU连在一起组成一个超级计算机。

从此之后便开启了训练最大模型所需算力每6个月翻一倍的增长之路。

GPU新核弹GB200

过去,在90天内训练一个1.8万亿参数的MoE架构GPT模型,需要8000个Hopper架构GPU,15兆瓦功率。

如今,同样给90天时间,在Blackwell架构下只需要2000个GPU,以及1/4的能源消耗。

在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。

Blackwell架构除了芯片本身外,还包含多项重大革新:

  • 第二代Transformer引擎

动态为神经网络中的每个神经元启用FP6和FP4精度支持。

  • 第五代NVLink高速互联

为每个GPU 提供了1.8TB/s双向吞吐量,确保多达576个GPU之间的无缝高速通信。

  • Ras Engine(可靠性、可用性和可维护性引擎)

基于AI的预防性维护来运行诊断和预测可靠性问题。

  • Secure AI

先进的加密计算功能,在不影响性能的情况下保护AI模型和客户数据,对于医疗保健和金融服务等隐私敏感行业至关重要。

  • 专用解压缩引擎

支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。

在这些技术支持下,一个GB200 NVL72就最高支持27万亿参数的模型

而GPT-4根据泄露数据,也不过只有1.7万亿参数。

英伟达要做世界AI的入口

老黄官宣ai.nvidia.com页面,要做世界AI的入口。

任何人都可以通过易于使用的用户界面体验各种AI模型和应用。

同时,企业使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。

这上面的应用都由英伟达全新推出的AI推理微服务NIM支持,可对来自英伟达及合作伙伴的数十个AI模型进行优化推理。

此外,英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问,用于检索增强生成 (RAG)、护栏、数据处理、HPC 等。

比如通过这些微服务,可以轻松构建基于大模型和向量数据库的ChatPDF产品,甚至智能体Agent应用。

NIM微服务定价非常直观,“一个GPU一小时一美元”,或年付打五折,一个GPU一年4500美元。

从此,英伟达NIM和CUDA作为中间枢纽,连接了百万开发者与上亿GPU芯片。

什么概念?

老黄晒出AI界“最强朋友圈”,包括亚马逊、迪士尼、三星等大型企业,都已成为英伟达合作伙伴。

最后总结一下,与往年相比英伟达2024年战略更聚焦AI,而且产品更有针对性。

比如第五代NVLink还特意为MoE架构大模型优化通讯瓶颈。

新的芯片和软件服务,都在不断的强调推理算力,要进一步打开AI应用部署市场。

当然作为算力之王,AI并不是英伟达的全部。

这次大会上,还特别宣布了与苹果在Vision Pro方面的合作,让开发者在工业元宇宙里搞空间计算。

此前推出的新光刻技术cuLitho软件库也有了新进展,被台积电和新思科技采用,把触手伸向更上游的芯片制造商。

当然也少不了生物医疗、工业元宇宙、机器人汽车的新成果。

以及布局下一轮计算变革的前沿领域,英伟达推出云量子计算机模拟微服务,让全球科学家都能充分利用量子计算的力量,将自己的想法变成现实。

One More Thing

去年GTC大会上,老黄与OpenAI首席科学家Ilya Sutskever的炉边对谈,仍为人津津乐道。

当时世界还没完全从ChatGPT的震撼中清醒过来,OpenAI是整个行业绝对的主角。

如今Ilya不知踪影,OpenAI的市场统治力也开始松动。在这个节骨眼上,有资格与老黄对谈的人换成了8位——

Transformer八子,开山论文《Attention is all you need》的八位作者。

他们陆陆续续已经悉数离开谷歌,其中7位投身AI创业,有模型层也有应用层,有toB也有toC。

这八位传奇人物既象征着大模型技术真正的起源,又代表着现在百花齐放的AI产业图景。在这样的格局中,OpenAI不过是其中一位玩家。

而就在两天后,老黄将把他们聚齐,在自己的主场。

要论在整个AI界的影响力、号召力,在这一刻,无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman,恐怕都比不过眼前这位“皮衣客”黄仁勋。

直播回放:
https://www.youtube.com/watch?v=Y2F8yisiS6E

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
VIVO从印度成功转走7000亿?大批外资企业撤离,莫迪已尝到苦果?

VIVO从印度成功转走7000亿?大批外资企业撤离,莫迪已尝到苦果?

顾史
2026-02-23 23:29:51
“七十不添衣,八十不祝寿”,这句话指的是啥?看完后涨知识了

“七十不添衣,八十不祝寿”,这句话指的是啥?看完后涨知识了

阿龙美食记
2026-02-26 14:30:14
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
日本女子撞飞中国幼童后续:拒不道歉,身份曝光,专挑游客小孩

日本女子撞飞中国幼童后续:拒不道歉,身份曝光,专挑游客小孩

离离言几许
2026-02-28 12:02:18
巴拿马行动后,李嘉诚72小时狂抛1100亿,西方成强盗窝

巴拿马行动后,李嘉诚72小时狂抛1100亿,西方成强盗窝

谁将笑到最后
2026-02-28 23:34:03
A股:不必等明天开盘了,股市已经有变化,周一很可能这样走了

A股:不必等明天开盘了,股市已经有变化,周一很可能这样走了

财经大拿
2026-03-01 12:02:26
首都医科大学党委书记调整

首都医科大学党委书记调整

医学界
2026-03-01 18:42:21
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
杨靖宇后人现状:妻子被丢进粪坑淹死,儿子37岁殉职,留5个子女

杨靖宇后人现状:妻子被丢进粪坑淹死,儿子37岁殉职,留5个子女

近史谈
2026-03-01 13:11:38
人品好!张本美和:我解释后王曼昱同意医疗暂停 赛后问我没问题吧

人品好!张本美和:我解释后王曼昱同意医疗暂停 赛后问我没问题吧

818体育
2026-03-01 13:27:01
张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

秀语千寻
2026-02-22 19:28:42
美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

悦心知足
2026-02-21 23:03:46
第5波伊朗导弹雨杀到,美军航母基地剧烈大爆炸:彻底拦不住了!

第5波伊朗导弹雨杀到,美军航母基地剧烈大爆炸:彻底拦不住了!

青烟小先生
2026-03-01 14:27:37
你被老外问过哪些离谱问题?网友:我朋友让我给他带一只熊猫

你被老外问过哪些离谱问题?网友:我朋友让我给他带一只熊猫

带你感受人间冷暖
2026-02-02 00:30:03
中东航班深夜返航 有旅客中途暴哭:安全最重要

中东航班深夜返航 有旅客中途暴哭:安全最重要

看看新闻Knews
2026-03-01 10:35:03
伊朗强势反击美军基地损失惨重,俄法纷纷介入,中方态度非比寻常

伊朗强势反击美军基地损失惨重,俄法纷纷介入,中方态度非比寻常

一盅情怀
2026-03-01 17:47:10
当年举债120亿“吞”下沃尔沃!如今16年过去,李书福赚了多少?

当年举债120亿“吞”下沃尔沃!如今16年过去,李书福赚了多少?

牛锅巴小钒
2026-02-25 15:15:15
单局轰9-1提前终结悬念,孙颖莎4-1轻取师妹,打进决赛再战王曼昱

单局轰9-1提前终结悬念,孙颖莎4-1轻取师妹,打进决赛再战王曼昱

乒谈
2026-03-01 13:57:43
1946年安徽老太给八路军带路,副班长觉察不对,大喊道:这条路不对

1946年安徽老太给八路军带路,副班长觉察不对,大喊道:这条路不对

程哥讲堂
2025-06-25 17:02:07
美以对伊朗斩首轰炸得逞 “反常规”白天空袭是成功关键

美以对伊朗斩首轰炸得逞 “反常规”白天空袭是成功关键

洪超飞军事
2026-03-01 11:47:26
2026-03-01 21:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
12211文章数 176399关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

伊朗代表在安理会会议上直接警告美方:建议你保持礼貌

头条要闻

伊朗代表在安理会会议上直接警告美方:建议你保持礼貌

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

时尚
房产
教育
数码
本地

今年春天最流行的4件卫衣,照着穿就很好看

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

教育要闻

辅导员,全部入编

数码要闻

小米Vision Gran Turismo超跑设计细节首曝

本地新闻

津南好·四时总相宜

无障碍浏览 进入关怀版