网易首页 > 网易号 > 正文 申请入驻

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

0
分享至

皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场!



性能方面,和去年发布的GB200相比,推理性能是其1.5倍。



据悉,GB300将在今年的下半年出货。

除此之外,老黄还预览(2026年下半年发货)了英伟达下一代AI超级芯片,名字大变样——Vera Rubin



其实它的命名规则和Grace Blackwell(GB)类似:Grace是CPU,Blackwell是GPU。

而Vera Rubin中的Vera是CPU,Rubin是GPU。根据老黄的说法:

几乎所有细节都是新的。

从预览的性能来看,Vera Rubin整体性能更是GB300的3.3倍。更具体一些:

  • Vera:CPU的内存是Grace的4.2倍,内存带宽是Grace的2.4倍。
  • Rubin:将配备288GB的HBM4。

在Vera Rubin之后的下一代GPU(2027年下半年),英伟达会将其命名为Rubin Ultra,性能直接拉到GB300的14倍



一个直观的对比,如下图所示:



更多的具体性能对比,是这样的:



性能上的提升,也正应了老黄在现场说的那句话:

大规模推理是一种极限计算。
Inference at-scale is extreme computing.

不仅如此,就连Rubin之后的下一代GPU,老黄也给亮出来了——将以Feynman来命名。



而纵观整场GTC,我们可以轻松提炼老黄提及最多的几个关键词:tokens推理Agentic AI

但除此之外,还有一个比较有意思的关键词——DeepSeek

英伟达官方博客称:

实现了DeepSeek-R1推理性能世界纪录。
每个用户每秒可处理超过250个token;实现每秒超过30000个token的最大吞吐量。



但这项纪录采用的是B200,英伟达表示随着Blackwell Ultra等新GPU的出现,纪录还将继续被打破。



而老黄在现场体现传统LLM和推理LLM的区别时,也是拿着DeepSeek-R1来举例:



嗯,微妙,着实有点微妙。

那么除了一系列新GPU之外,还有什么?我们继续往下看。

推出两款个人AI超级计算机

首先,第一款个人AI超级计算机,叫做DGX Spark

它就是老黄在今年1月份CES中发布的那个全球最小的个人AI超级计算机Project Digits,这次取了个正式的名字。



DGX Spark售价3000美元(约21685元),大小和Mac Mini相当。

它采用的是英伟达GB10芯片,能够提供每秒1000万亿次的AI运算,用于微调和推理最新AI模型。

其中,GB10采用了NVLink-C2C互连技术,提供CPU+ gpu的相干内存模型,带宽是第五代PCIe的5倍。

值得一提的是,英伟达官网已经开发预定了哦~

至于第二款个人AI超级电脑,则是DGX Station



DGX Station所采用的,正是今天推出的GB300,也是首个采用这款芯片的AI电脑。

其性能如下:

  • 拥有784GB的相干内存空间
  • 拥有英伟达的ConnectX-8超级网卡,支持高达800Gb/s的网络速度
  • 拥有Nvidia的CUDA-X AI平台,可访问NIM微服务和AI Enterprise

用老黄的话来说就是:

这就是PC应该有的样子。
This is what a PC should look like.

至于上市赶时间,则是将于今年晚些时候从华硕、BOXX、戴尔、惠普、Lambda和美超微等厂商处推出。



△搭载GB300的DGX Station主板

而根据英伟达官方的介绍,这两款个人AI超级计算机,是面向研究人员、数据科学家、AI开发者和学生设计的。



除此之外,老黄在这届GTC上还涉足了以太网,推出全球首个面向AI的以太网网络平台——Spectrum-X

它由英伟达的Spectrum-4以太网交换机和BlueField-3 SuperNIC共同发力,能为AI、机器学习和自然语言处理等提供高性能支持。

相比传统以太网,Spectrum-X可将AI网络性能提升1.6倍,提高AI云的电力效率。



以及还包括基于硅光学的Spectrum-X Photonics和Quantum-X Photonics网络交换平台,用于使用硅光学的超大规模数据中心。

新的网络交换平台将端口数据传输速度提升至1.6Tb/s,总传输速度达到400Tb/s,使数百万个GPU能够无缝协同工作。



还开源了一系列软件

除了硬件,英伟达这次在软件开源方面也有几个新动作。

其中最重磅的,当属发布NVIDIA Dyamo,一个用于加速AI模型推理的分布式推理服务库

老黄将其称为“AI工厂的操作系统”,核心目标在于提高推理性能的同时降低Test-Time算力消耗。



按照英伟达的说法,在NVIDIA Blackwell上使用Dynamo优化推理,能让DeepSeek-R1的吞吐量提升30倍



至于背后原因,主要在于Dynamo可以通过动态调整GPU资源应对请求波动,并优化数据卸载到成本更低的存储设备,从而降低推理成本并提高效率。

目前Dynamo已完全开源,支持PyTorch、SGLang、NVIDIA TensorRTyTM以及vLLM,在GitHub获取后即可将推理工作分配到多达1000个NVIDIA GPU芯片。

此外,英伟达还宣布开源新的AI推理模型——Llama Nemotron,该系列模型也曾出现在今年1月的CES上。

据介绍,Llama Nemotron基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。

为了直观展示其性能,老黄在大会上将它和Llama 3.3(70B)以及DeepSeek R1 Llama (70B)进行了对比,下图展示了它们在Agentic任务上的平均准确率(横轴)与每秒处理的tokens数量(纵轴):



可以看出,新的推理模型以49B参数量性能远超另外两个模型,在Agentic任务中表现更为突出。

目前Nano和Super模型可在NIM微服务中获取,Ultra模型即将推出。



与此同时,英伟达在自动驾驶具身智能方面也有新进展。

大会开始不久,老黄即宣布英伟达与通用汽车达成合作:

通用将在自动驾驶上使用英伟达的AI技术。



在这之后,英伟达正式发布了端到端自动驾驶汽车全栈综合安全系统NVIDIA Halos

这个系统主要将NVIDIA的汽车硬件和软件解决方案与尖端AI研究相结合,以确保从云端到车辆的自动驾驶汽车(AVs)的安全开发。

介绍过程中,老黄多次提到了“安全性”这个词,并公开声称:

我们是世界上第一家对每一行代码进行安全评估的公司

落实到具体上,Halos系统主要在三个互补的层面提供支持:

  • 技术层面:包括平台安全、算法安全和生态系统安全;
  • 开发层面:涵盖设计阶段、部署阶段和验证阶段的安全防护措施;
  • 计算层面:从AI训练到部署的全过程,利用三种强大的计算平台,分别是NVIDIA DGX用于AI训练,NVIDIA Omniverse和NVIDIA Cosmos在NVIDIA OVX上运行用于模拟,以及NVIDIA DRIVE AGX用于部署。



到了大会的最后阶段,老黄宣布英伟达与Google DeepMind和Disney Research正合作开发下一代开源仿真物理模型Newton



据英伟达介绍,Newton基于NVIDIA Warp构建,支持与MuJoCo Playground或NVIDIA Isaac Lab等学习框架兼容。

它主要用于机器人模拟训练,使用之后可以帮助研究人员安全、加速且低成本地训练/开发/测试/验证机器人控制算法和原型设计。



同时,英伟达还同步推出了Isaac GR00T N1,号称全球首个开源的、完全可定制的人形机器人基础模型。

它采用双系统架构,灵感来自人类思考模式,包括快速思考的动作模型(System 1)和慢速思考的决策模型(System 2)。



在大会演示中,GR00T N1能够轻松泛化常见的任务,如抓取、移动物体以及在双臂之间转移物品,或执行需要长时间推理的复杂任务。



最后的最后,老黄在谢幕之前还成功“召唤”出了配有GR00T N1模型的机器人——Blue(星球大战机器人)。



虽然过程中有些不听话的“叛逆行为”,但好在还是给了点老黄面子(doge)。



One More Thing

今年的GTC大会,除了老黄的主题演讲,还有一件事最值得期待:

那就是今年首次设立的“量子日”活动,届时老黄将与D-Wave Quantum和Rigetti Computing等十余家量子计算行业领军企业的高管同台,讨论量子计算的技术现状、潜力以及未来发展方向。

要知道今年年初时,老黄一句“量子计算还需20年才实用”,相关概念股曾应声腰斩。

所以大家这次都在观望,老黄是否又会“语出惊人”,相关探讨是否会对量子计算产业产生更大影响。

咱们继续坐等答案揭晓~



老黄演讲回看地址:
https://www.youtube.com/watch?v=_waPvOwL9Z8

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关税战不打了? 美财长提“弃台”换免债,中方已用十个大字表态

关税战不打了? 美财长提“弃台”换免债,中方已用十个大字表态

前沿天地
2025-04-26 23:28:25
恭喜!26岁国乒世界冠军完婚,31岁妻子身份揭晓,孙颖莎送祝福

恭喜!26岁国乒世界冠军完婚,31岁妻子身份揭晓,孙颖莎送祝福

知轩体育
2025-04-26 18:53:06
1-0,45岁前广州主帅神了:率重庆劲旅5连胜登顶,西班牙悍将制胜

1-0,45岁前广州主帅神了:率重庆劲旅5连胜登顶,西班牙悍将制胜

侧身凌空斩
2025-04-26 21:24:30
面对新式红卫兵,一个历史老师的无奈:谁之罪?

面对新式红卫兵,一个历史老师的无奈:谁之罪?

霹雳炮
2025-04-23 23:16:50
主场夺赛点?ESPN预测明日G4森林狼胜率51.5%,湖人胜率48.5%

主场夺赛点?ESPN预测明日G4森林狼胜率51.5%,湖人胜率48.5%

雷速体育
2025-04-27 08:33:30
台海形势逆转!国防部就台海问题表态后,“台独”三巨头全面溃退

台海形势逆转!国防部就台海问题表态后,“台独”三巨头全面溃退

猎火照狼山
2025-04-26 18:52:34
教皇封棺画面公开,生前决定不要三层棺木,侄子没钱出席米莱挨批

教皇封棺画面公开,生前决定不要三层棺木,侄子没钱出席米莱挨批

晓风说
2025-04-26 20:23:12
90后摄影师镜头下的重庆再被外交部发言人全球推荐:外交部特别宠爱重庆风光

90后摄影师镜头下的重庆再被外交部发言人全球推荐:外交部特别宠爱重庆风光

上游新闻
2025-04-26 21:25:21
中日友好医院副主任出轨4人:2人怀孕3次,护士长照片流出

中日友好医院副主任出轨4人:2人怀孕3次,护士长照片流出

农村情感故事
2025-04-26 15:24:44
为什么中国三军仪仗队在越南被“惊为天人”?

为什么中国三军仪仗队在越南被“惊为天人”?

解筱文
2025-04-27 00:12:08
造价1400000000巨船火了 拍摄者:想让更多人了解中国造船业

造价1400000000巨船火了 拍摄者:想让更多人了解中国造船业

封面新闻
2025-04-26 14:30:12
海南通报一酒店保洁员调包住客港币:成立调查组赴属地调查

海南通报一酒店保洁员调包住客港币:成立调查组赴属地调查

界面新闻
2025-04-27 07:24:42
目击者描述伊朗港口爆炸瞬间:爆炸声巨大 黑烟滚滚

目击者描述伊朗港口爆炸瞬间:爆炸声巨大 黑烟滚滚

北青网-北京青年报
2025-04-27 08:32:05
88岁教皇方济各去世,他的遗产数目刚刚曝出,网友瞠目结舌

88岁教皇方济各去世,他的遗产数目刚刚曝出,网友瞠目结舌

胡侃社会百态
2025-04-22 14:54:01
海关总署:4月22日起,允许符合相关要求的阿根廷牛黄进口

海关总署:4月22日起,允许符合相关要求的阿根廷牛黄进口

每日经济新闻
2025-04-26 21:57:06
已释怀!王菲去看谢霆锋演唱会,同天张柏芝戴千万珠宝拍大片

已释怀!王菲去看谢霆锋演唱会,同天张柏芝戴千万珠宝拍大片

明月聊史
2025-04-26 17:46:49
快讯丨贾跃亭:FF市值达到百亿美元基本能还完中国债务

快讯丨贾跃亭:FF市值达到百亿美元基本能还完中国债务

每日经济新闻
2025-04-26 10:01:07
俄总参谋长盛赞朝军英勇,库尔斯克解放后1.2万名朝军去向成谜!

俄总参谋长盛赞朝军英勇,库尔斯克解放后1.2万名朝军去向成谜!

凯撒谈兵
2025-04-26 22:04:44
中美贸易战或现转机?4月27日,深夜的三大重要消息正式传来!

中美贸易战或现转机?4月27日,深夜的三大重要消息正式传来!

风口招财猪
2025-04-27 02:11:04
H级无罩樱花妹合体超凶女神!比基尼包不住:影片看不完

H级无罩樱花妹合体超凶女神!比基尼包不住:影片看不完

葫芦哥爱吐槽
2025-04-25 12:21:22
2025-04-27 08:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
10378文章数 176116关注度
往期回顾 全部

科技要闻

贾跃亭:FF市值到百亿美元能基本还完债务

头条要闻

超20万台湾民众走上凯道高喊"赖清德下台" 朱立伦发声

头条要闻

超20万台湾民众走上凯道高喊"赖清德下台" 朱立伦发声

体育要闻

加时绝杀!巴萨赛季3杀皇马,32次问鼎国王杯

娱乐要闻

金扫帚奖出炉,包贝尔意外获“影帝”

财经要闻

特朗普支持率全面下跌 华尔街发出警告

汽车要闻

充电5分钟续航100公里 探访华为兆瓦超充站

态度原创

时尚
艺术
游戏
亲子
房产

运动风越来越流行,这样穿减龄又好看!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

魔兽怀旧服:ICC将至,玩家最关心团本难度,未来会分区吗?

亲子要闻

50个睡前废话,孩子将变化惊人

房产要闻

教育理念再进阶!解码新世界星辉如何构筑「家校社成长生态圈」!

无障碍浏览 进入关怀版