网易首页 > 网易号 > 正文 申请入驻

不止芯片!英伟达,重磅发布!现场人山人海,黄仁勋最新发声

0
分享至

作 者丨倪雨晴

编 辑丨包芳鸣

图 源丨新华社

自上周日起,圣何塞这座被誉为“硅谷之心”的城市便沉浸在了英伟达的绿色海洋中。英伟达的标志性绿色横幅随处可见,绿色小车穿梭于街道之间,为这座城市披上了一层流动的绿色外衣。

这一切都是为了迎接一年一度的科技盛会——英伟达GTC2025。当地时间3月18日,英伟达创始人兼CEO黄仁勋在SAP中心发表了演讲,现场座无虚席。他幽默地将今年的GTC称为“Super Bowl of AI”,AI界的超级碗。

黄仁勋一如既往地身着黑色皮衣,宛如摇滚明星般吸引了全球科技界的目光。全球科技人士纷纷前来,追踪这位AI领域的“代言人”,试图一窥AI的未来。今年的关键词无疑是“推理”和“token”,明显可以看出,AI的叙事重心正从训练阶段转向推理阶段。

在演讲的开场部分,黄仁勋再次详细阐述了三个scaling定律,并表达了对它们的持续看好。他指出,关于AI scaling放缓的讨论几乎“全世界都搞错了”。他认为,得益于新的scaling技术,AI的进化速度比以往任何时候都要快。

面对推理市场,英伟达采取了双线作战的策略。在硬件方面,推出了Blackwell Ultra GPU、下一代架构Rubin、CPO交换机以及“AI PC”桌面端超级计算机;在软件方面,则推出了推理框架Dynamo、Llama Nemotron系列推理模型以及人形机器人基础模型GROOT N1等。

英伟达创始人兼CEO黄仁勋在英伟达GTC大会上发表演讲 倪雨晴/摄

Forrester副总裁兼首席分析师戴鲲在接受21世纪经济报道记者采访时表示:“本次大会有三个方向值得关注:一是面向后训练和推理的加速计算;二是面向企业级智能代理开发的Agentic AI;三是Physical AI,即AI在物理世界中的应用,如何赋能机器人和自动驾驶,是很有潜力的领域。”

黄仁勋强调,生成式人工智能改变了计算的方式,人工智能的推理能力可能成为下一个重大突破,而token可用性的提高是其中重要的一部分。人工智能正在经历一个转折点,它变得更加智能,应用更加广泛。

芯片家族登场:Blackwell Ultra、 Rubin

正如市场预期,英伟达在本次GTC大会上发布了Blackwell Ultra系列芯片及下一代GPU架构Rubin。

下一代平台Vera Rubin NLV144计划于2026年下半年上线,Rubin Ultra NVL576则将在2027年下半年面世。去年,黄仁勋已经预告了Rubin和Blackwell Ultra GPU以及最新的Vera CPU的发布。按照英伟达的AI发展蓝图,英伟达正在加速前行,以往通常是每两年更新一代。

此次发布会的重点更多聚焦在Blackwell的产品矩阵上。黄仁勋表示,Grace Blackwell目前已全面投入生产,各大OEM厂商均使用该公司的硬件制造和销售产品。与此同时,新平台特别强化了推理能力。英伟达称,Blackwell Ultra在训练和测试时间缩放推理(Test-Time Scaling Inference)方面实现了突破,并将其称为“AI工厂平台”,将开启AI推理新时代。

具体来看,Blackwell Ultra(GB300)包含GB300 NVL72机架级解决方案和HGX B300 NVL16系统。其中,GB300 NVL72将72颗Blackwell Ultra GPU与36颗基于Arm Neoverse架构的Grace CPU互联,形成一个超大规模的AI计算单元。

与GB200 NVL72相比,GB300 NVL72的AI性能提升了1.5倍,并使AI工厂的收益机会相比Hopper平台提高了50倍。英伟达表示,GB300 NVL72预计将集成至DGX Cloud,DGX SuperPOD(企业级AI基础设施)也将采用GB300 NVL72机架架构,提供开箱即用的AI工厂解决方案。

据悉,DGX SuperPOD可扩展至数万颗Grace Blackwell Ultra超级芯片,通过NVLink、 Quantum-X800 InfiniBand 和Spectrum-X以太网实现超高速互联,以提供强大的AI训练与推理计算能力。

再看HGX B300 NVL16,英伟达给出的数据显示,相较Hopper代际产品,在大语言模型推理方面,推理速度提高11倍、计算能力提升7倍、内存容量扩大4倍。这些突破使其能够高效运行最复杂的AI 任务,特别适用于AI 推理计算、深度推理及超大规模推理工作负载。

整体而言,这款面向AI推理时代的旗舰级GPU平台,不仅是英伟达Blackwell架构的又一力作,也标志着AI计算,从大模型预训练向深度推理与复杂推理的转变,将为数据中心、企业AI工厂及自动驾驶、机器人等领域提供强劲的计算能力

“AI已经迈出了巨大的飞跃,推理AI和代理AI对计算性能的需求呈指数级增长,”黄仁勋表示,“我们正是为这个关键时刻设计了Blackwell Ultra——这是一款全能AI平台,能够高效执行预训练、后训练和推理等任务。”

去年,Blackwell架构刚刚发布,GB200系列在上个季度为英伟达带来110亿美元的营收。接下来,最新的 Blackwell Ultra能够接棒GB200再创新高?

瑞银(UBS)在3月17日的报告中指出,Blackwell系列的需求依然非常强劲,GB200机架的残存的瓶颈现已完全解决,英伟达正加快B300/GB300(Blackwell Ultra)的推出时间,预计将在第一季度提前量产,并在2025年第三季度实现大规模出货。

英伟达表示,基于Blackwell Ultra的产品预计将于2025年下半年开始由合作伙伴陆续推出。思科、戴尔、惠普、联想和超微将率先推出基于Blackwell Ultra的服务器。浪潮旗下Aivres、华擎机架、华硕、富士康、技嘉、英业达、和硕、广达、纬创和纬颖等硬件制造商也将提供Blackwell Ultra服务器解决方案。

值得一提的是,在发布会现场,黄仁勋还放出了一张全球数据中心资本支出的统计图,与英伟达数据中心业绩进行了对比。预计到2028年,数据中心的投资将超过一万亿美元,暗示英伟达仍有巨大的增长空间。

新亮点:CPO交换机来了

随着AI计算的迅猛发展,数据中心的网络连接基础设施面临着更高的要求。在3月18日的GTC2025发布会上,英伟达推出了全新的NVIDIA Photonics硅光子技术

据介绍,这项技术通过共封装光学(CPO)取代传统的可插拔光学收发器,使光纤直接连接到交换机,大幅减少数据中心的功耗。据英伟达测算,该技术可降低40MW的功耗,并提高AI计算集群的网络传输效率,为未来超大规模AI数据中心奠定基础。

基于此,英伟达推出Spectrum-X与Quantum-X硅光子网络交换机,通过将电子电路与光通信技术深度融合,助力AI工厂连接跨地域的数百万GPU集群,从而降低能耗与运营成本。

其中Spectrum-X以太网平台是专为多租户超大规模AI工厂设计,带宽密度达传统以太网的1.6倍,支持全球最大规模超级计算机。Quantum-X光子InfiniBand平台是基于200Gb/s SerDes技术提供144个800Gb/s端口,采用液冷设计高效冷却硅光模块,AI计算架构速度较前代提升2倍,可扩展性增强5倍。

随着AI工厂规模空前扩张,网络技术亟需同步革新。英伟达表示,其光子交换机集成光通信创新技术,较传统方式减少75%激光器使用,能效提升3.5倍,信号完整性增强63倍,网络韧性提高10倍,部署速度加快1.3倍。

黄仁勋表示:“AI工厂是超大规模数据中心的新范式,网络基础设施需彻底重构。通过将硅光子技术直接集成至交换机,英伟达突破了传统超大规模与企业网络的限制,为百万GPU级AI工厂铺平道路。”

英伟达硅光子技术生态涵盖了台积电、Browave、Coherent、康宁、Fabrinet、富士康、Lumentum、SENKO、SPIL、住友电工及TFC Communication等企业。

摩根大通此前在报告中指出,采用CPO对于进一步提升带宽、降低延迟至关重要,同时还能降低功耗,“我们认为,短期内基于CPO的交换机的实际应用规模可能仍然较小。CPO应用的关键转折点要等到CPO应用于GPU时才会出现。最早可能要到2027年的Rubin Ultra才会实现。”

报告还指出,将CPO应用于人工智能GPU仍面临多项技术挑战,包括热管理、可靠性,以及由于所需尺寸过大导致的IC基板翘曲问题。随着CPO应用的增加,对于基板供应商来说是重大利好,因为使用CPO的交换机基板尺寸将增加20%~30%。对于应用于GPU中介层的CPO,基板设计尺寸可能达到当前GPU的2~3倍。

软件大升级:一切为了推理和AI Agent

黄仁勋强调:“人工智能将无处不在。”英伟达重点关注领域包括机器人、自动驾驶、边缘计算、6G、企业IT、云服务、GPU云等。

今年,AI Agent的兴起和AI硬件的火热,都表明AI应用正在加速爆发。尤其是随着DeepSeek等技术的推出,成本逐渐降低,进一步推动了生成式AI滚滚向前。

而生成式AI正改变计算的方式,在黄仁勋看来,计算机已经成为token的生成器,而不是文件的检索器,数据中心也演变成了AI工厂,只负责生成token,并将其转化为音乐、文字、研究等

在发布会现场,黄仁勋用DeepSeek和其他大模型进行了对比演示。在回答同一个问题时,与传统的大语言模型相比,DeepSeek的推理模型需要多20倍的token和150倍的计算资源,但得出了更准确的答案。黄仁勋指出,随着下一代模型可能包含数万亿个参数,对英伟达Blackwell NV72等系统的需求也将大幅增加。同时,在强化推理过程中,软件起到了很关键的作用。

英伟达新推出了AI推理服务软件Dynamo,黄仁勋指出:“这本质上是人工智能工厂的操作系统。”在Dynamo的支持下,Blackwell在推理性能上实现了巨大飞跃,其推理性能可达上一代Hopper的40倍。因此,黄仁勋再次强调:“买得越多,省得越多。”

IDC助理研究总监崔凯表示,黄仁勋重点强化了“token经济学”(token=收入),将复杂系统简化为可量化、易传播的商业故事。类似于5G建网时强调的“单比特成本大幅下降”的逻辑,效率提升价值,规模摊薄成本,延续“buy more and save more”的价值主张。

Dynamo能够最大化AI工厂在推理AI模型中的token收益。它通过协调并加速数千颗GPU之间的推理通信,采用分离式推理架构(Disaggregated Serving),使大语言模型的输入处理(Processing Phase)和推理生成(Generation Phase)分别在不同GPU上运行。这种设计使每个阶段能够根据自身需求进行独立优化,确保GPU资源的最大化利用,从而实现更高效的AI推理计算。

此外,英伟达还通过一系列NIM服务支持企业和开发者构建AI Agent。例如,英伟达推出了Llama Nemotron系列推理模型,包括Nano、Super和Ultra三个版本,能够执行更复杂的推理任务,并具备可调节的推理模式。这些模型基于Meta的Llama架构,并经过英伟达的独特优化,在数学推理、指令跟随及复杂任务处理方面表现出色,适用于自动化客服、商业分析、科学研究等领域。

为了帮助企业更高效地构建AI代理系统,英伟达还发布了AI-Q(NVIDIA IQ Blueprint),这是一种开放式的AI代理架构,支持查询多模态数据(文本、图像、视频等)并连接外部工具,如Web搜索和数据库。AI-Q能够提升AI代理的推理能力,使其具备更强的逻辑推理和问题解决能力,减少企业在AI应用中的开发成本和部署难度。

英伟达的核心护城河——CUDA,也是一套强大的软硬件体系。黄仁勋在发布会上详细介绍了CUDA库的广泛应用,如今英伟达已经拥有从量子化学到基因测序等各个领域的AI工具。黄仁勋表示:“我们已经达到了计算的临界点,CUDA使之成为可能。”

端侧AI和机器人

此外,颇受关注的领域还包括AI PC类产品和physical AI,Physical AI主要是指机器人和自动驾驶。

在端侧AI产品方面,英伟达推出基于NVIDIA Grace Blackwell平台的全新DGX个人AI超级计算机系列。其中一款是DGX Spark,其前身是黄仁勋在CES上发布的Project DIGITS项目。这款被英伟达定义为“AI PC”的设备,是全球最小的桌面级AI超级计算机,适用于AI研究人员和开发者。通过接入这台DGX Spark,个人用户就可以更方便地使用大模型。

这款PC主机核心为专为桌面设计的GB10 Grace Blackwell超级芯片,配备支持第五代张量核心与FP4精度的Blackwell GPU,AI算力高达每秒1千兆次操作,可高效微调并运行Cosmos Reason世界基础模型、GR00T N1机器人基础模型等前沿AI推理模型。

另一款产品是DGX Station,这是Ultra平台的高性能桌面超级计算机,主要是面向企业和科研机构的高性能AI计算站,提供20 PetaFLOPS AI计算能力,并配备784GB统一内存,助力企业构建私有AI推理系统。

此次,英伟达继续在桌面端掀起算力革命。据介绍,DGX Spark与DGX Station首次将原本仅限数据中心使用的Grace Blackwell架构性能引入桌面环境,制造商合作伙伴包括华硕、戴尔、惠普和联想等。

这些设备将助力AI开发者、研究者、数据科学家及学生在桌面上完成大模型的快速原型设计、微调与推理任务。用户既可本地运行模型,亦可无缝部署至DGX Cloud或其他支持加速的云平台及数据中心基础设施。

除了PC产品,可爱的机器人再次在发布会上压轴出场,并与黄仁勋进行了互动。在黄仁勋看来,通用机器人时代已经到来,世界劳动力严重短缺5000万人,去年他就曾多次表示机器人时代渐近。

此次,在机器人领域,英伟达正式发布了Isaac Groot(GROOT N1),这是全球首款开源的、可定制的通用人形机器人基础模型

GROOT N1采用双系统架构,灵感来源于人类认知原理。其中,“系统1” 是一个快速思考的行动模型,类似于人类的直觉和反射;“系统2” 则是一个慢速思考模型,用于深思熟虑的决策制定。

GR00T N1可轻松适配多种常见任务,例如抓取、双臂搬运、单臂与双臂协作,以及多步复杂操作,适用于物料搬运、包装和检测等场景

该模型已经被多家机器人制造商采用,包括Fourier GR-01、Agility Robotics、Boston Dynamics等,助力类人机器人进入更广泛的商业应用场景。

此外,英伟达还推出了一系列模拟框架和方案,包括 NVIDIA Isaac GR00T 方案,用于生成合成数据,以及Newton——一款开源物理引擎,该引擎由英伟达与Google DeepMind和迪士尼研究院 共同开发,专门用于机器人研发。

对比来看,去年GTC大会上,英伟达就发布了人形机器人通用基础模型Project GROOT,以及基于NVIDIA Thor系统级芯片(SoC)的新型人形机器人计算机Jetson Thor。今年,英伟达在机器人基础模型和体系化的解决方案上再次升级。

摩根大通表示,英伟达已经宣布其全球AI基础模型平台Cosmos以及其人形机器人开发平台Groot,未来在Physical AI方面预计会有更多突破。随着多模态AI的进步以及机器人和数字孪生等新举措的推出,全球模型Physical AI模型开发方面可能会有更多进展。

能否扭转AI市场情绪?

回顾过去的一个季度,AI领域可谓波澜起伏,风向和叙事悄然生变。尤其是自DeepSeek爆火以来,关于推理、算力、成本和效率的讨论从未停止。再加上美国政策的变化,为全球AI产业的发展增添了新的变量。

今年的GTC大会上,“what’s next in AI starts here”的标语高高悬挂。大家都在期待,面对日新月异的AI技术和擂台挑战,黄仁勋将如何描绘AI的未来。

整体来看,英伟达在GTC2025大会上带来了规模庞大的技术发布,涵盖了AI推理计算、AI Agent、物理AI(机器人与自动驾驶)、数据中心基础设施以及数字孪生等多个领域。

然而,发布会结束后,截至记者发稿时,英伟达股价下跌了3.43%。事实上,黄仁勋在发布会上还提到了股价问题,开玩笑地表示股价低时是投资的好时机。

摩根大通近日的报告指出,总体来看,由于对2025年数据中心AI支出峰值的担忧、GPU与ASIC竞争以及近期CoWoS订单削减的忧虑,整体AI市场情绪仍显偏空。我们认为,GTC大会有望提振部分对AI股票的正面情绪,同时改善下游供应链中Blackwell系统的供应状况。

报告还表示,尽管对2026年AI数据中心资本支出增长的担忧可能需要更长时间才能解除,但在Deepseek之后对AI资本支出下降的担忧并未真正显现。我们预计2026年将在美国CSP资本支出持续增长、中国CSP的增量资本支出回升以及企业AI采用增加的共同作用下,继续保持健康增长。

对于DeepSeek的影响,黄仁勋此前表示,DeepSeek的崛起实际上将对英伟达带来整体上的积极影响,因为这将加速人工智能技术的广泛应用。他还指出,像OpenAI的o1这样高能耗的推理模型的增长,是英伟达下一座需要攀登的高峰。

本届GTC是英伟达近年来最重要的技术发布之一,其核心主题围绕AI推理时代展开,从计算架构(Blackwell GPU、Rubin、Dynamo)、企业AI应用(Llama Nemotron、AIQ),再到数据中心(Photonics、交换机)、机器人和自动驾驶(Isaac Groot、NVIDIA Drive),英伟达正在构建一个完整的AI生态体系。

在AI的推动下,企业和个人的生产力将迎来新一轮的变革,而英伟达作为这一变革的核心推动者,也在不断加速技术创新。

SFC

本期编辑 金珊

21君荐读

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗袭击美国第五舰队总部,没打中,美军又摧毁革命卫队大量资产

伊朗袭击美国第五舰队总部,没打中,美军又摧毁革命卫队大量资产

史智文道
2026-06-03 14:48:21
71岁老人哭诉:虽然我有6500退休金,30万存款,但依然过得很凄凉

71岁老人哭诉:虽然我有6500退休金,30万存款,但依然过得很凄凉

烙任情感
2026-06-02 14:52:02
樊振东欧洲假期提前结束,团队跨国接回

樊振东欧洲假期提前结束,团队跨国接回

郭揦包工头
2026-06-03 02:22:14
西班牙反悔,德国从头不买账!欧盟内讧:谁的经济命脉没连中国?

西班牙反悔,德国从头不买账!欧盟内讧:谁的经济命脉没连中国?

安珈使者啊
2026-06-03 11:56:55
中国老年痴呆人数全球第一:喝茶越多,痴呆的就越多,真的吗?

中国老年痴呆人数全球第一:喝茶越多,痴呆的就越多,真的吗?

复转这些年
2026-05-28 16:41:25
特朗普“爆粗口”骂了内塔尼亚胡?

特朗普“爆粗口”骂了内塔尼亚胡?

枫叶君评
2026-06-03 09:56:35
刚刚,福建省教育厅重要通知!禁止!禁止!

刚刚,福建省教育厅重要通知!禁止!禁止!

业翔民安
2026-06-03 09:01:00
一种比三文鱼营养却更便宜的鱼,真心建议你常吃

一种比三文鱼营养却更便宜的鱼,真心建议你常吃

食栗派
2026-05-22 21:50:33
曝勇士盼瓦格纳掉至11顺位!美媒分析他可接班库里:模板哈利伯顿

曝勇士盼瓦格纳掉至11顺位!美媒分析他可接班库里:模板哈利伯顿

颜小白的篮球梦
2026-06-03 09:43:39
美国现在深刻反思,伊朗战争,是一场精心设下的阴谋

美国现在深刻反思,伊朗战争,是一场精心设下的阴谋

揭秘历史的真相
2026-06-02 21:12:43
里克尔梅:若现任主席留任,皇马会被出售

里克尔梅:若现任主席留任,皇马会被出售

懂球帝
2026-06-03 10:39:03
倪萍这辈子“最恨”的男人,或许并非是陈凯歌,而是最冷血的他

倪萍这辈子“最恨”的男人,或许并非是陈凯歌,而是最冷血的他

南风的温柔
2026-06-03 09:54:51
疑打井纠纷,小学教师杀害33岁邻居,涉嫌故意伤害罪被立案,死者留下两未成年儿子;教体局:警方正侦办

疑打井纠纷,小学教师杀害33岁邻居,涉嫌故意伤害罪被立案,死者留下两未成年儿子;教体局:警方正侦办

大风新闻
2026-06-02 17:38:34
4成商铺执笠!冷冷清清!禅城最可惜的网红美食街?

4成商铺执笠!冷冷清清!禅城最可惜的网红美食街?

周哥一影视
2026-06-03 12:15:23
离奇!嘉庆年间一名赈灾官员暴毙,真相令人唏嘘

离奇!嘉庆年间一名赈灾官员暴毙,真相令人唏嘘

奥卡姆剃历史
2026-06-03 09:55:52
斯科蒂·皮蓬23岁儿子崩溃自白:15岁那年,同学用Future的歌羞辱我

斯科蒂·皮蓬23岁儿子崩溃自白:15岁那年,同学用Future的歌羞辱我

绿茵狂热者
2026-06-03 01:55:51
KFC儿童门诊突然爆火,网友:还是西药见效快

KFC儿童门诊突然爆火,网友:还是西药见效快

4A广告网
2026-06-02 17:41:40
换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

周哥一影视
2026-06-01 13:33:05
求求爸妈了,家里“这5样东西”别继续用了,全都有害!

求求爸妈了,家里“这5样东西”别继续用了,全都有害!

Home范
2026-06-02 13:48:02
白马寺方丈出任少林住持:一个种地的僧人,能撑起这座千年古刹吗

白马寺方丈出任少林住持:一个种地的僧人,能撑起这座千年古刹吗

三目观史
2026-06-01 05:45:39
2026-06-03 16:16:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
251343文章数 744367关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

本地
旅游
房产
艺术
公开课

本地新闻

用剪纸的方式,打开江苏扬州

旅游要闻

苏州网师园晚清落地罩雕花被游客撞坏,园方已报警处理

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

艺术要闻

二十年前割麦的场景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版