网易首页 > 网易号 > 正文 申请入驻

GTC 2025观察:芯片不再是唯一主角,英伟达有着更大的野心

0
分享至

2025年3月19日,一场属于AI的盛宴在美国的圣何塞拉开序幕,随着AI在各个领域的普及与快速发展,今年的GTC大会关注度明显更高,以至于英伟达CEO黄仁勋在开场致辞里直接将大会形容为「AI界的超级碗」(超级碗是美国最受欢迎的体育赛事,其关注度甚至高于NBA总决赛)。

下面就让我们直入主题,看看此次GTC 2025最值得关注的内容。

新“核弹”要等明年,旧“核弹”还能战

与往年一样,今年的英伟达同样带来了全新的计算芯片——Blackwell Ultra和“期货”芯片Rubin。其中,Blackwell Ultra实际上是Blackwell的升级版,已经开始接受预订,在性能与带宽等方面对比前代都有所升级,并且适配最新的NVLink技术,拥有更高的带宽和速度。


图源:英伟达

虽然在大会上并没有公布GB300的价格,但是参考GB200的售价来看,新芯片的价格显然不会便宜,而且英伟达貌似暂时并不打算单独出售显卡,目前还是以机柜的方式进行整套销售,不过和昂贵的芯片相比,机柜其他配件的价格倒也显得“微不足道”了。

从英伟达公布的参数来看,Blackwell Ultra的显存从192GB升级为288GB,而在NVL72状态下(72颗芯片互联)AI性能是GB200的1.5倍。老实说这个数据远不如从Hopper架构跳到Blackwell架构时惊艳,而且官方给出的数据里对整体性能提升也是“语焉不详”,只是着重提到FP4推理性能提高50%。

而且从官网给出的数据对比来看,FP4推理性能的提升与FP64和INT8的推理性能被砍掉有关,前者从296 TFLOPS直接掉到10 TFLOPS,后者则是从72 PFLOPS掉到仅剩2 PFLOPS,省下来的算力资源都被塞到了FP4里。


图源:英伟达

显然,高精度的推理和训练已经逐渐被抛弃,以FP8、FP4为主的低精度训练正在成为主流。其实这里面也有不少DeepSeek的功劳,前段时间开源的一系列技术中就包括“如何在FP8低精度下保证训练和推理命中率”的相关方案,也正是靠着这套方案,DeepSeek的训练成本和推理成本才会远低于其他AI企业。

不过目前来看,通过降低精度来提高算力效率的路也差不多走到头了,FP4再往下的精度就很难确保效率和成本都满足需求了,为了纠正错误所需要付出的资源可能超过在更高精度下训练的成本。

虽然算力提升幅度存疑,但是显存的增长却是实打实的,特别是推理模型大行其道的当下,AI推理和训练对带宽的要求远比以前更高。所以GB300的销量还是很可观的,据黄仁勋透露,亚马逊、 微软等企业已经提前下了360万颗Blackwell Ultra芯片的订单,将进一步拓展他们位于全球各地的AI算力中心。

聊完Blackwell Ultra,再来看看“期货”芯片Rubin,这才是英伟达真正的下一代芯片,单芯片的FP4性能提升到25 PFLOPS,而完整的Rubin是双芯片设计,所以实际FP4性能高达50 PFLOPS,是Blackwell Ultra的三倍以上。此外,显存也升级为HBM4,虽然容量仍然是288GB,但是带宽从8TB/s升级到13TB/s,在NVLink状态下吞吐量高达260TB/s,是前代的两倍。


图源:英伟达

而且Rubin支持NVL144,也就是单个机柜最高可串联144颗芯片,提供高达3.6EF的FP4算力或1.2 EF的FP8算力。作为对比,NVL72的Blackwell Ultra只有1.1EF的FP4算力,FP8算力更是只有0.36 EF,差距非常明显。

除了Rubin外,英伟达这次也直接把Rubin Ultra一起展示了,最高支持NVL576,拥有15 EF的FP4算力和5EF的FP8算力,性能是GB300 NVL72的14倍,单组芯片配备1TB的HBM4e内存,显存带宽高达4.6PB/s,NVLink 7将为其提供高达1.5PB/s的带宽速度。


图源:英伟达

虽然数据看起来非常吓人,不过单从算力来看基本上没有多少增长,因为Rubin Ultra就是两个Rubin组合在一起而已(Blackwell的GB200也是如此),所以最主要的升级还是新的NVLink和显存。

虽然Rubin架构的参数很诱人,但是最快也要等到2026年下半年才会开始出货,而Rubin Ultra更是要等到2027年下半年,你可以理解为英伟达直接把未来两年的更新计划提前透了底,估计也是为了提振市场对英伟达的信心。

至于2028年才会上市的“Feynman”,就单纯只有一个名字了,更多的信息并没有公开,只能说英伟达是懂得画饼的。总体来说,Blackwell Ultra虽然不如此前猜测的那样提升巨大,但是也更契合当下的AI模型训练和推理需求,随着Blackwell Ultra的陆续普及,全球算力规模估计会迎来新一轮的暴涨。

DeepSeek让英伟达“卖得越多,赚得越多”

虽然新芯片的发布关注度很高,不过最有意思的还是老黄的新金句:“买得越多、赚得越多”,普罗大众是否认可这个观点尚且不谈,反正四大云服务器运营商是认可了,这也是英伟达“卖得越多,赚得越多”。

这让我不禁想起前段时间随着DeepSeek的爆火,一度有着很高讨论度的话题“AI不再需要英伟达显卡”,现在看来,市场给出了这个问题的答案:“AI或许不再独钟于英伟达显卡,但是我们现在需要更多的算力了。”而按下这场算力竞赛加速键的企业,或许正是DeepSeek。

在今年的演讲里,DeepSeek的出场率相当高,直接取代了去年的主角ChatGPT,黄仁勋也用DeepSeek来解释为什么AI算力需求不仅没有下降,反而在增长。作为范例与DeepSeek对比的是LLama 3,一个传统的AI大模型,在回答同一个问题时,LLama只用了不到500 Token就输出了回答,而DeepSeek则是用了高达8559 Token来输出答案。


图源:英伟达

结果是显而易见的,LLama给出了错误答案,而DeepSeek则答对了,为了避免大家觉得DeepSeek-R1用671B的参数量“欺负”只有70B参数量的LLama,演示视频还贴心地备注“活跃参数37B”的字样。这也是DeepSeek-R1这类稀疏型AI大模型的特点,虽然参数量庞大,但是每次实际调用的参数量并不算多,甚至会比传统AI大模型更少。

不过,即使活跃参数量仅为37B,DeepSeek所使用的Token量也远超LLama,因为DeepSeek是推理模型,在输出实际答案前会先进行多轮思考,并且在得到结果后会主动进行验证,只有确定答案符合标准后才进行实际的回答输出。

随着DeepSeek将自己的优化过程和深度学习方案开源,许多AI模型都开始引入类似的长思考链步骤,虽然让回答的质量比以前高了很多,但是对算力的需求也与日俱增,如果不是DeepSeek公布了全套的优化方案,恐怕大多数AI公司的亏损要翻一倍不止。

以目前的形势来看,推理模型淘汰传统AI模型已经没有悬念了,这也意味着即使后续的AI模型及推理过程优化更进一步,想要满足更大参数规模和更复杂的推理所需要的算力资源仍然是个天文数字。而在算力性能上,英伟达仍然是断崖式领先的存在,即使DeepSeek证明了绕过英伟达显卡也能确保推理效率,但是英伟达还是多数厂商的首选。


图源:英伟达

这也是为什么在DeepSeek爆火导致英伟达股价暴跌后,黄仁勋接受采访时却表示DeepSeek其实是利好英伟达,并非“死鸭子嘴硬”,而是看到了DeepSeek所采用的稀疏架构推理模型方案背后对算力的恐怖需求。

黄仁勋认为,长思维链所带来的效果显而易见,没有AI企业可以拒绝这样的诱惑。但是随着AI模型的参数量进一步增长,当这个数字达到万亿、数万亿后,算力效率的重要性将更加凸显。因为算力效率直接决定Token输出速度,如果你的Token输出速度太慢,那么用户可能要半天才能得到自己想要的答案,他们会抱怨并直接转投其他AI的怀抱。

想要高效且高质量的为用户提供AI服务,那么只有堆高算力规模,并且用上最新的英伟达芯片行业技术(黄仁勋的原话),才能让企业在竞争里领先对手且吸引用户加入。而且,随着算力规模的上升,效率增长的同时也会促使成本下降,让企业能够从每一次用户访问中获得更高的利润,也就是黄仁勋所说的“买得越多,赚得越多”。


图源:英伟达

为了帮助企业实现这个目标,英伟达还发布了Dynamo,并将其称为“AI工厂的操作系统”,借助这个系统的整合优化可以将计算机的Token生成效率成倍提高,解决Token生成速度不足的问题。

英伟达的终极野望:要做AI的超级工厂?

在英伟达的设想中,未来的计算机将不再是软件的运行基础,Token将成为软件及一切服务的根基,而计算机则变成生产Token的工厂,也就是“AI工厂”,能够以流水线的方式生产AI模型。

简单来说,AI工厂可以根据用户输入的需求,全自动化的训练一个专属AI模型,这个AI模型或许参数规模不大,但是却针对你的需求进行特化训练,其效果丝毫不比大参数量的通用模型差,也就是做到AI模型的“千人千面”。


图源:英伟达

不得不说,这是一个非常诱人的未来,不过背后所需要的AI基础设施覆盖率和算力规模也是相当的恐怖,恐怕需要全世界全行业都深度参与其中才能搭建出整套系统的雏形。

或许正是考虑到这一点,英伟达宣布将把Dynamo系统开源,支持PyTorch、SGLang、NVIDIA TensorRT-LLM和vLLM等多种框架,方便各个企业针对自己的AI工厂进行优化和调整。

自从DeepSeek掀开AI领域的开源浪潮后,越来越多的AI企业也意识到了开源的重要性,并加入开源阵营中,DeepSeek掀起的浪潮注定不会停歇,这场AI革命的序幕才刚刚拉开。

回顾英伟达的GTC 2025大会,你会发现硬件不再是唯一的核心内容,英伟达正在着手构建一个全新的智能生态,在这个生态里算力是一切的基础,只要大家都认可并共同致力于维护这个生态,那么在算力性能上具有优势的英伟达自然也就高枕无忧了。

3月20日-3月23日,AWE(中国家电及消费电子博览会) 2025 盛大开幕,海信、TCL、长虹、雷鸟、添可、追觅、云鲸、小熊、萤石、韶音、海尔、三翼鸟、九阳、科沃斯、万和、索尼、三星、LG等巨头重磅参展,DeepSeek掀起的AI工业化浪潮如何影响家电成重要看点,“AI家电”风起云涌,雷科技AWE 2025报道团正在全程追踪报道,敬请关注。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美关税大战:最大成果不是中国胜了,而是美国再无手段控制中国

中美关税大战:最大成果不是中国胜了,而是美国再无手段控制中国

坠入二次元的海洋
2025-04-28 13:48:38
面相都变了!再看59岁曾华倩和59岁刘嘉玲,才明白两人差别在哪里

面相都变了!再看59岁曾华倩和59岁刘嘉玲,才明白两人差别在哪里

联友说娱
2025-04-27 18:06:35
灰熊总经理回应针对扎克・埃迪的批评言论:球队对他充满信心

灰熊总经理回应针对扎克・埃迪的批评言论:球队对他充满信心

仰卧撑FTUer
2025-04-28 18:43:16
琉球群岛上空,攻击2被日本战机尾随,随后一幕让日飞行员破防

琉球群岛上空,攻击2被日本战机尾随,随后一幕让日飞行员破防

空天力量
2025-04-28 10:18:41
突然翻脸!A股明天悬了吗?

突然翻脸!A股明天悬了吗?

风风顺
2025-04-28 00:20:34
法布雷加斯创造奇迹!科莫73年来首次4连胜,球队保级成功

法布雷加斯创造奇迹!科莫73年来首次4连胜,球队保级成功

雷速体育
2025-04-27 22:52:54
瞒不住了?71岁成龙与台湾女星疑有私生子,女方怀着孕嫁现任老公

瞒不住了?71岁成龙与台湾女星疑有私生子,女方怀着孕嫁现任老公

墨印斋
2025-04-28 18:03:51
重大误判!大黑马2-2变1-3:全场嘘声四起,布伦森32+11拯救球队

重大误判!大黑马2-2变1-3:全场嘘声四起,布伦森32+11拯救球队

体坛小李
2025-04-28 05:43:45
我天,林峰老婆怎么如此上不了台面?复制吴千语,捅这么大篓子?

我天,林峰老婆怎么如此上不了台面?复制吴千语,捅这么大篓子?

星光看娱乐
2025-04-27 14:32:50
印度市中心到底能有多难闻?网友:整个城市好像泡在一个大粪坑里

印度市中心到底能有多难闻?网友:整个城市好像泡在一个大粪坑里

娱乐圈人物大赏
2025-04-25 00:50:04
尸横遍野!温哥华一汽车冲入人群致 11 人死亡

尸横遍野!温哥华一汽车冲入人群致 11 人死亡

亚太观澜
2025-04-28 20:00:16
刚刚!深圳演唱会落幕,两方面突出深圳在刀郎演唱会中特殊地位。

刚刚!深圳演唱会落幕,两方面突出深圳在刀郎演唱会中特殊地位。

阿矗论古今
2025-04-28 08:52:34
德国称抓到两名俄方特工!手机里竟有美国防长的电话

德国称抓到两名俄方特工!手机里竟有美国防长的电话

项鹏飞
2025-04-27 21:51:00
贵阳越界影城真人版“石矶娘娘”宣布“退圈”,本人回应:曾遭辱骂和网暴

贵阳越界影城真人版“石矶娘娘”宣布“退圈”,本人回应:曾遭辱骂和网暴

上游新闻
2025-04-28 19:45:13
董子健新戏惹群嘲,“京圈太子”的身份,都掩盖不住演技差的短板

董子健新戏惹群嘲,“京圈太子”的身份,都掩盖不住演技差的短板

老闫侃史
2025-04-28 17:00:03
初中生骂师引爆10万阅读!停课3天写8份检讨,家长下跪学校仍拒收

初中生骂师引爆10万阅读!停课3天写8份检讨,家长下跪学校仍拒收

小羽叨叨叨
2025-04-28 11:06:45
根据中央组织部任职通知,高璞履新职

根据中央组织部任职通知,高璞履新职

新京报政事儿
2025-04-27 15:39:29
太凶相了哈兰德晒自己P光头照,网友:外星人️

太凶相了哈兰德晒自己P光头照,网友:外星人️

直播吧
2025-04-26 20:30:18
大批智能巡飞弹抵达,国产无人机疑似火力全开:巴铁发狠连杀54人

大批智能巡飞弹抵达,国产无人机疑似火力全开:巴铁发狠连杀54人

说天说地说实事
2025-04-28 16:08:52
电动车治理新规倒计时:5月1日起,电动车上路将迎来“4大严查”

电动车治理新规倒计时:5月1日起,电动车上路将迎来“4大严查”

电动车的那些事儿
2025-04-28 06:40:07
2025-04-28 21:19:00
雷科技 incentive-icons
雷科技
专注AI硬科技
33029文章数 810802关注度
往期回顾 全部

数码要闻

苹果平价版头显或命名Vision Air 预计最早今年末上市

头条要闻

贵阳越界影城真人版"石矶娘娘"宣布"退圈" 本人回应

头条要闻

贵阳越界影城真人版"石矶娘娘"宣布"退圈" 本人回应

体育要闻

“我们欠球迷一个冠军庆典,现在可以狂欢了”

娱乐要闻

黄渤青岛做东请客 桌上全人情世故

财经要闻

外卖平台陷入内卷,伤害的是谁?

科技要闻

传腾讯阿里从字节抢购算力资源 字节否认

汽车要闻

东风日产,重新起跑

态度原创

时尚
游戏
教育
旅游
本地

别再披头散发了!这5个神仙春夏发型显脸小巨洋气,绝美!

最早通关NS2版塞尔达?玩家在限时试玩会击败盖侬

教育要闻

任何粤语视频,都可以生成粤语口语字幕了

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

本地新闻

亮剑缉车—蕉城法院首场法拍车联合直播

无障碍浏览 进入关怀版