网易首页 > 网易号 > 正文 申请入驻

英伟达宣布创造满血 DeepSeek 推理世界纪录

0
分享至

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA BlackwellDGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。


据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行6710 亿参数的满血DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。


▲运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

  • 单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

  • 测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发

  • 计算精度:B200 采用 FP4,H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。


  • 节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

  • 测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

  • 计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度


与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

精度MMLUGSM8KAIME 2024GPQA DiamondMATH-500DeepSeek R1-FP890.8%96.3%80.0%69.7%95.4%DeepSeek R1-FP490.7%96.1%80.0%69.2%94.2%

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“咬牙”也要入手的4种家电:用上就再也回不去了,记得买高端货

“咬牙”也要入手的4种家电:用上就再也回不去了,记得买高端货

装修秀
2025-04-02 11:00:03
C919谁又定600架? 美国为C919航发埋雷,不料我国突然换了玩法

C919谁又定600架? 美国为C919航发埋雷,不料我国突然换了玩法

红色鉴史官
2025-04-21 23:00:03
俄议员:俄有权从中国“收回”辽宁舰,中方务必拆掉武器停止军用

俄议员:俄有权从中国“收回”辽宁舰,中方务必拆掉武器停止军用

boss外传
2025-04-15 09:35:03
网约车司机怼乘客“不加价永远打不到车!”广西三江交通局:处罚标准低难杜绝,希望平台加强监管

网约车司机怼乘客“不加价永远打不到车!”广西三江交通局:处罚标准低难杜绝,希望平台加强监管

大风新闻
2025-04-21 14:53:03
内地至今未婚的5位著名女演员,个个都是半老徐娘,男人“杀手”

内地至今未婚的5位著名女演员,个个都是半老徐娘,男人“杀手”

顾蔡卫
2025-03-14 17:47:12
太离谱!同事请丧假,理由是母亲去世。领导开车60多公里奔丧,还拿着大大的花圈,结果人家妈开门了

太离谱!同事请丧假,理由是母亲去世。领导开车60多公里奔丧,还拿着大大的花圈,结果人家妈开门了

老板手记
2025-02-01 19:37:20
尽管掘金在加时赛中战胜快船,比尔·西蒙斯仍对掘金队发出警告

尽管掘金在加时赛中战胜快船,比尔·西蒙斯仍对掘金队发出警告

好火子
2025-04-22 02:52:38
黄仁勋两句话让“台独”崩溃,赖清德“脱中入北”愚蠢至极

黄仁勋两句话让“台独”崩溃,赖清德“脱中入北”愚蠢至极

海峡导报社
2025-04-21 13:27:12
深度分析:掘金与快船系列赛的结果将决定小迈克尔·波特的未来

深度分析:掘金与快船系列赛的结果将决定小迈克尔·波特的未来

好火子
2025-04-22 03:14:26
朱立伦宣战,号召2300万人反抗赖清德,倒计时5天,大戏即将上演

朱立伦宣战,号召2300万人反抗赖清德,倒计时5天,大戏即将上演

武事汇
2025-04-21 19:33:29
外交部宣布阿利耶夫将访华

外交部宣布阿利耶夫将访华

看看新闻Knews
2025-04-21 21:52:27
刘亦菲素颜出镜,与路人无差别,网友:这才是真实状态

刘亦菲素颜出镜,与路人无差别,网友:这才是真实状态

情感大头说说
2025-04-21 00:20:55
李敏年轻时确实漂亮,孔令华皮鞋擦得锃亮,二人坐在湖边的椅子上

李敏年轻时确实漂亮,孔令华皮鞋擦得锃亮,二人坐在湖边的椅子上

大江
2025-04-16 07:19:32
特朗普暂缓关税,美财长摊牌了:中国影响力太大,没有国家签协议

特朗普暂缓关税,美财长摊牌了:中国影响力太大,没有国家签协议

兵说
2025-04-20 22:05:36
反华女总理菲娅梅:上任后直接叫停中方港口项目!

反华女总理菲娅梅:上任后直接叫停中方港口项目!

杨哥历史
2025-03-23 10:31:15
36岁李诞在上海,一个人外出逛街,打扮土气老成,好像退休的大爷

36岁李诞在上海,一个人外出逛街,打扮土气老成,好像退休的大爷

西瓜爱娱娱
2025-04-21 10:07:53
12天打6场,NBA季后赛赛程安排引争议,联盟保雷霆,1队被当炮灰

12天打6场,NBA季后赛赛程安排引争议,联盟保雷霆,1队被当炮灰

看球老人
2025-04-21 21:46:54
人民币大消息!贸易战再下一城,中国电商霸榜欧美,跨境结算规模同比爆长320%,摆脱美元霸权指日可待?

人民币大消息!贸易战再下一城,中国电商霸榜欧美,跨境结算规模同比爆长320%,摆脱美元霸权指日可待?

金融界
2025-04-21 13:15:05
没想到夜店风波后,胡杏儿竟以这种方式,狠狠抽了李承德一记耳光

没想到夜店风波后,胡杏儿竟以这种方式,狠狠抽了李承德一记耳光

晓风说
2025-04-19 14:34:22
美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

混沌录
2025-04-17 17:49:14
2025-04-22 07:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
282434文章数 606124关注度
往期回顾 全部

数码要闻

苹果Vision Pro最强劲敌!vivo Vision头显下半年发布

头条要闻

普京:复活节停火期限结束后 军事行动已经恢复

头条要闻

普京:复活节停火期限结束后 军事行动已经恢复

体育要闻

不爱踢球的巴西人,成了乒乓球世界冠军

娱乐要闻

网曝鹿晗关晓彤分手细节 或与结婚有关

财经要闻

沐邦高科危险信号:多笔交易存蹊跷

科技要闻

OpenAI还能扛起人工智能的大旗吗?

汽车要闻

与众06 新的命名方式意味着新的产品序列即将到来

态度原创

艺术
教育
房产
数码
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

教育要闻

妈妈笑着拿起试卷,开始发火,因为两个人研究的答案完全不对

房产要闻

涉及6.7万亩!多个片区规划曝光!三亚,又将巨变!

数码要闻

英特尔:新一代英特尔锐炫显卡大显存生产力版本正向我们走来

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版