网易首页 > 网易号 > 正文 申请入驻

英伟达宣布创造满血 DeepSeek 推理世界纪录

0
分享至

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA BlackwellDGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行6710 亿参数的满血DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

  • 单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

  • 测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发

  • 计算精度:B200 采用 FP4,H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

  • 节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

  • 测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

  • 计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

精度MMLUGSM8KAIME 2024GPQA DiamondMATH-500DeepSeek R1-FP890.8%96.3%80.0%69.7%95.4%DeepSeek R1-FP490.7%96.1%80.0%69.2%94.2%

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
家里有这4款老酒,别喝掉更别卖掉,如今的价值不输飞天茅台

家里有这4款老酒,别喝掉更别卖掉,如今的价值不输飞天茅台

涛哥美食汇
2026-02-24 08:49:53
中国男篮决战日本队,最强首发五人揭晓,要打爆小日子20分

中国男篮决战日本队,最强首发五人揭晓,要打爆小日子20分

宗介说体育
2026-02-24 09:59:41
一箱油可横跨北美 本田新型小飞机卖爆:购买意向达产能10倍

一箱油可横跨北美 本田新型小飞机卖爆:购买意向达产能10倍

快科技
2026-02-24 08:21:03
高速免费最后60秒收费站上演飞驰人生,有人卡点失败缴费400多元!有人“压哨”通过,两台车省下1000多元

高速免费最后60秒收费站上演飞驰人生,有人卡点失败缴费400多元!有人“压哨”通过,两台车省下1000多元

极目新闻
2026-02-24 00:56:49
价格翻10倍,好难抢!有人懊悔到拍大腿,网友马上翻箱倒柜:我家好像有

价格翻10倍,好难抢!有人懊悔到拍大腿,网友马上翻箱倒柜:我家好像有

上观新闻
2026-02-24 11:29:15
6.9斤烤全羊商家好评如潮,多给了6斤活羊套餐还赠送大量菜

6.9斤烤全羊商家好评如潮,多给了6斤活羊套餐还赠送大量菜

映射生活的身影
2026-02-24 12:34:56
央媒曝光:14种品牌奶粉都是假的!原料为奶精+淀粉,已销往全国

央媒曝光:14种品牌奶粉都是假的!原料为奶精+淀粉,已销往全国

云舟史策
2026-02-23 16:26:54
奥运冠军“拉拉链露胸”,让耐克绷不住了!

奥运冠军“拉拉链露胸”,让耐克绷不住了!

品牌营销报
2026-02-23 11:31:10
“福特”号航母650个厕所坏了近9成,近5000人上厕所排队要四五十分钟,美军只能先停靠希腊

“福特”号航母650个厕所坏了近9成,近5000人上厕所排队要四五十分钟,美军只能先停靠希腊

大象新闻
2026-02-24 12:44:26
深圳一女子春节返程遇“高铁超载”被迫下车,12306:因“买短乘长”人数太多导致超载

深圳一女子春节返程遇“高铁超载”被迫下车,12306:因“买短乘长”人数太多导致超载

上游新闻
2026-02-24 14:25:37
王楠执教突遭举报!上任即翻车,郭斌最担心的事还是来了

王楠执教突遭举报!上任即翻车,郭斌最担心的事还是来了

卿子书
2026-02-24 09:04:42
俄乌牺牲士兵们的平凡愿望,如今只能在AI里实现了

俄乌牺牲士兵们的平凡愿望,如今只能在AI里实现了

网易新闻出品
2026-02-24 10:00:05
新加坡大满贯最新战报:八强已出四,头号种子爆冷,世界冠军惨败

新加坡大满贯最新战报:八强已出四,头号种子爆冷,世界冠军惨败

吴朑爱游泳
2026-02-24 15:03:55
中央三部门重磅定调:公务员不允许弹性延迟退休!

中央三部门重磅定调:公务员不允许弹性延迟退休!

浅深说
2026-02-24 13:12:00
火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

醉卧浮生
2026-02-24 12:54:22
中铁二十一局今年的年终奖工资单。。。

中铁二十一局今年的年终奖工资单。。。

新浪财经
2026-02-24 13:51:53
三只羊上市成功,一切都反转了!

三只羊上市成功,一切都反转了!

财经三分钟pro
2026-02-24 11:21:38
春节高速免费最后1分钟:有人压哨通过省下1000多元,也有车主从萧山上高速后“卡点”失败交了几百元通行费

春节高速免费最后1分钟:有人压哨通过省下1000多元,也有车主从萧山上高速后“卡点”失败交了几百元通行费

都市快报橙柿互动
2026-02-24 09:16:26
何超琼身价突破700亿,3位保镖一同出行,手里的包包成为亮点

何超琼身价突破700亿,3位保镖一同出行,手里的包包成为亮点

素素娱乐
2026-02-24 08:11:21
返程路上女子被丈夫丢在服务区,当场崩溃!丈夫:没发现,很懊悔

返程路上女子被丈夫丢在服务区,当场崩溃!丈夫:没发现,很懊悔

半岛晨报
2026-02-24 15:51:26
2026-02-24 17:12:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
330739文章数 607013关注度
往期回顾 全部

数码要闻

新年马上开工大吉!京东3C数码企业采购集达量返卡至高3000元

头条要闻

巴拿马当局已接管长江和记两座港口 外交部回应

头条要闻

巴拿马当局已接管长江和记两座港口 外交部回应

体育要闻

苏翊鸣总结米兰征程:我仍是那个热爱单板滑雪的少年

娱乐要闻

杨洋传遇上缅北剧组 开机就离开剧组?

财经要闻

县城消费「限时繁荣」了十天

科技要闻

AI颠覆发展最新牺牲品!IBM跳水重挫超13%

汽车要闻

入门即满配 威兰达AIR版上市 13.78万元起

态度原创

艺术
教育
房产
旅游
公开课

艺术要闻

2025年第八届全国青年美展 | 油画作品选刊

教育要闻

如何评价高二英语难度?中考英语130,高二文章完全看不懂

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

旅游要闻

“闽式福年”火热出圈 福建文旅市场实现新春“开门红”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版