网易首页 > 网易号 > 正文 申请入驻

每秒每GPU处理8064个词元:英伟达刷新DeepSeek-R1推理纪录

0
分享至

IT之家 4 月 2 日消息,科技媒体 Wccftech 昨日(4 月 1 日)发布博文,报道称在被誉为“AI 界最严苛大考”的 MLPerf v6.0 AI 推理基准测试中,英伟达再次交出满分答卷。

相比较此前的 v5.1 版本,本月(2026 年 4 月)发布的 MLPerf v6.0 引入了多种前沿的生成式 AI 模型,并重点升级推理交互性和大规模多节点系统。


IT之家援引英伟达新闻稿,MLPerf v6.0 为反映当前 AI 工业界的真实应用趋势,引入了多个模型,并重点考察了密集型大语言模型和视觉语言模型:

  • GPT-OSS-120B:新增的大型开源权重语言模型,专注于数学、科学推理和代码编写能力测试。
  • DeepSeek-R1 交互模式:在 v5.1 引入 DeepSeek-R1 后,v6.0 增加了交互式场景(Interactive scenario)。该场景对首字响应时间(TTFT)和每 Token 速率有更高要求,更贴近真实聊天机器人体验。
  • Qwen3-VL-235B:该套件中首个多模态视觉语言模型(VLM),用于测试将非结构化多模态数据转换为结构化元数据的能力。
  • WAN-2.2(Text-to-Video):套件中首个文生视频基准测试。考虑到生成视频的计算量极大,该测试弃用了传统的 Server 模式,改用 SingleStream 模式以更准确地衡量延迟。
  • DLRMv3:第三代推荐系统基准,由 Meta 贡献,从传统的 DCNv2 升级为基于 Transformer 的架构,提升了模型规模和计算强度。
  • YOLOv11 Large:针对边缘计算场景,将目标检测基准更新为 Ultralytics 的最新 YOLOv11 模型。

官方最新公布的 MLPerf 推理 v6.0 测试结果显示,英伟达凭借 Blackwell Ultra 架构(GB300 NVL72),实现了全方位的性能碾压,其 AI 推理成绩不仅位列第一,其推理训练 Wins 数量更领先最接近的竞争对手 9 倍。


在备受瞩目的 DeepSeek-R1 服务器端测试中,英伟达交出了每秒每 GPU 处理 8064 个词元(token)的成绩。与之前的 v5.1 版本相比,处理速度大幅飙升 2.77 倍。


此外,在 Llama 3.1 405B 模型的服务器与离线测试中,英伟达也分别实现了 1.52 倍和 1.21 倍的性能提升。

跑分GB300 NVL72 v5.1GB300 NVL72v6.0提速DeepSeek-R1(Server)2,907 tokens/sec/gpu8,064 tokens/sec/gpu2.77xDeepSeek-R1(Offline)5,842 tokens/sec/gpu9,821 tokens/sec/gpu1.68xLlama 3.1 405B(Server)170 tokens/sec/gpu259 tokens/sec/gpu1.52xLlama 3.1 405B(Offline)224 tokens/sec/gpu271 tokens/sec/gpu1.21x

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“走人福 休假1天”!四川一店铺张贴告示登上热搜,网友:懵圈了

“走人福 休假1天”!四川一店铺张贴告示登上热搜,网友:懵圈了

火山詩话
2026-04-09 09:22:00
涉黄“翻车”的海河乳品:老字号拼出圈,经销商成“漏洞”

涉黄“翻车”的海河乳品:老字号拼出圈,经销商成“漏洞”

新京报
2026-04-08 23:27:14
安徽女童遇害,凶手娘家村民再曝猛料!从小被父母娇惯,争强好胜

安徽女童遇害,凶手娘家村民再曝猛料!从小被父母娇惯,争强好胜

青橘罐头
2026-04-09 07:50:17
巴萨愤怒!欧冠关键战遭漏判点球+马竞2人逃红 弗里克:VAR成摆设

巴萨愤怒!欧冠关键战遭漏判点球+马竞2人逃红 弗里克:VAR成摆设

我爱英超
2026-04-09 06:41:49
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

有范又有料
2026-04-07 16:45:46
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

古史青云啊
2026-04-07 14:52:09
谁是逆转青岛的主导者?麦穗丰:不是43分的麦考尔,两人至关重要

谁是逆转青岛的主导者?麦穗丰:不是43分的麦考尔,两人至关重要

南海浪花
2026-04-09 06:48:22
秋瓷炫透露儿子9月上三年级:很辛苦,要学中韩英三门语言,曾因语言不通,要求“换个会韩语的爸爸”

秋瓷炫透露儿子9月上三年级:很辛苦,要学中韩英三门语言,曾因语言不通,要求“换个会韩语的爸爸”

台州交通广播
2026-04-09 00:37:05
1978年,陈丽华丈夫迟重瑞的留影,这年迟重瑞26岁

1978年,陈丽华丈夫迟重瑞的留影,这年迟重瑞26岁

有态度网友19uQxk
2026-04-08 07:24:14
一场晚宴改变岛内风向,郑丽文勇敢表态获欣赏,萧旭岑被集体心疼

一场晚宴改变岛内风向,郑丽文勇敢表态获欣赏,萧旭岑被集体心疼

哄动一时啊
2026-04-08 17:23:03
全红婵报警:潜伏裁判给低分,郭晶晶看出猫腻,过往不公彻底曝光

全红婵报警:潜伏裁判给低分,郭晶晶看出猫腻,过往不公彻底曝光

眼光很亮
2026-04-08 14:51:46
曼城的痛:阿尔瓦雷斯飙无敌任意球世界波,轰开巴萨大门,太丝滑了

曼城的痛:阿尔瓦雷斯飙无敌任意球世界波,轰开巴萨大门,太丝滑了

侧身凌空斩
2026-04-09 04:14:41
美国华裔科学家李飞飞:若夺下诺贝尔奖,我定以中国人身份领奖!

美国华裔科学家李飞飞:若夺下诺贝尔奖,我定以中国人身份领奖!

领悟看世界
2026-04-09 01:04:16
茅台提价,市场不认

茅台提价,市场不认

快马财媒
2026-04-09 08:11:49
几乎都是假货!利润高达2400%,可为何消费者还争相购买?

几乎都是假货!利润高达2400%,可为何消费者还争相购买?

小熊侃史
2026-04-09 09:36:50
香蕉被点名!医生提醒:高血糖患者常吃香蕉,很快或迎来这些后果

香蕉被点名!医生提醒:高血糖患者常吃香蕉,很快或迎来这些后果

白话电影院
2026-04-07 20:07:56
为啥很多人不愿做颈动脉超声?主任:一次检查,或能7年远离脑梗

为啥很多人不愿做颈动脉超声?主任:一次检查,或能7年远离脑梗

医学科普汇
2026-04-08 21:15:19
国家体育总局回应全红婵遭网暴:已联合开展核查处置 全红婵所属训练中心已向警方报案

国家体育总局回应全红婵遭网暴:已联合开展核查处置 全红婵所属训练中心已向警方报案

闪电新闻
2026-04-08 14:45:59
卡拉格:看利物浦踢巴黎简直就像在看一支低级别球队对阵豪门

卡拉格:看利物浦踢巴黎简直就像在看一支低级别球队对阵豪门

懂球帝
2026-04-09 10:25:09
为什么没人联合打以色列,答案很简单:不是没人想打,是没人敢打

为什么没人联合打以色列,答案很简单:不是没人想打,是没人敢打

混沌录
2026-04-07 17:48:09
2026-04-09 12:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
338152文章数 607120关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

牛弹琴:停火数小时后发生可怕屠杀 三点实在太诡异

头条要闻

牛弹琴:停火数小时后发生可怕屠杀 三点实在太诡异

体育要闻

40岁,但实力倒退12年

娱乐要闻

具俊晔最新露面,又黑又瘦情绪低迷

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

旅游
艺术
亲子
游戏
健康

旅游要闻

坐着高铁去赏花!山东“牡丹号”赏花列车上新 凭车票享门票3.6折优惠

艺术要闻

庞茂琨 2026油画写生新作

亲子要闻

宝宝初体验摘草莓,宝宝第一视角

IGN《地平线6》前瞻:令人流连忘返 地图绝对杰作!

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版