网易首页 > 网易号 > 正文 申请入驻

谷歌训练BERT仅23秒,英伟达A100破八项AI性能纪录,最新MLPerf榜单

0
分享至

机器之心报道

编辑:泽南、张倩

在最新的 MLPerf 基准测试结果中,英伟达新出的 A100 GPU 打破了八项 AI 性能纪录,谷歌的 4096 块 TPU V3 将 BERT 的训练时间缩短到了 23 秒。华为昇腾 910 这次也跑了个分。

在距离推出不到一个月的时间里,内置超过 2000 块英伟达 A100 GPU 的全新 DGX SuperPOD 服务器就在各项针对大规模计算性能的 MLPerf 基准测试中取得了优异成绩。

在今天官方发布的 MLPerf 第三批 AI 训练芯片测试结果中,英伟达 A100 Tensor Core GPU 在全部八项基准测试中展现了最快性能。在实现总体最快的大规模解决方案方面,利用 HDR InfiniBand 实现多个 DGX A100 系统互联的服务器集群 DGX SuperPOD 系统也同样创造了业内最优性能。

行业基准测试组织 MLPerf 于 2018 年 5 月由谷歌、百度、英特尔、AMD、哈佛和斯坦福大学共同发起,目前已成为机器学习领域芯片性能的重要参考标准。此次结果已是英伟达在 MLPerf 训练测试中连续第三次展现了最强性能。早在 2018 年 12 月,英伟达就曾在 MLPerf 训练基准测试中创下了六项纪录,次年 7 月英伟达再次创下八项纪录。

最新版的 MLPerf 基准测试包含 8 个领域的 8 项测试,分别为目标检测(light-weight、heavy-weight)、翻译(recurrent、non-recurrent)、NLP、推荐系统、强化学习,参与测试的模型包括 SSD、Mask R-CNN、NMT、BERT 等。MLPerf 在强化学习测试中使用了 Mini-go 和全尺寸 19×19 围棋棋盘。该测试是本轮最复杂的测试,内容涵盖从游戏到训练的多项操作。

在最新的测试中,英伟达送交的服务器配置和测试结果使用了最新一代的安培(Ampere)架构,以及目前较为流行的 Volta 架构 V100 芯片。

英伟达表示,在评测结果中,自己是唯一一家在所有测试中均采用市售商用产品的公司。其他厂家大多数提交使用的要么是预览类别(Preview,其所用产品预计几个月后才会面市),要么使用的是仍在研究中的产品。

安培架构,市场采用速度刷新纪录

今年 5 月在 GTC 大会上正式发布的 A100 是首款基于安培架构的处理器,它不仅打破了 GPU 性能纪录,其进入市场的速度也比以往任何英伟达 GPU 更快。A100 在发布之初用于 NVIDIA 的第三代 DGX 系统,正式发布仅六周后就正式登陆谷歌云服务系统。

目前,AWS、百度云、微软 Azure 和腾讯云等全球云提供商,以及戴尔、惠普、浪潮和超微等数十家主要服务器制造商,均已推出基于 A100 的云服务或服务器产品。

英伟达 A100 在 MLPerf 单卡性能名列前茅的全部八项测试,最新的 MLPerf 榜单中还有华为昇腾 910 的成绩。

英伟达 GPU 性能的提升不仅来自硬件。测试结果显示,相较于首轮 MLPerf 训练测试中使用的基于 V100 GPU 的系统,如今的 DGX A100 系统能够以相同的吞吐率,实现高达 4 倍的性能提升。同时,得益于最新的软件优化,基于 NVIDIA V100 的 DGX-1 系统亦可实现高达 2 倍的性能提升。

谷歌:我们成绩太好,基准测试需要换了

在最新的 MLPerf 测试结果中,谷歌的 TPU 加速器也获得了很好的成绩:在预览和测试组别中,TPU 集群打破了 8 项测试纪录中的 6 项,4096 块并联的 TPU v3 可以实现高达 430 PFLOPs 的峰值算力,训练 ResNet-50、BERT、Transformer、SSD 等模型都可以在 33 秒内完成。

程序员大神,谷歌 AI 负责人 Jeff Dean 说道:「我们需要更大的基准测试,因为现在训练 ResNet-50、BERT、Transformer、SSD 这种模型只需要不到 30 秒了。」

谷歌与第二名在 6 项基准上的成绩比较。

谷歌在本次 MLPerf 训练中使用的超级计算机比在之前比赛中创下三项记录的 Cloud TPU v3 Pod 大三倍。该系统包括 4096 个 TPU v3 芯片和数百台 CPU 主机,峰值性能超过 430 PFLOPs。

在 4096 块 TPU 的加持下,谷歌的超级计算机可以在 33 秒内训练 ResNet-50、BERT、Transformer、SSD 等模型。在使用 TensorFlow 框架时,该计算机甚至可以将 BERT 的训练时间缩短到 23 秒。

在谷歌最新的 ML 超级计算机上,上述所有模型的训练都可以在 33 秒内完成。

谷歌还在最新的博客中透露了一些关于第四代 TPU 的信息。新一代 TPU 的矩阵乘法 TFLOPs 是上一代的两倍还多,内存带宽显著提高,还采用了新的互连技术。与 TPU v3 相比,TPU V4 在芯片数量类似情况下的表现平均提高了 1.7 倍。

最后,一些从业者也对深度学习框架在模型训练速度上的贡献表示感叹。

看起来,TensorFlow 2.0 的速度比 PyTorch 要快,谷歌最近开源的 TensorFlow 简化库 JAX 则效率更高。在工业应用上,我们对于框架的选择看来也要出现变化?

https://cloud.google.com/blog/products/ai-machine-learning/google-breaks-ai-performance-records-in-mlperf-with-worlds-fastest-training-supercomputer

https://blogs.nvidia.com/blog/2020/07/29/mlperf-training-benchmark-records/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+nvidiablog+%28The+NVIDIA+Blog%29

https://mlperf.org/training-results-0-7

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家,为什么一定要死磕塔克拉玛干?不止治沙那么简单

国家,为什么一定要死磕塔克拉玛干?不止治沙那么简单

清沐执笔
2026-05-30 18:50:44
一念万劫!加布里埃尔最后一罚踢飞,伤心落泪,队友纷纷送上安慰

一念万劫!加布里埃尔最后一罚踢飞,伤心落泪,队友纷纷送上安慰

侧身凌空斩
2026-05-31 03:27:55
新华社下场,耿同学又抛出4条大鱼!

新华社下场,耿同学又抛出4条大鱼!

仕道
2026-05-30 09:52:28
新包装DL天然矿泉水22天后停售!胖东来:系设计方面重大失误 正重新设计

新包装DL天然矿泉水22天后停售!胖东来:系设计方面重大失误 正重新设计

快科技
2026-05-30 20:50:08
俄罗斯无人机击中罗马尼亚,导致2人受伤,预计北约不会有大动作

俄罗斯无人机击中罗马尼亚,导致2人受伤,预计北约不会有大动作

山河路口
2026-05-29 14:04:31
姆巴佩尴尬!离队后巴黎欧冠2连冠 加盟皇马连续2年仅8强+赛季0冠

姆巴佩尴尬!离队后巴黎欧冠2连冠 加盟皇马连续2年仅8强+赛季0冠

我爱英超
2026-05-31 03:49:51
2000亿龙头遭高管集体减持,理由是为孩子教育,董事长套现4.2亿元

2000亿龙头遭高管集体减持,理由是为孩子教育,董事长套现4.2亿元

21世纪经济报道
2026-05-30 23:04:07
西决抢七全美第一热搜!SGA半场19+5压文班 卫冕冠军拉回均势

西决抢七全美第一热搜!SGA半场19+5压文班 卫冕冠军拉回均势

颜小白的篮球梦
2026-05-31 09:21:26
抢七大战!雷霆53-56马刺:SGA19+5 文班亚马10+3!

抢七大战!雷霆53-56马刺:SGA19+5 文班亚马10+3!

运筹帷幄的篮球
2026-05-31 09:24:32
麻省理工出品,AI时代人人必修的最佳公开课!零基础用AI创造几乎所有的一切

麻省理工出品,AI时代人人必修的最佳公开课!零基础用AI创造几乎所有的一切

麻省理工AI公开课
2026-05-30 11:40:07
为何蒙古国不治沙?美国专家认为:植树治沙弊大于利,是真是假?

为何蒙古国不治沙?美国专家认为:植树治沙弊大于利,是真是假?

抽象派大师
2026-05-31 00:29:43
越是上流人越“下流”?苏芒代言遭全民抵制,广汽紧急切割难平息

越是上流人越“下流”?苏芒代言遭全民抵制,广汽紧急切割难平息

枫尘余往逝
2026-05-29 07:35:23
国家免费电视全面开通!自己动手几分钟调好,终身零月租不花钱

国家免费电视全面开通!自己动手几分钟调好,终身零月租不花钱

小柱解说游戏
2026-05-30 18:41:02
王者归来 29岁樊振东率队3-1进决赛:出任一单独取2分 与新主争冠

王者归来 29岁樊振东率队3-1进决赛:出任一单独取2分 与新主争冠

风过乡
2026-05-31 07:09:45
信号失联、烧成火球!神舟二十二号返回遭黑障区,有多惊心动魄?

信号失联、烧成火球!神舟二十二号返回遭黑障区,有多惊心动魄?

有范又有料
2026-05-30 10:57:05
太阳每秒消耗428万吨物质,已经烧了46亿年,为什么能烧这么久?

太阳每秒消耗428万吨物质,已经烧了46亿年,为什么能烧这么久?

向航说
2026-05-30 03:20:03
判了!释永信四罪并罚,资产私生子多,还有3位家喻户晓明星徒弟

判了!释永信四罪并罚,资产私生子多,还有3位家喻户晓明星徒弟

动漫里的童话
2026-05-31 01:11:33
韩国国脚狂喜:决赛1分钟未出场 连续2年躺拿欧冠冠军 789万奖金

韩国国脚狂喜:决赛1分钟未出场 连续2年躺拿欧冠冠军 789万奖金

侃球熊弟
2026-05-31 04:02:10
35页PPT疯传:洛阳女子1女谈3男,每天卡时间,都已谈婚论嫁

35页PPT疯传:洛阳女子1女谈3男,每天卡时间,都已谈婚论嫁

烈史
2026-05-30 13:23:41
印度热炸了,震惊全球!

印度热炸了,震惊全球!

财经三分钟pro
2026-05-28 17:33:22
2026-05-31 09:36:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13116文章数 142655关注度
往期回顾 全部

数码要闻

神秘粉色Beats耳机现身西班牙球星拉明·亚马尔颈间

头条要闻

房主将住宅变"网约房"挂到网上接受预订 邻居不满起诉

头条要闻

房主将住宅变"网约房"挂到网上接受预订 邻居不满起诉

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

游戏
艺术
数码
本地
公开课

巫师3新DLC跨十年:年轻玩家在初发售时还是小孩!

艺术要闻

我想有个小院,从此荒度余生

数码要闻

vivo S60系列发布:2899元起 推出4K原生感Live

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版