网易首页 > 网易科技 > 网易智能 > 正文

NVIDIA黄仁勋亲自撰文怼上TPU:P40速度比你快2倍

0
分享至
导语:英伟达 CEO 黄仁勋就亲自撰文回应了TPU性能的,文章第一段就以谷歌TPU开头,炮击意图十分明显,随后更是扔出了 Tesla P40 GPU 与 TPU 的对比。

(原标题:黄仁勋亲自撰文怼上 TPU:P40速度比你快2倍,带宽是你的 10 倍)


雷锋网按:前不久谷歌发布了关于TPU细节的论文,称“TPU 处理速度比当前 GPU 和 CPU 要快15到30倍”。当时就有人对此种“比较”表示质疑,因其拿来的比较对象并非市场里性能最好的。

而昨晚(美国时间 4 月 10 日)英伟达 CEO 黄仁勋就亲自撰文回应了这一“比较”,文章第一段就以谷歌 TPU 开头,炮击意图十分明显,随后更是扔出了 Tesla P40 GPU 与 TPU 的性能对比图,可谓针尖对麦芒。

不过 P40 和 TPU 的售价差距很大(P40 24GB版本售价5千多美元,TPU 成本估计在几百美元),尺寸和制程也不一样,也有人觉得这样的对比未免也是不恰当的。但黄仁勋不惜亲自撰写长文,摆事实摆数据,意在表明英伟达在 AI 芯片领域的强势姿态和技术领先的骄傲。

当时TPU论文甫一发布,雷锋网就论文中的比较对象问题咨询了AI人士意见,感兴趣的读者可戳《谷歌公布TPU细节之后,AI业界怎么看?》。以下为黄仁勋发表全文,原文标题为“AI 驱动数据中心加速计算的崛起”(AI Drives the Rise of Accelerated Computing in Data Centers),由雷锋网(公众号:雷锋网)编译。

谷歌最近的TPU论文给出了一个十分明确的结论:如果没有高速计算能力,大规模AI实现根本不可能。

如今的世界经济运行在全球的数据中心之上,而数据中心也在急剧发生改变。不久之前,数据中心服务支撑网页、广告和视频。现在,它们能够从视频流里识别声音、检测图片,还能随时让我们获得想要的信息。

以上提到的各种能力,都在愈来愈依靠深度学习来支撑。深度学习是一种算法,从海量数据里学习形成软件,来处理诸多高难度挑战,包括翻译、癌症诊断、自动驾驶等等。这场由AI引发的变革,正在以一种前所未有的速度影响着各种行业。

深度学习的开拓者Geoffrey Hinton最近在接受《纽约客》采访时说道:“凡是任何一个有很多数据的分类问题,都可以用深度学习的方法来解决。深度学习有几千种应用。”

不可思议的效果

以谷歌为例。谷歌在深度学习里突破性的工作引发了全球关注:Google Now 语音交互系统令人吃惊的精确性、AlphaGo在围棋领域历史性的胜利、谷歌翻译应用于100种语言。

深度学习已经达到了不可思议的效果。但是深度学习的方法,要求计算机在摩尔定律放缓的时代背景下,精确处理海量数据。深度学习是一种全新的计算模型,它也需要一种全新计算架构的诞生。

一段时间以来,这种 AI 计算模型都是运行于英伟达芯片之上。2010 年,研究员 Dan Ciresan 当时在瑞士 Juergen Schmidhuber 教授的 AI 实验室工作,他发现英伟达 GPU 芯片可以被用来训练深度神经网络,比 CPU 的速度快 50 倍。一年之后,Schmidhuber 教授的实验室又使用 GPU 开发了世界上首个纯深度神经网络,一举赢得国际手写识别和计算机视觉比赛的冠军。接着,在 2012 年,多伦多大学的硕士生 Alex Krizhevsky 使用了两个 GPU,赢得了如今蜚声国际的 ImageNet 图像识别竞赛。(Schmidhuber教授曾经写过一篇文章,全面梳理了运行于GPU之上的深度学习对于当代计算机视觉的影响 http://people.idsia.ch/~juergen/computer-vision-contests-won-by-gpu-cnns.html)

深度学习优化

全球的 AI 研究员都发现了,英伟达为计算机图形和超级计算应用所设计的 GPU 加速计算模型,是深度学习的理想之选。深度学习应用,比如 3D 图形,医疗成像、分子动力学、量子化学和气象模拟等,都是一种线性代数算法,需要进行大规模并行张量或多维向量计算。诞生于 2009 年的英伟达 Kepler GPU 架构,虽然帮助唤醒了世界在深度学习中使用 GPU 加速计算,但其诞生之初并非为深度学习量身定制的。

所以,我们必须开发出新一代GPU架构,首先是 Maxwell,接着是 Pascal,这两种架构都对深度学习进行了特定的优化。在Kepler Tesla K80 之后四年,基于 Pascal 架构的 Tesla P40 推理加速器诞生了,它的推理性能是前者的 26 倍,远远超过了摩尔定律的预期。

在这一时期,谷歌也设计了一款定制化的加速器芯片,名为“张量处理单元”,即 TPU。具体针对数据推理,于 2015 年部署。

上周,谷歌团队发布了关于 TPU 优越性的一些信息,称 TPU 比 K80 的推理性能高出 13 倍。但是,谷歌并没有拿 TPU 与如今最新一代的 Pascal P40 做比较。

最新对比

我们创建了如下的图表,对 K80、TPU 和 P40 的性能进行量化,看看 TPU 与如今的英伟达技术之间的较量。

P40 在计算精度和吞吐量、片内存储和存储带宽之间达到了良好平衡,不仅在训练阶段,也在推理阶段达到了前所未有的性能表现。对于训练阶段,P40 拥有 10 倍于 TPU 的带宽,32 位浮点性能达到 12个 TFLOPS 。对于推理阶段,P40 具有高吞吐的 8 位整数和高存储带宽。

数据基于谷歌 Jouppi 等人论文“In-Datacenter Performance Analysis of a Tensor Processing Unit”[Jou17],以及英伟达内部基准分析。K80 与 TPU 的性能比数据来源于论文[Jou17]里 CNN0 和 CNN1的加速性能比,其中比较的是性能减半的 K80。K80 与 P40 性能比基于 GoogLeNet 模型,这是一种可以公开使用的CNN 模型,具有相似的性能属性。

虽然谷歌和英伟达选择了不同的发展路径,我们有一些共同关切的主题。具体包括:

AI 需要加速计算。在摩尔定律变慢的时代背景下,加速器满足了深度学习海量数据处理需求

张量处理处于深度学习训练和推理性能的核心位置

张量处理是一个重要的新工作负载,企业在建立现代数据中心的时候,要考虑这一问题

加速张量处理可以显著减少现代数据中心的建设成本

全球科技正处于一场被称为“AI 革命”的历史性转变中。如今这场革命影响最深刻的地方,就是阿里巴巴、亚马逊、百度、Facebook、谷歌、IBM、微软、腾讯等公司所拥有的的超大规模数据中心。这些数据中心,需要加速 AI 工作负载,不必花费数十亿美元用新的CPU节点来打造新的数据中心。如果没有加速计算,大规模 AI 实现根本不可能。

GPU加速计算为深度学习和现代AI 供能。大家可以在 5 月 8-11 日到加州圣何塞参加我们的 GPU Technology 大会。你将会听到 AI 开拓者们谈论他们突破性的发现,并且获悉 GPU 计算的最新进展是如何在变革一个又一个行业。

相关推荐
热点推荐
刘震云:一个人不喜欢去别人家,也不喜欢别人来自己家,十有八九是这几种心态!

刘震云:一个人不喜欢去别人家,也不喜欢别人来自己家,十有八九是这几种心态!

LULU生活家
2025-12-26 19:00:16
人民币汇率破7!接下来股市、楼市和你手里的资产都会怎么走?

人民币汇率破7!接下来股市、楼市和你手里的资产都会怎么走?

墨兰史书
2025-12-26 18:40:03
太稳了!海港连签本土3大实力悍将 短板都补强 仅剩最后一个隐忧

太稳了!海港连签本土3大实力悍将 短板都补强 仅剩最后一个隐忧

零度眼看球
2025-12-26 06:39:49
F-16击落全部34枚导弹,“匕首”没击中目标!确认牺牲英雄身份

F-16击落全部34枚导弹,“匕首”没击中目标!确认牺牲英雄身份

鹰眼Defence
2025-12-24 16:17:27
A股:刚刚,央行、上交所发布,释放两信号,下周一将迎来新行情

A股:刚刚,央行、上交所发布,释放两信号,下周一将迎来新行情

阿纂看事
2025-12-26 22:24:09
铁矿石和铁矿石的差距,比人和狗之间的差距还要大

铁矿石和铁矿石的差距,比人和狗之间的差距还要大

介知
2025-12-25 17:16:39
塔利斯卡:在中国生活简直是一种享受,那段时光非常美好

塔利斯卡:在中国生活简直是一种享受,那段时光非常美好

懂球帝
2025-12-26 13:44:47
主客场双杀旧主率队6连胜!赵睿轰23+5+6创加盟北京最佳一战

主客场双杀旧主率队6连胜!赵睿轰23+5+6创加盟北京最佳一战

狼叔评论
2025-12-26 22:26:11
医学博士:肿瘤越来越高发,我们究竟被隐瞒了什么?

医学博士:肿瘤越来越高发,我们究竟被隐瞒了什么?

深度报
2025-12-21 23:01:02
正妻寒酸,18岁小妾却有价值9亿“金蝉玉叶”,现为南博镇馆之宝

正妻寒酸,18岁小妾却有价值9亿“金蝉玉叶”,现为南博镇馆之宝

收藏大视界
2025-12-25 17:20:53
恭喜皇马!阿根廷天才国脚加盟!传射兼备颜值高,贝林厄姆不安

恭喜皇马!阿根廷天才国脚加盟!传射兼备颜值高,贝林厄姆不安

阿泰希特
2025-12-26 09:49:25
朱孝天道歉:我因情绪失控,在与他人私信沟通中发表了有失妥当的言论

朱孝天道歉:我因情绪失控,在与他人私信沟通中发表了有失妥当的言论

上观新闻
2025-12-26 09:32:09
珠海楼市起飞上天了,珠海横琴待售二手房从712套增加到了2780套

珠海楼市起飞上天了,珠海横琴待售二手房从712套增加到了2780套

科学发掘
2025-12-26 15:20:02
有钱任性!云南玉昆新赛季豪掷2.6亿:已签下10名新援!

有钱任性!云南玉昆新赛季豪掷2.6亿:已签下10名新援!

邱泽云
2025-12-25 20:48:16
高市刚敲定稀土大单,哈萨克斯坦趁虚而入,结果被中国卡脖子

高市刚敲定稀土大单,哈萨克斯坦趁虚而入,结果被中国卡脖子

南宫一二
2025-12-22 20:04:41
杨兰兰现状:不上课、不社交、吃米其林,只买最贵,Ins账号曝光

杨兰兰现状:不上课、不社交、吃米其林,只买最贵,Ins账号曝光

公子麦少
2025-10-07 14:45:28
赵露思被鞠婧祎被秒的渣都不剩网友:苦练化妆技术奈何遇上建模怪

赵露思被鞠婧祎被秒的渣都不剩网友:苦练化妆技术奈何遇上建模怪

吴东升成
2025-12-26 05:39:04
这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

装修秀
2025-11-13 11:50:03
21岁中国女生命丧加拿大,男友7天后上电视痛哭,真相令人发指

21岁中国女生命丧加拿大,男友7天后上电视痛哭,真相令人发指

宅家伍菇凉
2024-12-14 17:56:40
4 届世界杯冠军连续 11 年缺席!意大利足球,为何彻底迷失了?

4 届世界杯冠军连续 11 年缺席!意大利足球,为何彻底迷失了?

澜归序
2025-12-25 14:03:34
2025-12-27 00:08:49

科技要闻

收割3000亿!拼多多"土办法"熬死所有巨头

头条要闻

老人婚宴上被提醒孙女非亲生 做鉴定后忍3年忍不了了

头条要闻

老人婚宴上被提醒孙女非亲生 做鉴定后忍3年忍不了了

体育要闻

开翻航母之后,他决定亲手造一艘航母

娱乐要闻

王传君生病后近照变化大,面部浮肿

财经要闻

投资巨鳄罗杰斯最新持仓:只留四种资产

汽车要闻

两大CEO试驾 华为乾崑*启境开启首款猎装轿跑路测

态度原创

旅游
数码
艺术
游戏
军事航空

旅游要闻

冰雪微笑曲线|松花湖新雪季焕新登场 点燃冬日“热雪”之旅

数码要闻

标配麒麟9020A!华为Mate 70 Air 16GB内存版明天开售:4699元起

艺术要闻

William Dyce:19世纪苏格兰重要的画家

曝《AC影》与黑旗和奥德赛联动:第二年更新汇总

军事要闻

乌最新20点俄乌和平草案递交莫斯科 俄方拒绝

无障碍浏览 进入关怀版
×