公众号记得加星标⭐️,第一时间看推送不会错过。
来 源 : 内容 编译自 wccftech 。
NVIDIA在人工智能领域最大的竞争对手并非AMD或英特尔,而是正在迎头赶上的谷歌。有趣的是,NVIDIA首席执行官黄仁勋已经意识到了这一点。
乍一看,这或许有些出人意料,但谷歌是人工智能硬件竞赛的早期参与者之一,早在2016年就推出了首款TPU定制人工智能芯片,远早于AMD、NVIDIA和英特尔。这家科技巨头上周发布了最新的“第七代”Ironwood TPU,一经推出便席卷业界,进一步巩固了“NVIDIA vs Google”作为最具竞争力的人工智能竞赛的地位。我们将深入探讨这一观点,首先从谷歌最新的Ironwood TPU与NVIDIA TPU的对比入手。
我们来聊聊谷歌的 Ironwood TPU,预计未来几周内即可应用于各种工作负载。谷歌将这款芯片定位为“专注于推理”的选项,声称它将开启通用计算推理性能的新时代。TPU v7(Ironwood)旨在把握模型训练向推理转变的机遇,因此其板载规格旨在确保其在“推理时代”表现出色。以下是一些关键特性:
相比 TPU v5p,峰值性能提升 10 倍。
与 TPU v6e (Trillium) 相比,每个芯片在训练和推理工作负载方面性能提高了 4 倍。
这是谷歌迄今为止打造的最强大、最节能的定制芯片。
现在,深入研究Ironwood芯片的规格,我们发现谷歌计划使用192GB的7.4TB/s HBM内存,每个芯片的峰值浮点运算能力高达4,614 TFLOPs,比TPUv4提升了近16倍。更重要的是,Ironwood的TPU Superpod每个封装包含9,216个芯片,在FP8计算工作负载下,其累计性能可达42.5 exaFLOPS。Superpod的芯片数量表明,谷歌拥有高效的互连解决方案,其可扩展性甚至超越了NVLink。
说到互连,谷歌采用了芯片间互连(ICI)技术,这是一种可扩展的网络。该网络使他们能够构建一个包含 43 个模块(每个模块由 64 个芯片组成)的 Superpod,并通过一个 1.8 PB 的网络进行连接。内部通信由一系列网卡处理,谷歌在其 TPU 中采用了 3D 环形布局,从而实现了大量芯片之间的高密度互连。与 NVLink 相比,谷歌的优势在于可扩展性和互连密度,这也是 Superpod 有望成为颠覆性产品的原因。
![]()
让我们来探讨一下为什么 Ironwood TPU 有望在推理时代发挥重要作用。但在此之前,我们首先需要了解为什么“思维模型”是下一个重大发展方向。模型训练一直是人工智能行业的主流趋势,这也是为什么英伟达的计算产品组合成为大型科技公司首选的原因,因为它在适合训练环境的各种场景下都能提供更佳的性能。然而,由于主流模型现在已经部署完毕,推理查询的数量可能远远超过训练任务的数量。
如今,在推理领域,追求最高的“TFLOPS”(浮点运算能力)已不再是唯一目标;其他指标也变得至关重要,例如延迟、吞吐量、效率和每次查询成本。正因如此,当我们审视谷歌的Ironwood产品时,“谷歌在人工智能竞赛中超越NVIDIA”的说法就显得更加显而易见。首先,Ironwood拥有海量的板载内存,其容量与NVIDIA的Blackwell B200 AI GPU相当。然而,考虑到SuperPod集群在一个环境中就拥有9216个芯片,其可用内存容量远超Blackwell B200。
更大的内存容量对于推理至关重要,因为它能降低芯片间通信开销,并改善大型模型的延迟,这也是Ironwood更具吸引力的原因之一。Ironwood的架构专为推理而设计,这意味着谷歌特别注重确保低延迟和高能效,而功耗是Ironwood成功背后的“第二大”因素,我们稍后会详细讨论。
在超大规模数据中心进行推理意味着需要数千个芯片来处理推理查询,而且所有操作都必须在全天候运行的环境中进行。云服务提供商 (CSP) 通常更关注部署和运行成本,而不是推理完成后实际的性能。正因如此,谷歌的 Ironwood 处理器相比前几代产品实现了两倍的能效提升,使得在推理工作负载中部署谷歌的 TPU 成为更明智的选择。
![]()
人工智能领域的竞争格局正在从“谁能获得更多失败机会”转变为“谁能以更低的延迟、更低的成本和更低的功耗处理更多查询”,这为英伟达开辟了新的竞争领域,而谷歌正试图抢占先机。更重要的是,Ironwood 据称将由谷歌云独家提供,这可能会造成生态系统锁定——这对谷歌长期以来在人工智能领域的统治地位来说可能是致命一击。毫无疑问,谷歌的 TPU 每一代产品都展现出了强大的竞争力,这应该引起英伟达阵营的警觉。
当然,NVIDIA并没有对推理技术的兴起保持沉默,该公司计划通过Rubin CPX,结合Rubin的机架式解决方案,打造一个“最佳切入点”。但随着时间的推移,很明显,谷歌正在将自己定位为NVIDIA的“真正竞争对手”,而英特尔和AMD目前还落后于它。
哦,对了,以下是 Jensen 过去在 BG2 播客节目中对谷歌 TPU 的评价。他当然知道谷歌的定制芯片具有很强的竞争力:
“说到这里……最大的争论之一……就是GPU与ASIC、谷歌的TPU、亚马逊的Trainium之间的选择。谷歌……他们在一切开始之前就推出了TPU1。……这对ASIC的开发者来说是一个挑战。TPU目前使用的是TPU 7。是的。没错。这对他们来说也是个挑战。没错。所以他们所做的工作非常困难。”
https://wccftech.com/hot-take-the-true-ai-chip-challenge-for-nvidia-isnt-from-amd-or-intel-its-googles-tpus-heating-up-the-race/
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4222期内容,欢迎关注。
加星标⭐️第一时间看推送,小号防走丢
求推荐
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.