网易首页 > 网易号 > 正文 申请入驻

谷歌Ironwood TPU对英伟达构成超预期威胁

0
分享至


谷歌的Ironwood TPU代表着比英伟达愿意承认的更大威胁。通过其TPU,谷歌一次次证明了重要的不是加速器的规模大小,而是在生产环境中扩展它们的效率。

随着最新一代Ironwood加速器预计在未来几周内全面上市,这家搜索巨头不仅在规模上占据优势,还拥有一个张量处理单元(TPU),其性能足以与英伟达的Blackwell巨兽一争高下。

谷歌的TPU v7加速器首次于4月发布,尽管当时与El Capitan超级计算机的比较显得有些夸张——Ironwood TPU Pod并非比能源部最强大的设备快24倍——但这代表了相比前几代产品的重大性能飞跃。

从历史上看,谷歌的TPU在原始FLOPS、内存容量和带宽方面一直不及英伟达以及近期AMD的同期GPU,但通过简单地增加更多设备来弥补这一差距。

谷歌一直以pods形式提供其TPU——包含数百甚至数千个芯片的大规模扩展计算域。如果需要额外的计算能力,用户可以扩展到多个pods。

通过TPU v7,谷歌的加速器在标准化相同精度的浮点性能时,表现已接近英伟达Blackwell GPU的水平。

每个Ironwood TPU拥有4.6 petaFLOPS的密集FP8性能,略高于英伟达B200的4.5 petaFLOPS,仅略低于GPU巨头更强大且更耗电的GB200和GB300加速器的5 petaFLOPS。

支撑这种计算能力的是192 GB的HBM3e内存,提供7.4 TB/s的带宽,这再次使其与英伟达B200的192GB HBM和8TB/s内存带宽处于同一水平。

在芯片间通信方面,每个TPU配备四个ICI链路,提供9.6 Tbps的聚合双向带宽,相比之下B200和B300为14.4 Tbps(1.8 TB/s)。

简而言之,Ironwood是谷歌迄今最强大的TPU,性能是TPU v5p的10倍,是去年发布的TPU v6e "Trillium"加速器的4倍,大致匹配英伟达和AMD最新芯片的性能。

性能与规模的结合

但如前所述,谷歌的真正诀窍在于将TPU扩展到真正巨大的计算域的能力。英伟达的NVL72机架系统使用其专有的NVLink互连技术,将72个最新的Blackwell加速器连接成单一计算域。AMD明年将通过其Helios机架和MI450系列做类似的事情。

相比之下,Ironwood显得庞大,谷歌提供的芯片pods低端为256个,高端可达9,216个。如果这还不够,资金充足的用户可以扩展到额外的POD。早在4月,谷歌告诉我们,其Jupiter数据中心网络技术理论上可以支持多达43个TPU v7 pods的规模计算集群——大约400,000个加速器。尽管如此,虽然技术上可以支持,但目前尚不清楚谷歌TPU v7集群在实践中会有多大。

需要明确的是,包含数十万英伟达GPU的计算集群确实存在,实际上已经变得司空见惯。不同之处在于,直到Blackwell一代之前,这些集群都是使用八路GPU盒子构建的大规模扩展域。英伟达的NVL72将计算单元增加了九倍,但仍远不及谷歌的TPU POD。

谷歌的扩展计算结构方法与英伟达有很大不同。GPU巨头为其机架级平台选择了大型、相对平坦的交换拓扑结构,而谷歌采用3D环面拓扑,其中每个芯片以三维网格方式连接到其他芯片。

这种拓扑消除了对高性能数据包交换机的需求,这些交换机既昂贵又耗电,在重负载下还可能引入不必要的延迟。

虽然环面可以消除交换延迟,但网格拓扑意味着任何一个芯片与另一个芯片通信可能需要更多跳数。随着环面增长,芯片间延迟的可能性也会增加。通过使用交换机,英伟达和AMD能够确保其GPU与下一个芯片之间最多只有两跳距离。

据我们了解,哪种方法更好取决于工作负载。某些工作负载可能受益于谷歌TPU pods中使用的2D和3D环面等大型多跳拓扑,而其他工作负载可能在英伟达和AMD机架设计提供的较小交换计算域上表现更好。

因此,谷歌采用了不同类型的交换技术,允许其将TPU pods切分成各种形状和大小,以更好地适应自身内部和客户工作负载。

谷歌使用光路交换机(OCS)而非传统的数据包交换机。这更类似于20世纪的电话交换台。OCS设备使用各种方法(MEMS器件是其中之一)将一个TPU连接到另一个TPU。由于这种连接通常通过连接一个端口到另一个端口的物理过程实现,因此几乎不会引入延迟。

作为额外好处,OCS还有助于容错,如果TPU出现故障,OCS设备可以将其从网格中移除并用正常工作的部件替换。

竞争中的获胜

谷歌自2021年TPU v4首次亮相以来,一直在其TPU pods中使用2D和3D环面结合OCS设备。谷歌在生产环境中操作大规模计算结构也并不陌生。

其TPU v4支持多达4096个芯片的POD,而TPU v5p将这一数字翻了一倍多,达到8,960个。因此,Ironwood跳跃到9,216个TPU POD对谷歌来说应该不是什么难事。

这些大规模计算域的可用性确实吸引了主要模型构建者的注意,包括那些与谷歌Gemini模型直接竞争的公司。Anthropic是谷歌最大的客户之一,宣布计划利用多达一百万个TPU来训练和服务其下一代Claude模型。

Anthropic对谷歌TPU技术的采用并不令人惊讶,考虑到这家模型开发商还在Project Rainier项目下部署工作负载到数十万个亚马逊Trainium 2加速器上,这些加速器在其计算结构中也利用了2D和3D环面网格拓扑。

虽然英伟达首席执行官黄仁勋可能会淡化AI专用芯片对其GPU帝国的威胁,但很难忽视的是,来自谷歌、亚马逊等公司的芯片在硬件能力和网络可扩展性方面正在迅速追赶,软件往往最终成为决定性因素。

也许这就是为什么分析师们一个季度接一个季度地不断提出这个问题的原因。

Q&A

Q1:Ironwood TPU相比英伟达GPU有什么优势?

A:Ironwood TPU的最大优势在于规模扩展能力。单个TPU pod可包含256到9,216个芯片,而英伟达NVL72系统只能连接72个加速器。在性能方面,Ironwood TPU的4.6 petaFLOPS FP8性能也与英伟达B200的4.5 petaFLOPS相当。

Q2:谷歌TPU采用什么样的网络架构?

A:谷歌TPU采用3D环面拓扑结构,每个芯片以三维网格方式连接,并使用光路交换机(OCS)技术。这种架构消除了对昂贵、耗电的高性能数据包交换机的需求,同时提供更好的容错能力。

Q3:有哪些公司在使用谷歌TPU?

A:Anthropic是谷歌TPU的重要客户,宣布计划使用多达一百万个TPU来训练和服务其下一代Claude模型。许多大语言模型构建者都被这些大规模计算域的可用性所吸引,包括一些与谷歌Gemini模型直接竞争的公司。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
解放台湾,说白了就是要拿到4样东西,其余一概不动留给台湾人

解放台湾,说白了就是要拿到4样东西,其余一概不动留给台湾人

云舟史策
2025-10-28 07:46:55
采购吃回扣是怎样暴露的?看完惊呆,原来自己穷是因为胆太小啊!

采购吃回扣是怎样暴露的?看完惊呆,原来自己穷是因为胆太小啊!

夜深爱杂谈
2025-11-08 20:27:12
华人借证开店要小心啦! 意大利严查已有两家店铺被关闭

华人借证开店要小心啦! 意大利严查已有两家店铺被关闭

椰青美食分享
2025-11-10 02:33:02
1983年一老人微服私访被打,黑老大:我就是法!公安局长连夜跳楼

1983年一老人微服私访被打,黑老大:我就是法!公安局长连夜跳楼

阿胡
2024-02-01 13:20:35
5次射门+造6次机会,阿尔瓦雷斯当选马竞vs莱万特全场最佳

5次射门+造6次机会,阿尔瓦雷斯当选马竞vs莱万特全场最佳

懂球帝
2025-11-09 03:50:06
格力电器的前董事长,绝想不到格力在董明珠管理下会成现在这样了

格力电器的前董事长,绝想不到格力在董明珠管理下会成现在这样了

股灾亲历者
2025-11-09 20:39:35
韩国停用汉字50年,从硬气断根到跪求恢复,追悔莫及想回头

韩国停用汉字50年,从硬气断根到跪求恢复,追悔莫及想回头

华山穹剑
2025-11-09 20:45:22
比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

来科点谱
2025-10-24 09:25:32
汪峰万万没想到!婚姻里一向不吃亏的自己,竟然拿捏不住章子怡了

汪峰万万没想到!婚姻里一向不吃亏的自己,竟然拿捏不住章子怡了

小娱乐悠悠
2025-11-06 09:53:48
泽连斯基:波克罗夫斯克城内有314名俄军士兵

泽连斯基:波克罗夫斯克城内有314名俄军士兵

山河路口
2025-11-08 13:01:04
武松明明爱上了玉兰,为何又要杀了她?只有潘金莲把他彻底看透

武松明明爱上了玉兰,为何又要杀了她?只有潘金莲把他彻底看透

耳东文史
2025-11-10 00:03:27
根据邵佳一的技战术打法和用人标准,国足新首发11人预测如下

根据邵佳一的技战术打法和用人标准,国足新首发11人预测如下

男足的小球童
2025-11-09 10:13:57
半挂卡车上高速后7天没下,警方察觉不对沿途搜索,打开车门后吐了

半挂卡车上高速后7天没下,警方察觉不对沿途搜索,打开车门后吐了

罪案洞察者
2025-10-29 10:41:32
上海宝妈赢麻了!晒出“天花板”级生育津贴,高达216701.80元…

上海宝妈赢麻了!晒出“天花板”级生育津贴,高达216701.80元…

火山诗话
2025-11-08 14:59:11
突然大反转!深夜利好!A股爆了!

突然大反转!深夜利好!A股爆了!

龙行天下虎
2025-11-09 23:40:37
今年流行的驼色大衣穿搭,教你提升时尚感!

今年流行的驼色大衣穿搭,教你提升时尚感!

小巍解说
2025-11-09 23:39:24
两性关系:为什么73岁以后,女人比男人更希望这些,你真的懂了吗

两性关系:为什么73岁以后,女人比男人更希望这些,你真的懂了吗

荷兰豆爱健康
2025-11-10 02:29:52
创业只用30万,广东90后硬刚大疆,干出1200亿独角兽

创业只用30万,广东90后硬刚大疆,干出1200亿独角兽

毒sir财经
2025-11-08 23:23:36
2016年他们租养鸡场盗墓,2300万卖给香港人,望风的都分了70万

2016年他们租养鸡场盗墓,2300万卖给香港人,望风的都分了70万

收藏大视界
2025-11-03 20:44:38
周末,突发大利好!!!

周末,突发大利好!!!

风风顺
2025-11-09 21:29:21
2025-11-10 03:55:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
14612文章数 49674关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

25岁女孩海岛求生赛吃老鼠蜈蚣 35天暴瘦28斤

头条要闻

25岁女孩海岛求生赛吃老鼠蜈蚣 35天暴瘦28斤

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

手机
教育
游戏
旅游
时尚

手机要闻

愈演愈烈!iPhone半夜“偷拨号”持续发酵,疑似iOS26的锅?

教育要闻

收藏!2026艺术类文化课录取分数线要求

《暗黑四》又在藏什么?官方暗示TGA有新内容!

旅游要闻

上海博物馆东馆:古今撞个满怀,逛一次就难忘

伊姐周六热推:电视剧《四喜》;电视剧《唐朝诡事录之长安》......

无障碍浏览 进入关怀版