网易首页 > 网易号 > 正文 申请入驻

TPU 的成功,是否正在宣告“GPU + CUDA 时代”的终结?

0
分享至

1) 先把两种“范式”讲清楚(用类比)

  • GPU + CUDA像“通用瑞士军刀 + 统一工具箱”:硬件足够通用,软件生态(CUDA)极强,适配面广、迭代快、外部开发者多

  • TPU(ASIC)+ 软件栈(XLA/JAX/Pathways/Runtime)更像“深度定制的工业产线”:从芯片、板卡、互连网络到编译器、并行策略一起设计,目标是把某类工作(大规模训练/推理)做到极致,强调端到端吞吐、能效、可扩展性。TPU 的体系就是典型“芯片+网络+软件协同”的思路:XLA 编译器把计算图切分到多芯片,JAX/Pathways把单个模型铺到成千上万颗 TPU 上跑,并且软硬件一起优化效率。

目前来看:TPU 的成功证明“垂直整合”确实能打穿 GPU 的优势区间,但它更像“分层替代”,而不是“一刀切把 GPU 全部替掉”。

2) 为什么说 TPU 的成功“不是偶然”,它击中了 GPU 的系统瓶颈

对大模型来说,真正决定“交付成本”的往往不是单卡峰值,而是系统级的有效吞吐(goodput)/扩展效率/能耗。TPU v4 的论文直接给了系统级证据:

  • TPU v4 在相近规模系统下,比 Nvidia A100 快 1.2×–1.7×,且功耗更低(用电少 1.3×–1.9×),并且在 Google Cloud 的能效型数据中心里还体现为更低能耗与更低碳排。
    这类“同规模系统、真实工作负载”的对比,比单芯片 spec 更能说明“范式差异”。

更关键的是 TPU v4 不是只改芯片,而是把“规模化训练最痛的地方”——互连和调度——也一起改了:

  • TPU v4 引入 OCS(光电路交换),其思想是:把拓扑做成可重构,让网络能随任务切换,更像“可插拔配线架”。论文描述 OCS 让系统在规模、可用性、利用率、功耗、部署等方面显著受益。

  • TPU v4 还明确对比了 NVLink/NVSwitch:NVSwitch 的电交换更像“固定结构的交换机级联”,而 OCS 是“光纤+镜子”,可以在4096 芯片尺度上做 1:1 的电路级重连,并且带来更高带宽潜力与更低功耗/成本压力。

而在“大模型”训练里,通信很容易变成主瓶颈(尤其是 all-reduce / all-to-all / all-gather)。Google 的材料里也直说:巨型模型通信开销显著,扩展需要一揽子优化,并且要尽可能做计算与通信重叠

这就是 TPU 的“胜点”:它不是只靠算力,而是靠**“系统工程 + 软件栈”**把规模化训练/推理的瓶颈端到端优化掉。

3) 那么:这会不会“系统性替代 GPU + CUDA”? 3.1 会替代的部分:在超大规模、成本敏感的“云侧主战场”,趋势更偏长期结构性

原因很直接:当你的规模上升到“上万/十万颗加速器”时,决定胜负的是集群级扩展。材料里提到 TPU 的网络/系统可以连接到10 万级芯片、~13Pbps 量级的双向带宽(Jupiter fabric)。
并且 TPU 还在往“多切片/多集群近线性扩展”方向推进(Multislice 连接多个 slice,把单任务扩展到成千上万乃至数万颗 TPU)。

这意味着:对超大云厂商(或极少数具备同等级系统工程能力的玩家),“垂直整合”不是阶段性策略,而是一种可持续的成本曲线优势——尤其在推理规模爆发后,能效和利用率会越来越硬核。

3.2 不会完全替代的部分:在通用市场(多样化负载/开发者生态)更像阶段性与长期并存

GPU + CUDA 的强项仍然是:

  • 通用性:科研、图形、仿真、视频、各种不规则算子/新算子快速落地;

  • 生态惯性:大量现成库、工程经验、人才供给。

而 TPU 体系的门槛在于:你需要把芯片 + 网络 + 编译器/并行策略 + 调度系统整套吃下来,才能吃到主要红利(这也是“产线式”方案的特征)。这就是为什么“垂直整合”更容易在大厂内部闭环先跑通。

4) 最终判断:它是“分层替代”,并且在云侧是结构性长期趋势

  • 对超大规模云侧训练/推理主战场:垂直整合 ASIC + 软件栈是更偏“结构性长期趋势”。因为 TPU 展示了在同等规模下“更快+更省电”的系统级优势,并通过 OCS/集群网络/软件栈把扩展做到了 GPU 体系很难用同样方式解决的尺度。

  • 对更广泛的通用计算与多样化 AI 负载:GPU + CUDA 仍将长期共存。GPU 像“通用平台”,TPU 像“专用产线”。未来更可能是:一线云厂商内部用垂直整合吃下成本曲线,而行业外部仍大量使用 GPU(以及把 TPU 当作云上的一种选择)。

5) 给半导体工程师的“看趋势抓手”

如果你要判断这是不是长期趋势,不要只盯 TOPS/TFLOPS,建议盯三件事:

  1. 集群 goodput(有效吞吐):能不能把峰值算力“变现”为训练/推理速度?(大模型通信开销是硬现实)

  2. 网络/拓扑的可塑性:固定拓扑 vs 可重构拓扑(OCS 这类东西的系统价值会越来越大)

  3. 编译器/并行系统能力:XLA/JAX/Pathways 这种软件栈是不是能持续把新模型映射到硬件上并保持高效率?

欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯(加V:tigerchip)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
HBO的史诗级美剧,终于上线了

HBO的史诗级美剧,终于上线了

来看美剧
2026-01-21 18:59:51
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
特朗普:不去G7峰会 因为马克龙干不长了

特朗普:不去G7峰会 因为马克龙干不长了

财联社
2026-01-21 11:40:17
可控核聚变,有明确订单的5家公司!

可控核聚变,有明确订单的5家公司!

Thurman在昆明
2026-01-21 10:36:35
性生活后的“黄金十分钟”,坚持做对这件事,胜过世间万千补药

性生活后的“黄金十分钟”,坚持做对这件事,胜过世间万千补药

精彩分享快乐
2026-01-22 06:00:07
截胡!阿森纳必须赢下 8700 万巨星争夺战,奥恩斯坦实锤有戏!

截胡!阿森纳必须赢下 8700 万巨星争夺战,奥恩斯坦实锤有戏!

澜归序
2026-01-22 05:22:36
陈夏广出任中山市副市长

陈夏广出任中山市副市长

南方都市报
2026-01-21 18:30:09
她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

阿胡
2026-01-21 17:34:15
招行、浦发成功将卫星送上太空!通过遥感技术,银行可远程实现对楼盘贷后风险的实时监测

招行、浦发成功将卫星送上太空!通过遥感技术,银行可远程实现对楼盘贷后风险的实时监测

每日经济新闻
2026-01-21 00:23:14
又菜又爱玩?媒体人痛批广东队:打弱队还行,遇强队必崩

又菜又爱玩?媒体人痛批广东队:打弱队还行,遇强队必崩

体育见习官
2026-01-22 07:35:07
中东变天了!10万大军杀过来了,美军拔腿就跑,丢了好几个基地

中东变天了!10万大军杀过来了,美军拔腿就跑,丢了好几个基地

悦心知足
2026-01-21 18:18:33
加拿大低税进口4.9万辆中国新能源车,配额最多的居然不是比亚迪

加拿大低税进口4.9万辆中国新能源车,配额最多的居然不是比亚迪

蓝色海边
2026-01-21 03:17:15
张碧晨成都演出裤腰滑落,观众拍图上热搜,她改穿连体衣没说话

张碧晨成都演出裤腰滑落,观众拍图上热搜,她改穿连体衣没说话

阿废冷眼观察所
2026-01-21 13:20:58
山东省纪委监委网站通报:2人被查,1人系主动投案

山东省纪委监委网站通报:2人被查,1人系主动投案

齐鲁壹点
2026-01-21 17:13:13
有人问及如何评价周总理,黄永胜回忆:外交上是一把好手,搞内政堪称八级泥瓦

有人问及如何评价周总理,黄永胜回忆:外交上是一把好手,搞内政堪称八级泥瓦

源溯历史
2025-12-22 12:14:13
Baxter:在湖人兜底选中布朗尼这件事上,珍妮认为詹姆斯不够感激

Baxter:在湖人兜底选中布朗尼这件事上,珍妮认为詹姆斯不够感激

移动挡拆
2026-01-22 01:46:30
量子计算机很可能永远不会成功

量子计算机很可能永远不会成功

观察者网
2026-01-21 08:38:06
老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老范谈史
2026-01-05 21:19:06
1.22股市早8点丨风险不得不降低·牛市不得不继续

1.22股市早8点丨风险不得不降低·牛市不得不继续

沙黾农
2026-01-22 06:20:53
王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

做一个合格的吃瓜群众
2026-01-17 16:38:59
2026-01-22 08:27:00
老虎说芯 incentive-icons
老虎说芯
资深半导体工程师的经验分享
693文章数 24关注度
往期回顾 全部

科技要闻

日系彩电时代“彻底落幕”

头条要闻

新房灌装燃气次日爆炸:夫妻重度烧伤 房子被毁成危房

头条要闻

新房灌装燃气次日爆炸:夫妻重度烧伤 房子被毁成危房

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

首位捐款的明星 苗圃现身嫣然医院捐款

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

游戏
艺术
旅游
公开课
军事航空

《灾厄之石》Steam抢先体验版发布 优惠价46元

艺术要闻

黄永玉精品欣赏

旅游要闻

天宫灯会明日启幕

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:对美国的真正威胁是联合国和北约

无障碍浏览 进入关怀版