网易首页 > 网易号 > 正文 申请入驻

告别HBM堆料内卷!谷歌TPU8训推硬件分家,开创AI存储精细化范式

0
分享至


如果说堆叠“大内存”是解决AI推理瓶颈的真理,为什么手握Gemini、年投入超千亿美元的谷歌,却不这么做?

谷歌此前推出的第八代TPU芯片,打破以往单一芯片更新迭代的惯例,首次实现训练、推理双芯拆分,推出专为大规模训练打造的TPU 8t和专为推理与AI智能体优化的TPU 8i,精准匹配不同AI场景的差异化需求。

谷歌为何选择将训练和推理分家?


随着AI大模型从简单的聊天机器人向更复杂的AI智能体、代理式AI演进,其计算需求正在发生根本性的转变,AI工作负载加速分化。

由于模型规模呈指数级增长,过去用同一款芯片兼顾训练和推理两种不同要求的任务所面临的矛盾日益突出。


训练

需要从存储中持续、海量地读取PB级的原始数据集,追求更高带宽和更大吞吐量。


推理

需要为每个请求极快地随机读取细碎的KV Cache碎片,追求更低延迟和更高并发。

训练和推理所追求的最优设计本质是互斥的:优化吞吐量的设计天然增加延迟,而优化延迟的设计则会降低峰值吞吐量。

为此,谷歌选择将TPU 8系列芯片拆分为训练用的TPU 8t和推理用的TPU 8i,各司其职,显著提高效率和收益。

TPU 8t和TPU 8i双芯同源但术业有专攻


TPU 8t和TPU 8i两款芯片均首次搭载自研Axion Arm CPU,采用台积电2nm制程工艺制造和第四代液冷技术,每瓦性能提升至原来的2倍,预计2027年底量产。

TPU 8t专为训练而生,侧重于让超大规模集群的芯片高效地从存储中获取数据。

更快存储访问

引入TPU Direct RDMA和TPU Direct Storage,使TPU内存与网络接口卡之间可传输直接数据,且TPU与高速管理存储之间也可直接访问,不再需要经过CPU;百PB级数据集可直接传输至芯片,存储访问速度较前代快10倍。

更大规模扩展

单个超级节点可集成9600个芯片;单个训练集群可扩展超过百万个TPU芯片;Virgo Network能够在单个网络架构中连接超过13.4万个TPU 8t芯片,提供高达47 PB/s的无阻塞双向带宽,该架构可提供超过1.7K EFlops的性能,并具有近乎线性的扩展性能。

更优性能表现

与前代产品相比,单pod可提供FP4性能提升为原来的3倍至121 EFlops,TPU 8t的芯片间互连带宽翻倍,数据中心网络带宽提升为原来的4倍。

表1 TPU 8t与前代Ironwood对比


数据来源:Google, CFM整理

TPU 8i专为推理设计,侧重于让数据待在离计算核心最近的地方,减少对后端存储的访问。

更大片上缓存

配备384MB的SRAM和288GB的HBM内存,超过前代产品3倍,能将更大的KV Cache完全保留在芯片上,显著减少长上下文解码期间核心的等待时间。

更低延迟

全新的集合通信加速引擎(CAE),将片上集合通信延迟较前代降低5倍;新的Boardfly架构将网络连接直接塞进计算芯片里,减少节点之间的数据搬运减小了网络直径和数据包在穿越整个系统时所需经过的跳数,通信密集型工作负载的延迟最高降低50%。

更强带宽和计算性能

对于现代混合专家(MoE)模型,互连带宽翻倍至19.2Tb/s;单个Pod可扩展至1152块芯片,提供11.6EFlops FP8计算性能,较前代产品显著提升。

表2 TPU 8i与前代Ironwood对比


数据来源:Google, CFM整理

第八代TPU两款芯片在设计上并非单纯地堆砌参数,而是以硬件规格匹配任务需求,内存容量均较前代产品显著提高。TPU 8t是为训练设计的“超级仓库”,汇聚9600个芯片,总内存高达2PB。而TPU 8i是为推理设计的“高速缓存”,总内存331.8TB虽低于TPU 8t,但单个芯片配备了更大的288GB内存和极高的384MB片上缓存,TPU 8i 8601GB/s HBM带宽较TPU 8t的6528GB/s高出约32%。

做最合适的芯片,而不是最强的芯片


谷歌新的决胜点主要在于其系统架构的创新和系统级成本效率的提高,而非像英伟达一样追求极致的单卡性能。英伟达Rubin GPU较第八代TPU拥有更高的带宽、更多的FP4能力以及每个GPU更多的NVLink功能,单卡性能显著领先。Groq 3 LPU推理芯片以500MB SRAM提供150TB/s SRAM带宽和2.5 TB/s的扩展带宽,虽然其片上缓存和带宽高于TPU 8i,但LPU需要与GPU配合工作,且成本显著高于TPU 8i。

然而,谷歌一方面将训练与推理芯片完全分开设计,各自极致优化,在推理规模持续扩大的背景下,定制ASIC的经济模型优于通用GPU;另一方面,凭借其自研架构,单个训练集群的规模可扩展至9600颗芯片(远高于NVL72机架的72颗),并通过优化系统软件栈,使得集群在庞大的规模下仍能保持极高的有效计算时间占比。官网数据显示,TPU 8t和TPU 8i的性价比分别较Ironwood TPU提高了2.7倍和80%。

表3 TPU 8t、TPU 8i和NVIDIA Rubin GPU的对比


数据来源:Google, NVIDIA, CFM整理

英伟达是“用顶级硬件适配所有场景”,依靠高端存储硬件优势兜底各类AI数据读写需求。

谷歌则是“按场景定制化适配需求”,放弃通用存储适配,针对训练和推理两类核心场景创新系统架构,在适配AI智能体时代海量、高频、差异化的存储需求的同时,平衡成本与功耗。

谷歌本次的训推分家,终结了单一硬件适配全场景存储需求的粗放模式,推动AI存储告别通用适配时代,迈入场景定制细分的精细化新阶段。

AI新时代,芯片的最优解不是最强的那颗,而是最合适的那颗;存储的最优解不是参数极致堆叠,而是场景精准适配。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
31条中日航线5月取消全部航班

31条中日航线5月取消全部航班

财联社
2026-06-03 15:56:05
伊朗放宽谈判口径,俄罗斯央行崩溃示警

伊朗放宽谈判口径,俄罗斯央行崩溃示警

西楼饮月
2026-06-03 18:34:18
追梦:库里选择中国品牌是为了中国市场,也为了退役后的生活

追梦:库里选择中国品牌是为了中国市场,也为了退役后的生活

懂球帝
2026-06-04 09:52:13
赵冰:在俄罗斯最西端感受对华合作热度   走笔天下

赵冰:在俄罗斯最西端感受对华合作热度   走笔天下

参考消息
2026-06-04 14:07:21
为什么说闲鱼是中国最大的黑市?网友:我直接给跪了!

为什么说闲鱼是中国最大的黑市?网友:我直接给跪了!

另子维爱读史
2026-06-02 10:51:07
谈崩了!林良铭要顶薪大合同 连沪粤鄂滇铁人哄抢 国安勿人财两空

谈崩了!林良铭要顶薪大合同 连沪粤鄂滇铁人哄抢 国安勿人财两空

刀锋体育
2026-06-04 08:36:31
一个非常无奈的现象:城市八九十岁老人活着,基本是在“养”保姆

一个非常无奈的现象:城市八九十岁老人活着,基本是在“养”保姆

小陆搞笑日常
2026-06-04 12:21:32
北京街头三大怪:夜行墨镜、遮秃帽、蒙面侠,没捂白却披上战袍

北京街头三大怪:夜行墨镜、遮秃帽、蒙面侠,没捂白却披上战袍

荷兰豆爱健康
2026-06-04 12:29:57
三枚导弹砸醒科威特!伊朗撂下史上最狠一句话,美军连夜删帖?

三枚导弹砸醒科威特!伊朗撂下史上最狠一句话,美军连夜删帖?

菁菁子衿
2026-06-03 12:55:47
别羡慕网红赚得多!董赤赤的下场,给所有追名逐利的人敲了警钟

别羡慕网红赚得多!董赤赤的下场,给所有追名逐利的人敲了警钟

青橘罐头
2026-06-02 23:02:34
0分+投篮三不沾!混血后卫国家队首秀一团糟 还吹比八村塁强吗

0分+投篮三不沾!混血后卫国家队首秀一团糟 还吹比八村塁强吗

大嘴爵爷侃球
2026-06-04 10:16:30
高考遇上预产期,19岁高四女生进退两难!

高考遇上预产期,19岁高四女生进退两难!

岁月有情1314
2026-06-04 12:06:20
人不会无缘无故患带状疱疹!研究发现:得带状疱疹,多半有4共性

人不会无缘无故患带状疱疹!研究发现:得带状疱疹,多半有4共性

鬼菜生活
2026-06-02 18:39:56
一名强奸犯即被枪决他大声喊话:我知道20年前6名红军惨死的真相

一名强奸犯即被枪决他大声喊话:我知道20年前6名红军惨死的真相

磊子讲史
2026-06-01 19:20:49
北京楼市开始离谱了!朝阳区北四环板块房价从14.3万变成7.5万

北京楼市开始离谱了!朝阳区北四环板块房价从14.3万变成7.5万

混沌录
2026-06-03 23:37:06
穆里尼奥身着皇马球衣确认:若老佛爷当选,将成为皇马新任主帅

穆里尼奥身着皇马球衣确认:若老佛爷当选,将成为皇马新任主帅

懂球帝
2026-06-04 04:34:19
沪电股份股价创历史新高

沪电股份股价创历史新高

证券时报
2026-06-04 14:46:02
不黑不吹,小米汽车2026年55万的销量任务,只怕完不成了

不黑不吹,小米汽车2026年55万的销量任务,只怕完不成了

互联网.乱侃秀
2026-06-04 10:00:08
田震坦言与那英不熟,24年后两人现状大不同

田震坦言与那英不熟,24年后两人现状大不同

孤芳自赏的小李
2026-06-04 14:16:59
KFC儿童门诊突然爆火,网友:还是西药见效快

KFC儿童门诊突然爆火,网友:还是西药见效快

4A广告网
2026-06-02 17:41:40
2026-06-04 17:35:00
闪存市场 incentive-icons
闪存市场
闪存市场
2817文章数 4350关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

业主不满物业收每天4元停车费 争吵被骂"住不起就滚"

头条要闻

业主不满物业收每天4元停车费 争吵被骂"住不起就滚"

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

教育
房产
旅游
健康
公开课

教育要闻

为什么说九年义务教育 放在世界范围里就是降维打击?

房产要闻

震撼!海口顶豪“素颜出境”,直接顶穿品质天花板!

旅游要闻

再添婚恋文旅新地标!昆山首个园林相亲角启用

违规干细胞抗衰美容,为何肆无忌惮

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版