网易首页 > 网易号 > 正文 申请入驻

谷歌押注工作负载专用TPU,同步发布8t与8i两款芯片

0
分享至


谷歌于本周二正式发布了两款各有侧重的第八代TPU芯片——一款专为训练设计,另一款专为推理优化,重新采用分体式芯片策略,以应对云计算厂商在AI硬件领域对性能与成本的差异化需求。

谷歌此前已有过TPU分体设计的尝试,第五代的V5p与V5e芯片便是典型案例,但此后的Trillium和Ironwood等系列基本回归了单一设计路线。

HFS Research分析师Phil Fersht认为,此次两款新芯片的分体设计,是谷歌将硬件与企业AI生命周期不同阶段更紧密对齐的战略举措,有望在生产环境中提升资源利用率和成本效益。

"训练与推理在经济模型、内存行为、网络需求和采购模式上的差异日益显著。客户越来越希望在模型生命周期的每个阶段都能获得最合适的性价比,而不是一款通用加速器打天下。"Fersht表示。

Forrester首席分析师Charlie Dai指出,从实际应用角度来看,能够在两款TPU之间自由选择,可以帮助企业避免将训练级别的高成本芯片用于推理密集型任务。

TrendForce分析师Fion Chiu也持相同观点,她认为成本更具优势的8i芯片将帮助企业以更低的价格部署大型模型。

Dai还补充道,对于OpenAI和Anthropic等模型提供商而言,这种芯片选择机制能够更清晰地区分训练集群与服务集群,同时保留通用工具和代码路径的复用能力,从而降低总体成本、提升集群效率,并简化模型生命周期的过渡流程。

HyperFRAME Research分析师Stephen Sopko指出,谷歌并非唯一走分体设计路线的芯片厂商,AWS同样拥有Trainium和Inferentia两款面向不同AI工作负载的独立芯片。

两款芯片的技术优势

尽管分体设计折射出算力经济学的变迁,但这两款芯片相较于前代Ironwood在技术层面也各有突破。

谷歌表示,专注训练的TPU 8t相较Ironwood,每个Pod的计算性能提升近3倍,支持更大规模的超级Pod,芯片间带宽也翻了一番。

具体而言,Ironwood在9216芯片Pod规模下可提供42.5艾次浮点运算,而TPU 8t在9600芯片规模下可扩展至121艾次浮点运算;双向扩展带宽提升至每芯片19.2 Tbps,是原来的两倍;跨机架扩展网络带宽也提升至400 Gbps,增长四倍。

Omdia首席分析师Alexander Harrowell表示,性能与机架间带宽的大幅提升,将支持比Ironwood更大规模模型的训练,并缩短训练时长。

相比之下,专注推理的TPU 8i在设计理念上与Ironwood有更大的转变——内存容量至少是后者的三倍。

TPU 8i配备了288GB高带宽内存与384MB片上SRAM。Harrowell指出,这使TPU的内存规模向领先GPU靠拢。他还表示,更大的片上SRAM有助于将活跃模型数据保持在更靠近处理器的位置,从而降低推理延迟,在模型规模和复杂度持续增长的背景下尤为重要。

Sopko认为,8i的架构调整反映出业界正逐步转向混合专家模型(MoE)和长上下文模型,这类模型未来还将继续扩大规模。

"万亿参数模型和百万Token上下文窗口在推理服务期间需要常驻内存,这就要求更大的内存容量和更大规模的Pod。"Sopko说道。

与Ironwood的256芯片Pod规模和每Pod 1.2艾次浮点运算相比,TPU 8i的Pod规模可扩展至1152芯片,每Pod算力达11.6艾次浮点运算。

此外,谷歌表示,两款新芯片相较Ironwood的系统效率也有所提升,每瓦性能提升2倍,并与谷歌基于Arm架构的Axion CPU主机实现了更紧密的集成。

谷歌还补充称,TPU 8t和8i将于今年晚些时候作为谷歌AI超级计算机平台的组成部分正式对外开放。

Q&A

Q1:谷歌TPU 8t和8i分别适合哪类AI任务?

A:TPU 8t专为模型训练设计,相较前代Ironwood提供近3倍计算性能和更高的芯片间带宽,适合大规模模型训练任务;TPU 8i则专为推理优化,配备288GB高带宽内存和更大片上SRAM,适合在生产环境中高效运行大型模型,两者分工明确,覆盖AI生命周期的不同阶段。

Q2:谷歌为什么要重新采用分体式TPU策略?

A:训练和推理在经济模型、内存需求、网络带宽和采购模式上差异越来越大,单一芯片难以兼顾两者的性价比。分体设计让企业可以按需选择,避免将高成本的训练级芯片用于推理任务,从而降低整体运营成本,提升资源利用率。

Q3:TPU 8i在内存方面有哪些具体提升?

A:TPU 8i搭载288GB高带宽内存和384MB片上SRAM,内存容量是Ironwood的至少三倍,整体规模已接近主流高端GPU。更大的片上SRAM可以让活跃模型数据更靠近处理器,有效降低推理延迟,对混合专家模型(MoE)和长上下文模型的服务尤为重要。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1981年李鹏任电力部长遭联名反对,陈云靠三页通话记录强势破局,这手段有多绝?

1981年李鹏任电力部长遭联名反对,陈云靠三页通话记录强势破局,这手段有多绝?

史海孤雁
2026-04-23 23:26:06
字母哥:梅罗、乔詹都是GOAT;C罗更自律所以我更倾向他

字母哥:梅罗、乔詹都是GOAT;C罗更自律所以我更倾向他

懂球帝
2026-04-23 12:48:07
热搜压不住了!知名女星曝陈小春“猛料”,应采儿被“打脸”

热搜压不住了!知名女星曝陈小春“猛料”,应采儿被“打脸”

不似少年游
2026-04-23 14:40:36
围标串标遭严惩!云南一企业被全军暂停军采资格

围标串标遭严惩!云南一企业被全军暂停军采资格

阿芒娱乐说
2026-04-23 21:50:28
俄共主席威胁1917会再次发生!钢铁巨头濒临亏损,替代产业失败

俄共主席威胁1917会再次发生!钢铁巨头濒临亏损,替代产业失败

鹰眼Defence
2026-04-23 18:38:19
杨钰莹28年后坦白:若当年接受毛宁,现在已是母亲

杨钰莹28年后坦白:若当年接受毛宁,现在已是母亲

解锁世界风云
2026-04-23 13:48:39
中国需做最坏打算:俄罗斯解体后617万土地绝不能失守

中国需做最坏打算:俄罗斯解体后617万土地绝不能失守

王藁侃世界
2026-04-23 07:05:34
闹大了!女生发帖高呼“卫生巾作为必需品须免费”,评论区一边倒

闹大了!女生发帖高呼“卫生巾作为必需品须免费”,评论区一边倒

火山詩话
2026-04-22 15:38:21
ASML禁售DUV光刻机,是针对中国?错,目标是印度、越南、土耳其

ASML禁售DUV光刻机,是针对中国?错,目标是印度、越南、土耳其

南生今世说
2026-04-23 09:32:04
高德地图在台湾爆火

高德地图在台湾爆火

第一财经资讯
2026-04-23 23:28:57
功莫大于斩首,计莫毒于绝粮——特朗普双向封锁,欲困死伊朗?

功莫大于斩首,计莫毒于绝粮——特朗普双向封锁,欲困死伊朗?

高博新视野
2026-04-21 08:00:23
郭冬临现状:住北京老房子,身形消瘦、脸颊凹陷,59岁无儿无女

郭冬临现状:住北京老房子,身形消瘦、脸颊凹陷,59岁无儿无女

娱说瑜悦
2026-04-23 16:04:39
1952年贺龙天天纠缠彭真,彭真最后求饶:贺老总你别逼我了

1952年贺龙天天纠缠彭真,彭真最后求饶:贺老总你别逼我了

硕说
2026-04-24 09:35:21
驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

睡前讲故事
2026-02-03 20:55:43
国家医保局检查组已全面进驻被曝光串换药品的药店

国家医保局检查组已全面进驻被曝光串换药品的药店

新京报
2026-04-24 10:55:05
赖清德“外交”闹剧遭拒自取其辱

赖清德“外交”闹剧遭拒自取其辱

烽火瞭望者
2026-04-23 20:07:39
97年钱瑗病逝,8天后昏迷中的钱钟书突然喊道:阿圆,转去自己家

97年钱瑗病逝,8天后昏迷中的钱钟书突然喊道:阿圆,转去自己家

大运河时空
2026-04-23 19:20:03
火湖官宣G3伤情:杜兰特左踝扭伤雪上加霜 里夫斯或复出驰援老詹

火湖官宣G3伤情:杜兰特左踝扭伤雪上加霜 里夫斯或复出驰援老詹

追球者
2026-04-24 06:39:29
女排二传说话口无遮拦,内涵朱婷,还给王媛媛挖坑

女排二传说话口无遮拦,内涵朱婷,还给王媛媛挖坑

体育快递小哥哥
2026-04-23 21:45:02
三将赛季报销,皇马还剩6轮落后巴萨9分,第35轮迎国家德比

三将赛季报销,皇马还剩6轮落后巴萨9分,第35轮迎国家德比

懂球帝
2026-04-23 19:49:28
2026-04-24 11:36:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17960文章数 49700关注度
往期回顾 全部

科技要闻

凌晨突发!GPT-5.5正式上线:跑分更猛

头条要闻

受AI冲击"霸总"回家种地:比拍戏难 今年基本回不了本

头条要闻

受AI冲击"霸总"回家种地:比拍戏难 今年基本回不了本

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王思聪被绿!恋爱期间女友被金主包养

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

全景iDrive 续航近800km 新款宝马7系/i7亮相

态度原创

健康
房产
亲子
教育
旅游

干细胞如何让烧烫伤皮肤"再生"?

房产要闻

三亚安居房,突然官宣!

亲子要闻

语出惊人的萌娃

教育要闻

相似无刻度直尺作图,一个视频学会!

旅游要闻

在拉萨,除了布达拉,你还想看到什么?|锋评

无障碍浏览 进入关怀版