网易首页 > 网易号 > 正文 申请入驻

不再一颗AI芯片通吃?谷歌拆分模型训练和推理专用芯片

0
分享至

4月22日,谷歌发布第八代专用AI芯片TPU(张量处理器)。和此前TPU作为单一产品不同,第八代TPU首次拆分为两款:包含用于模型训练的TPU 8t,以及为模型推理优化的TPU 8i。

据谷歌介绍,TPU 8t提供更高的计算吞吐量和更强的可扩展带宽,擅长处理大规模、计算密集型的训练工作负载,旨在将前沿模型的开发周期从数月缩短至数周,其性价比上一代产品提高2.7倍。

而TPU 8i专为对延迟高度敏感的模型推理工作负载设计,将288 GB的HBM(高带宽内存)与384 MB的静态随机存储器(SRAM)结合,其内存带宽达到TPU 8t的1.3倍,性价比提升了80%。SRAM是与动态随机存取器(DRAM)相对的两种核心内存类型,前者的延迟极低但造价贵,后者成本更低、容量大但存取速度相对较慢,HBM也基于DRAM堆叠打造。


谷歌TPU 8i芯片。图:谷歌官网

智能体应用的爆发,是谷歌推动训练推理芯片分离的重要背景。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在一篇博客中解释,TPU 8i针对推理进行了优化,所搭载的静态随机存储器(SRAM)容量增加了3倍,从而提供了同时运行数百万个智能体所需的巨大吞吐量和低延迟。

谷歌推出专用推理芯片,也被外界视为对英伟达的正面挑战。在今年3月的GTC大会上,英伟达发布用于推理的Groq 3 LPX机架,可容纳256颗Groq 3 LPU芯片,专为满足智能体对低延迟与大量上下文的需求而设计。每颗LPU芯片提供500 MB的SRAM。

英伟达模型推理芯片方案有进一步的细分。模型推理分为对计算能力要求高的预填充prefill(处理输入提示)阶段,以及要求快速内存传输的解码decode(生成输出token)阶段。英伟达的方案中,Groq 3 LPU芯片负责解码阶段,而预填充阶段由Vera Rubin GPU承担。

长期以来,AI芯片行业多采取“训推一体”的设计思路,亦即让一款芯片既能用于模型训练又用于推理服务。国内头部GPU芯片公司,如摩尔线程、沐曦股份等,均定位于此路线。但“训推分离”方案正逐渐成为新的发展方向,并催生了一些专门聚焦推理场景的芯片公司。

国产推理AI芯片公司曦望Sunrise的商业产品负责人阎研表示,模型训练和推理在计算精度、内存架构、互联方式等方面存在较大区别,一颗芯片难以兼顾训练效能与推理的经济性。

据曦望Sunrise介绍,公司在2026年1月发布的新一代旗舰产品启望S3推理GPU,搭载LPDDR6内存(第六代低功耗双倍数据速率内存,属于DRAM),而没有沿用高端训练GPU的HBM显存路线。公司方面称,大模型推理的一个核心特征是,在高并发、长上下文的主流云端推理场景中,用于加速推理的KV Cache的显存占比可超过80%,且随并发用户数线性增长。S3采用的LPDDR6方案,在提供足够推理带宽的同时,大幅提高显存容量上限,以匹配推理场景的核心需求。

采写:南都N视频记者 杨柳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
107天黯然下课!6年长约作废,切尔西再坐实“教练坟墓”!

107天黯然下课!6年长约作废,切尔西再坐实“教练坟墓”!

田先生篮球
2026-04-23 09:38:13
震惊!大学教师分享女儿留学与欧洲旅行见闻被举报!网友:活该吧

震惊!大学教师分享女儿留学与欧洲旅行见闻被举报!网友:活该吧

火山詩话
2026-04-24 09:20:07
“欧雅若”当妈了!48岁洪小铃晒一家三口合照,丈夫幽默吐槽,女儿碰鼻萌翻网友

“欧雅若”当妈了!48岁洪小铃晒一家三口合照,丈夫幽默吐槽,女儿碰鼻萌翻网友

手工制作阿歼
2026-04-23 20:31:36
注意!中老年男性有性生活和没性生活,差别居然这么大?

注意!中老年男性有性生活和没性生活,差别居然这么大?

皓皓情感说
2026-04-22 08:20:32
苹果新iPhone机模曝光,有点复古啊!

苹果新iPhone机模曝光,有点复古啊!

科技堡垒
2026-04-24 09:59:37
张雪遗憾落败仅4天,人民日报发文,没有夸赞,却让张雪口碑暴涨

张雪遗憾落败仅4天,人民日报发文,没有夸赞,却让张雪口碑暴涨

老吴教育课堂
2026-04-23 18:58:07
轰23+3绝杀尼克斯!纽约新苦主拿布伦森当提款机,库明加21+4爆发

轰23+3绝杀尼克斯!纽约新苦主拿布伦森当提款机,库明加21+4爆发

你的篮球频道
2026-04-24 09:48:02
【德国杯】斯图加特加时绝杀,拜仁收获最爱决赛对手

【德国杯】斯图加特加时绝杀,拜仁收获最爱决赛对手

体坛周报
2026-04-24 08:45:12
印度创纪录进口250万吨尿素

印度创纪录进口250万吨尿素

财闻
2026-04-23 14:46:11
老外刚造出巴掌帽,义乌当天量产十万单,国内外售价相差整整10倍

老外刚造出巴掌帽,义乌当天量产十万单,国内外售价相差整整10倍

趣味萌宠的日常
2026-04-23 18:31:49
贾国龙再看3家焖面店,有店铺评分3.8分,网友:贾总这是凶多吉少

贾国龙再看3家焖面店,有店铺评分3.8分,网友:贾总这是凶多吉少

番外行
2026-04-24 09:01:19
在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

解读热点事件
2026-02-04 00:05:07
九亿前夫不能生了

九亿前夫不能生了

毒舌扒姨太
2026-04-23 22:33:26
距离谢娜演唱会开唱,还有10余天,我已经笑死在评论区了!

距离谢娜演唱会开唱,还有10余天,我已经笑死在评论区了!

世界圈
2026-04-24 09:14:48
北京男篮官宣解约贝利!29场仅1场20+离开不意外 新外援已就位

北京男篮官宣解约贝利!29场仅1场20+离开不意外 新外援已就位

醉卧浮生
2026-04-23 15:58:51
印度民调:72%印度人认为印军可轻松击败中国

印度民调:72%印度人认为印军可轻松击败中国

每日奇迹
2026-04-22 21:51:39
技高一筹:不是总统,胜似总统

技高一筹:不是总统,胜似总统

寰宇大观察
2026-04-22 18:11:15
全国首例职场性侵精神工伤案明日开庭,崔丽丽:我不再需要那件衣服做我的盔甲!

全国首例职场性侵精神工伤案明日开庭,崔丽丽:我不再需要那件衣服做我的盔甲!

潇湘晨报
2026-04-22 22:31:09
为什么说"飞机最安全",是一个精心设计的统计学陷阱?

为什么说"飞机最安全",是一个精心设计的统计学陷阱?

半解智士
2026-04-22 14:35:15
红绿灯倒计时取消!全国推行新规,以后过路口记住这1句话

红绿灯倒计时取消!全国推行新规,以后过路口记住这1句话

阿振观点
2026-04-22 06:00:49
2026-04-24 10:52:49
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
607962文章数 3588213关注度
往期回顾 全部

科技要闻

凌晨突发!GPT-5.5正式上线:跑分更猛

头条要闻

受AI冲击"霸总"回家种地:比拍戏难 今年基本回不了本

头条要闻

受AI冲击"霸总"回家种地:比拍戏难 今年基本回不了本

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王思聪被绿!恋爱期间女友被金主包养

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

全景iDrive 续航近800km 新款宝马7系/i7亮相

态度原创

健康
数码
本地
手机
公开课

干细胞如何让烧烫伤皮肤"再生"?

数码要闻

曝英特尔下代Z970芯片组将承接当前B860大部分市场定位

本地新闻

SAGA GIRLS 2026女团选秀

手机要闻

苹果更新推出Invites 1.8,支持iMessage直接分享邀请函

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版