网易首页 > 网易号 > 正文 申请入驻

ChatGPT3周年,TPU改变了AI竞争,正在从模型转向基础设施

0
分享至

最近谷歌用其TPU基础设施,训练出了最强大模型Gemini 3,在ChatGPT横空出世3周年之际,这一事件。它意味着,用英伟达GPU在微软Azure上训练出来的GPT系列最前沿大模型的范式,正在被打破;而且,大模型、云和AI芯片,是在谷歌内部浑然一体的。

这一事件,足以影响对整个AI竞争格局的判断。我们知道,三年前ChatGPT发布之时,第一个最大的受益者是微软,它的股价暴涨,市值达到全球第一。接着是英伟达,它凭借GPU和CUDA税,股价一路上扬,成为5万亿美元的公司。第三家就是OpenAI,它的估值也超过了5000亿美元,成为史上最有价值的非上市企业。

但这一切,正在被TPU改变。当谷歌上扬时,压力传递到英伟达、微软、以及大量接受英伟达投资并采购GPU的其他企业,如甲骨文和其他新云企业。对OpenAI的直接影响,是市场上普遍开始更看好TPU+Gemini在性能和成本上的长期竞争优势 ,要胜过OpenAI。而OpenAI在其,在Gemini的压力之下,其商业可行性和可持续性,也受到市场的质疑。

不是AI恐惧,而是OpenAI恐惧


难怪谷歌垂直整合的AI,其长期价值受到了,最近大举入股,是其一生之中除苹果之外,投资的第二家科技企业,也是唯一一家AI企业。

ChatGPT3周年,更值得看的是谷歌过去的3年。它经历了2023年的危机,即GPT-4超过了谷歌在AI领域的优势,微软等企业将用AI搜索颠覆谷歌的垄断地位,以及Llama开放权重模型推出时,谷歌内部惊呼“没有护城河”。到了2024年,谷歌开始真正反击,除了推出原生多模态的Gemini大模型之外,它的基础设施也引起了我们的关注。

Gemini与TPU的协同,正是谷歌AI王者归来的核心。可以说,真正奠定谷歌战略反攻的,一个是合并DeepMind和谷歌大脑,由哈萨比斯担任谷歌DeepMind CEO,废除Bard等模型,集全谷歌AI人才死磕Gemini;第二个就是TPU的迭代升级的强大支撑。它们的对手,相当于OpenAI+英伟达+微软。

2023年底,谷歌发布Gemini,同步发布了TPUv5p,此时已经可以建立起几万张卡的推理集群,但训练主还是依靠英伟达的H100/200。

Gemini 发布的喧嚣中,值得注意的是谷歌云发布了TPUv5p,训练大模型每刀效率提升2倍以上。不管Gemini是否碾压了GPT-4,但有一点是肯定的,谷歌拥有比微软更强大的大模型训练和推理平台。 而且谷歌将使用TPU进行推理,因此不必像OpenAI和微软那样支付给NVIDIA 70%的利润(直到他们的芯片准备好并投入生产)。 ——

2024年底,谷歌发布Gemini 2,正式宣布完成对OpenAI的追赶。此时,谷歌除了宣布竞争的重心,将从深度学习进入到发挥其强化学习优势的智能体之外,代号为Trillium的第六代TPU,是真正的幕后功臣。

当时谷歌专为Gemini 2 推出了Trillium即TPUv6,并且建立了10万张卡的算力集群,彻底实现了100%的训练和推理自由。

2025年起,更多大厂将用自家研发的下一代定制芯片,构建10万卡级别的算力集群,100%地用于自家下一代大模型的的训练和推理,追求高于英伟达GPU的性价比。显然,谷歌的TPU正在从定制向通用加速芯片转变。英伟达,要瑟瑟发抖了吗? ——

2025年4月,在谷歌云Next '25峰会上,谷歌发布了搭建下一代高能效算力基础设施的Ironwood,提供高性价比推理的新一代主力模型Gemini 2.5 Flash,以及实现爆发中的智能体互操作的新标准Agent2Agent。谷歌在上一代Trillium解决训练问题的基础之上,随着今年应用token数消耗量的爆发,开始重点解决推理成本和能源效率问题。

而且TPUv7已经开始全面对标英伟达最新一代芯片B200,英伟达必须要迅速推出下一代Rubin,才能保持黄仁勋所说的“领先一代”的优势。

推理正朝着统一多模态与思维链的方向发展,需要完成越来越多能源与数据密集任务。除了单卡性能要足够强大外,芯片能效与内存也是升级重要方向。Ironwood足以与去年的B200相媲美。FP8精度下峰值算力,单个Ironwood芯片达到4,614万亿次浮点运算,与B200相当,称得上当前最强水平。它的单芯片的HBM内存容量达到了192GB,是Trillium的6倍;HBM带宽达到7.2Tbps,是Trillium的4.5倍,也均与B200旗鼓相当。不过,Ironwood要等今年晚间出货,届时,英伟达下一代Rubin架构芯片最快也会量产。 ——


(Ironwood超节点,连接了9216颗TUPv7芯片,来源:谷歌云)

所以,未尽研究的读者,在过去的两年中,应该对于谷歌TPU的崛起,不会感到意外,正如我们今年曾预言,甚至英伟达一样:

谷歌披露了第七代TPU Ironwood更多细节。这是谷歌首款专为大规模AI推理设计的TPU,突破点覆盖了“性能、扩展、能效、可靠性”所有维度。单个基于Ironwood的超节点纵向最多可容纳9216颗芯片,总算力达到42.5 Exaflops,并共享1.77PB可直接寻址HBM;同时,它还能够横向扩展至数十个超节点。每瓦性能是上一代谷歌TPU Trillium的2倍。 ——
谷歌正在开放自己的TPU市场。它现在已经是除了英伟达GPU之外的硬通货。全球最顶尖的前沿大模型厂商OpenAI与Anthropic都用上了TPU;OpenAI正在自研AI芯片,但奥特曼挖人,还是更信得过在TPU团队干过的。苹果也用过谷歌TPU训练自家AI,xAI则迷上了TPU的JAX框架。还有传言称,谷歌正在设法接近Fluidstack等新兴AI云服务商,将TPU部署到它们的数据中心里;它们此前属于英伟达阵营。 ——

英伟达面临的最大问题,是其高达75%左右的毛利率,越来越难以维持。对于前沿大模型实验室,英伟达只能通过提供股权投资而非降价,来巩固其主导地位,因为降价会降低毛利率并引发投资者恐慌。

股权投资的做法,也意味着OpenAI们能从中获得打折优惠。据业内分析;OpenAI 甚至还没部署 TPU,就已经在其整个实验室的英伟达设备组中节省了约 30% 的成本。这表明 TPU 的性价比优势非常显著,即使在这些实验室启用 TPU 之前,也能立即获得收益。

至今没有一家芯片设计厂商,从谷歌到华为,都难于挑战英伟达的单芯片性能,但是,系统级工程设计,使得 TPU 堆栈在性能和成本效益方面都与英伟达不相上下。这也是中国的一些科技企业,从华为到互联网巨头接下来要走的路。

“系统比微架构更重要”,过去两年的发展也印证了这一点。Anthropic 的大量 TPU 订单,直接验证了该平台的技术实力。与此同时,GPU 生态系统也在改变自己。GB200 代表着一次重大飞跃,推动英伟达向真正的系统公司转型,能够设计完整的服务器,而不仅仅是内部的芯片封装。

对比一下,英伟达直到GB200才实现机架级互连方面的巨大创新,但常常被忽视的是:自2017年TPU v2发布以来,谷歌就一直在机架内部和机架之间扩展TPU!谷歌的ICI扩展网络,是英伟达NVLink唯一真正的竞争对手。

正如开篇所说,谷歌最近推出的 Gemini 3 被公认为目前最先进的模型,这一结果有力地证明了 TPU 的强大性能以及谷歌在基础设施方面的整体优势。具有讽刺意味的是,OpenAI CEO奥特曼在公开点赞之后,就在内部警告,因为GPT大模型正在失去领先优势,将面临着严峻挑战。

2024年9月,OpenAI以o1引领了推理模型,把关注点集中在推理和后训练的硬件上,然而,对前沿模型进行预训练仍然是人工智能硬件领域最困难、资源消耗最大的挑战。TPU平台已经彻底通过了这一考验。这与竞争对手形成了鲜明对比:自2024年5月GPT-4o发布以来,OpenAI的顶尖研究人员,尚未成功完成任何大规模部署的新前沿模型预训练,这进一步说明,谷歌TPU集群克服了重大技术障碍。

谷歌一向是一家软件公司、互联网公司,其核心业务以往并非硬件业务。但是,谷歌面临硬件的挑战,悄然强势进军,坚持长达十年的投入,最终确立了系统性能领先地位,正在重新定义自己的AI软件竞争优势。这个过程中,3年前遭遇过危机,但今天已经完全扭转过来了。

所有这些对于英伟达意味着什么?从一定意义上说,AI芯片和基础设施格局,正在从英伟达的垄断性霸主地位,向“一超多强”的格局转变。应该承认,英伟达依然AI芯片和基础设施超级大厂。

谷歌在TPU上的强势崛起,带来如下重要的启示,包括我们引述了几点对Semianalysis:

第一,AI 软件时代的“护城河”,正从“模型”延伸到“基础设施”。

谁能在芯片、系统、网络和软件栈上协同优化,谁就能把单位有效 FLOPs 的成本压得更低,从而在模型训练、推理定价和产品形态上更有回旋空间。谷歌通过 TPUv7 和 Gemini 3,已经证明自己并非只会做搜索和广告。

第二,TPU 不只是“自用武器”,而是正在成为一条完整的商业路线。

通过与 Anthropic 的百万 TPU 合同,以及新云服务商、加密矿企的三方合作结构,谷歌把原本封闭的 TPU 体系,从内部机房搬到了第三方数据中心,让整个行业第一次有了真正能和英伟达系统性竞争的替代品。

第三,软件生态仍是 TPU 的短板,但谷歌已经开始“补课”。

在 PyTorch 原生后端、vLLM / SGLang 集成、SparseCore 可编程性等方面,谷歌投入了大量工程力量;但在 XLA 编译器、运行时和多 Pod 训练代码的开源上,还没有迈出最后一步。未来 TPU 能否在开发者心智中真正站稳脚跟,很大程度要看这一块会不会彻底打开。

第四,未来几年,很可能是“多极算力世界”。

英伟达、谷歌、亚马逊、AMD,以至于其他云厂商的自研芯片,将在不同客户、不同负载、不同商业模式下各展拳脚。OpenAI 自研芯片团队也开始“动真格”,进一步说明头部实验室不愿把命运完全交给单一供应商。

第五,在这个多极算力世界中,一定会有中国企业的至少一席之地。

参考:

https://cloud.google.com/blog/products/compute/ironwood-tpus-and-new-axion-based-vms-for-your-ai-workloads;

TPUv7: Google Takes a Swing at the King (https://newsletter.semianalysis.com/);

https://mp.weixin.qq.com/s/e532IOGX0m0HbLTpTbqgNA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重磅处罚!塞维利亚主帅阿尔梅达因与裁判发生冲突被禁赛七场

重磅处罚!塞维利亚主帅阿尔梅达因与裁判发生冲突被禁赛七场

懂球帝
2026-02-19 15:20:07
身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

青眼财经
2026-02-11 19:36:31
冲6连胜?骑士2员大将复出,哈登喂饼击穿篮网内线,米神对飚波特

冲6连胜?骑士2员大将复出,哈登喂饼击穿篮网内线,米神对飚波特

一登侃球
2026-02-19 09:19:15
能源耗尽遍地垃圾,古巴外长将访俄求助

能源耗尽遍地垃圾,古巴外长将访俄求助

昊轩看世界
2026-02-19 14:48:01
“中国宜家”崩了,创始人套现200亿离场,美的太子接盘血亏?

“中国宜家”崩了,创始人套现200亿离场,美的太子接盘血亏?

蜉蝣说
2025-12-23 20:00:55
台湾统一方式或出乎意料,特朗普才发现:中国真高明,自己学不来

台湾统一方式或出乎意料,特朗普才发现:中国真高明,自己学不来

卷史
2026-01-29 16:18:40
图灵奖科学家泼冷水:机器人连猫都不如!宇树王兴兴隔空回应

图灵奖科学家泼冷水:机器人连猫都不如!宇树王兴兴隔空回应

娱乐督察中
2026-02-18 19:50:57
一眼就看出来谁结婚了( 笑 哭 )( 捂脸)

一眼就看出来谁结婚了( 笑 哭 )( 捂脸)

小陆搞笑日常
2026-02-19 11:47:01
前中央政治局常委64岁主动请辞,临终坦然:我死而无憾

前中央政治局常委64岁主动请辞,临终坦然:我死而无憾

阿諢体育
2026-02-13 04:28:34
那些让人受益终生的好习惯!网友:坚持抗糖,少喝牛奶

那些让人受益终生的好习惯!网友:坚持抗糖,少喝牛奶

夜深爱杂谈
2026-02-18 23:48:18
被年轻人“抛弃”的8个家居产物,时代要淘汰你,连招呼都不会打

被年轻人“抛弃”的8个家居产物,时代要淘汰你,连招呼都不会打

室内设计师有料儿
2026-02-18 21:17:06
不负信任的飞驰人生

不负信任的飞驰人生

澎湃新闻
2026-02-19 11:24:04
春晚节目单公布:一共3个小品,没有相声!沈腾、马丽不演小品演“贺岁微电影”,宇树科技机器人将表演武术节目!央视记者实探春晚后台

春晚节目单公布:一共3个小品,没有相声!沈腾、马丽不演小品演“贺岁微电影”,宇树科技机器人将表演武术节目!央视记者实探春晚后台

每日经济新闻
2026-02-16 16:08:00
公司团建我给保安敬酒,次日董事长叫我去办公室,他爸要提拔我

公司团建我给保安敬酒,次日董事长叫我去办公室,他爸要提拔我

晓艾故事汇
2025-11-21 17:10:17
太坚强!王曼昱27岁生日照曝光,原来亚洲杯后的网暴并没有影响她

太坚强!王曼昱27岁生日照曝光,原来亚洲杯后的网暴并没有影响她

凤幻洋
2026-02-19 13:29:21
中美舰艇发生激烈对峙!外军突然冲向解放军,结果下一刻变老实了

中美舰艇发生激烈对峙!外军突然冲向解放军,结果下一刻变老实了

墨印斋
2026-01-26 18:44:05
法国媒体:东大机器人挥舞那么长的剑,你是不是还有其他话没说?

法国媒体:东大机器人挥舞那么长的剑,你是不是还有其他话没说?

呼呼历史论
2026-02-19 07:33:16
跌成白菜价,电视却卖不动了!14亿人干不过3亿美国人,太扎心

跌成白菜价,电视却卖不动了!14亿人干不过3亿美国人,太扎心

议纪史
2026-02-13 16:10:03
世界上最便宜的长寿药,就一个字!

世界上最便宜的长寿药,就一个字!

尚曦读史
2026-02-17 09:19:08
55年陈赓来到张万年的办公室,为何开玩笑说:你是个“野心家”

55年陈赓来到张万年的办公室,为何开玩笑说:你是个“野心家”

大运河时空
2026-02-18 13:40:03
2026-02-19 15:48:49
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
306文章数 62关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

日本挖到含稀土泥浆 高市称"下一代、下下代都用不完"

头条要闻

日本挖到含稀土泥浆 高市称"下一代、下下代都用不完"

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

教育
数码
游戏
房产
公开课

教育要闻

马年伊始,请带上这10句话整装出发!

数码要闻

内存价格崩了 国内最高降价20%:去华强北市场揭秘实情!

《战神》三部曲新爆料!奎爷演员亲自透露消息

房产要闻

顶豪抢房潮席卷全国! 中旅馥棠公馆项目395㎡大平层加推入市!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版