AI芯片大战正在从“谁的芯片更快”,变成“谁能把算力、云、客户和融资绑成一整套生意”。英伟达靠GPU和CUDA守住高墙,谷歌则把TPU推到台前,用专用芯片、低成本推理和财务担保,开始撬动这堵墙。
![]()
GPU的高墙还在
过去两年,AI行业几乎默认一件事:要训练大模型,就去抢英伟达GPU。
GPU赢的不只是单颗芯片性能,更是整套生态。CUDA像一条已经铺好的高速路,AI团队、云厂商、开发工具、模型框架都跑在上面。对很多公司来说,换芯片不是换零件,而是换一整套工作方式。
这也是英伟达最硬的护城河。它不只是卖卡,还卖服务器、网络、软件库、云合作和供货优先级。很多新云厂商不敢轻易绕开它,因为一旦GPU配额受影响,客户交付就会出问题。
TPU开始绕后
谷歌的打法不一样。
TPU不是通用高速路,更像专门为AI任务铺的一条铁路。它不一定适合所有计算,但在训练和推理这类固定场景里,成本、能耗和规模化调度可能更有优势。
谷歌最新一代TPU已经明显分成两条线:训练用的TPU 8t,推理用的TPU 8i。这个变化很关键。AI行业前半场拼训练,后半场拼推理。模型训练完以后,每天真正烧钱的是回答问题、处理图片、调用智能体、跑企业流程。
谁能把推理成本压下来,谁就能决定AI应用到底能不能大规模赚钱。
谷歌开始学英伟达
谷歌过去更多是把TPU留给自己和云客户用,现在商业动作明显变重。
纽约州的Lake Mariner AI数据中心项目中,谷歌提供约32亿美元财务担保,项目算力将租给Anthropic。路易斯安那州River Bend项目规模约70亿美元,得州Colorado City项目还有约14亿美元担保。
这套打法很直接:不只是卖芯片,而是帮数据中心把钱借下来、把客户锁进来、再让算力跑起来。
英伟达以前也靠类似方式放大需求。现在谷歌拿着自己的资产负债表下场,等于告诉市场:TPU不再只是谷歌内部武器,它要变成一门外部生意。
![]()
黑石入场,信号更重
谷歌和黑石的50亿美元合作,是这场竞争里更刺眼的一步。
新公司计划提供基于TPU的数据中心和算力服务,目标是和CoreWeave、Nebius这类以英伟达硬件为核心的新云厂商竞争。换句话说,谷歌不只想卖一块芯片,而是要造一个不用完全依赖GPU的AI云入口。
这对客户很有吸引力。过去大家怕没有GPU,现在更怕只有GPU。只要算力长期短缺,企业就会寻找第二条供应链。
TPU还没赢,但牌变多了
TPU的短板也很明显。
开发者生态、迁移成本、工具成熟度、客户习惯,都不是一两次发布会能解决的。很多AI团队已经围绕GPU写好了代码、调好了框架、训练好了工程经验,换到TPU需要重新适配。
但算力紧缺会改变人的耐心。如果TPU能在某些任务上便宜30%、快几倍,哪怕只适合一部分工作负载,也足够让大客户认真试一试。Citadel Securities已经在部分研究软件工作负载中使用TPU,并给出过关键任务成本下降、速度提升的反馈。
结语
GPU和TPU之争,不是简单的芯片参数对打。GPU守的是生态,TPU攻的是成本和推理;英伟达守的是通用算力入口,谷歌攻的是AI云的第二条路。AI越往应用层走,每一次回答、每一次调用、每一个智能体任务都会变成账单。到那时,谁能让算力更便宜、更稳定、更容易买到,谁就不只是卖芯片,而是在给AI时代定价。
文章来源
https://www.wsj.com/tech/ai/google-is-using-nvidias-playbook-to-build-a-rival-ai-chip-business-1eac86f9?mod=tech_lead_story
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.