网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌英伟达联手：AI推理成本怎么砍90%？

2026-04-23 20:30:14　来源: 灰度测试中

北京举报

0

分享至

如果训练大模型是烧钱，那让模型每天回答上亿次问题，算不算"持续烧钱"？

谷歌云Next大会上，谷歌和英伟达甩出一套新硬件方案，目标很直接：把推理成本压到原来的十分之一。不是实验室数据，是准备进机房的真家伙。

01 | 新架构：把72块GPU焊成一个"超级节点"

这套方案的核心叫A5X裸金属实例，底层是英伟达的Vera Rubin NVL72整机架系统。

NVL72的意思很直白：72块GPU塞进一个机架，通过NVLink互联。谷歌和英伟达在这上面做了软硬件协同设计，最终交出的成绩单是——每token推理成本降到前代的十分之一，同时每兆瓦电力能处理的token吞吐量翻十倍。

两个"十倍"叠加，相当于用同样的电费和硬件预算，服务能力直接上一个数量级。

但72块GPU只是起点。真正让这套架构能"长大"的，是网络层。

A5X实例配了英伟达ConnectX-9 SuperNIC，跑在谷歌自研的Virgo网络技术之上。单站点能扩展到8万块Rubin GPU，跨站点部署上限是96万块。

96万块GPU并行计算，数据怎么路由、任务怎么同步、哪块芯片空闲了怎么立刻补上——这些调度复杂度是指数级增长的。谷歌云VP Mark Lohmeyer的原话是："路由数据穿越近百万并行处理器，需要精确同步以避免计算资源空转。"

02 | 企业级顾虑：模型可以本地跑了

算力再便宜，金融和医疗行业也不敢把客户数据往公有云一丢了事。监管合规、数据主权、商业机密——这三座大山卡死了大量AI落地项目。

这次谷歌给了一个新选项：Gemini模型跑在英伟达Blackwell和Blackwell Ultra GPU上，以Google Distributed Cloud的形式进入预览阶段。

简单说，就是整套 frontier 模型可以部署在企业自己的数据中心里，和核心数据资产物理隔离。不是API调用，是把模型"搬回家"。

安全层面上了英伟达的机密计算（Confidential Computing）。硬件级加密，训练过程中的提示词和微调数据全程加密，连云服务商自己都无法查看或篡改。

公有云环境也有对应方案：配备英伟达RTX PRO 6000 Blackwell GPU的Confidential G4虚拟机进入预览。这是首个面向NVIDIA GPU的云上机密计算服务，让受监管行业能在共享基础设施上获得硬件级隔离。

03 | 成本曲线的拐点，可能比预期来得快

把推理成本砍90%，不只是账单数字好看。

它直接改写了AI应用的盈亏平衡点。以前需要月活千万才能摊薄成本的场景，现在百万级用户就能跑通；以前不敢做的实时交互、高频调用功能，现在可以放开手脚试错。

更隐蔽的影响在竞争格局。当头部云厂商能把推理成本压到对手难以跟进的水平，中小玩家的定价空间会被急剧压缩。这不是技术迭代，是商业规则的重新制定。

Mark Lohmeyer的判断是："下一个十年的AI将由客户运行最苛刻工作负载的能力所塑造。"翻译一下：谁能把基础设施成本打下来、同时保证合规弹性，谁就能锁定下一代企业客户。

谷歌和英伟达这次联手，押注的是一个明确的趋势——AI竞赛的下半场，胜负手从"谁能训练最大的模型"转向"谁能最便宜、最安全地让模型跑起来"。

但这里有一个悬而未决的问题：当推理成本趋近于零，应用的差异化究竟会体现在模型能力上，还是会体现在数据闭环和场景理解上？基础设施的民主化，最终是放大头部效应，还是催生新一轮创新浪潮？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

谷歌云年度Next大会：TPU打破“内存墙” OCS、液冷题材如期亮相

财联社 2026-04-23 03:20:30
0 跟贴 0
早报｜特斯拉第三代人形机器人预计年中亮相/更省token，GPT-5.5正式发布/西山居游戏辟谣「解散」传言：将依法追究恶意造谣

爱范儿 2026-04-24 08:28:21
0 跟贴 0

《麻省理工科技评论》年度AI洞察：10个关键词理解正发生的AI趋势

DeepTech深科技 2026-04-23 22:35:07
0 跟贴 0

从GPU到Token：AI基础设施竞争逻辑重构

量子位 2026-04-22 12:46:38
0 跟贴 0
OpenAI要吃掉全美6%电力？硅谷AI战火烧到了发电厂

新智元 2026-04-24 06:05:34
0 跟贴 0

GPT-5.5亮剑，三将辞营，DALL-E谢幕：OpenAI的“成人礼”

钛媒体APP 2026-04-24 09:48:07
0 跟贴 0

国内首家百亿估值纯推理GPU独角兽诞生！专访曦望联席CEO王湛

量子位 2026-04-23 22:28:23
1 跟贴 1
Sakana AI造了个数字生命「培养皿」，AI学会打架、结盟、抢地盘

机器之心Pro 2025-11-05 13:58:14
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
ApdativeNN：建模类人自适应感知机制，突破机器视觉不可能三角

机器之心Pro 2025-11-28 17:15:19
0 跟贴 0
刚刚，GPT-5.5发布，颠覆劳动理论

机器之心Pro 2026-04-24 10:14:06
0 跟贴 0
后悔也来不及了，美商务部长：中方改变主意，美方想卖却卖不出去

小新的视界 2026-04-24 04:39:22
0 跟贴 0
国际东！樊振东造访谷歌总部，合影霸王龙+英伟达总裁

23号球魁 2026-04-21 21:46:34
1 跟贴 1
5nm！国产舱驾一体芯片突破，打破高通+英伟达的饭碗！

互联网.乱侃秀 2026-04-23 13:39:46
9 跟贴 9
29岁樊振东晒与黄仁勋合影，参观英伟达、谷歌等大厂

星视频 2026-04-22 12:47:08
0 跟贴 0
Anthropic估值超过OpenAI，中国光伏出口猛翻一倍 | 财经日日评

吴晓波频道 2026-04-24 08:33:03
0 跟贴 0
黄仁勋全世界穿皮衣，唯独在中国换上了大花袄

雷科技 2026-01-27 17:19:30
0 跟贴 0
特朗普点头也晚了，中方布局到位，美芯片被挡在门外进不来

潋滟晴方DAY 2026-04-24 06:30:56
0 跟贴 0
俄副外长：俄方获邀以最高级别参加美国G20峰会

财联社 2026-04-23 11:20:05
26050 跟贴 26050
Anthropic逼急谷歌！布林亲自下令组突击队，Gemini编程要追上Claude

新智元 2026-04-21 13:30:39
0 跟贴 0
英特尔Q1财报，狠狠打了华尔街的脸

华尔街见闻官方 2026-04-24 10:06:49
0 跟贴 0
V8发动机模型

制造科技 2026-04-19 17:41:19
0 跟贴 0
英伟达 CEO 黄仁勋：AI 不会消灭软件工程师，它只会更快实现想法！

知了3C 2026-04-22 21:35:32
0 跟贴 0
3米数据线让车机断连：谷歌官方认证标准曝光

硅屿手记 2026-04-24 10:10:37
0 跟贴 0
4月22日（发布）樊振东的国际影响力还在进一步提升，英伟达副总裁主动晒出与樊振东的合影，并赞其为“史

中安在线 2026-04-22 12:48:42
0 跟贴 0
英伟达 CEO 黄仁勋：AI 智能体不会取代软件公司，反而会使软件需求暴增！

知了3C 2026-04-22 03:24:06
0 跟贴 0
樊振东现身硅谷英伟达总部，与黄仁勋打乒乓球

江西都市现场 2026-04-22 14:42:47
0 跟贴 0
DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0
英伟达开源个量子AI

机器之心Pro 2026-04-15 12:05:50
0 跟贴 0
谷歌高管爆料：卡普空等九成游戏开发商已在用AI！

3DM游戏 2026-04-24 10:11:34
0 跟贴 0
半挂模型玩具车买菜，要是超重了怎么办，雷军都不敢这么设计！

宇宙搞笑生活 2026-04-23 14:10:00
1 跟贴 1
狗子乖乖躺着让鸡治病

潇湘晨报 2026-04-23 17:38:12
95 跟贴 95
港媒：江旻憓已放弃加拿大护照

澎湃新闻 2026-04-23 13:06:27
3418 跟贴 3418
Google给Java开发者发了个"智能体工具箱"

薛定谔的BUG 2026-04-24 10:05:02
0 跟贴 0
个人微信建了600多个工作群，离职时账号归谁

现代快报 2026-04-23 13:49:11
2102 跟贴 2102
物理AI时代，详解地平线关于整车智能的三张底牌

驾仕派 2026-04-24 09:20:58
0 跟贴 0
深圳水官高速4月26日起停止收费

新快报新闻 2026-04-24 08:16:04
37 跟贴 37
美商务部长：英伟达H200芯片还没卖出去，中国想搞自己的

ulu秋名山 2026-04-24 02:01:12
0 跟贴 0
樊振东与英伟达创始人打乒乓球，吴敬平回应：双向顶配，自带高光

TITAN热吧 2026-04-22 15:34:20
0 跟贴 0
大车也能很灵活！百万级驾控硬件加持，场地试驾智己LS8

汽车焦点 2026-04-23 17:00:02
0 跟贴 0

老兵借厕所被拒后续！官方公布处理结果，保安被开除，老兵回应

老兵借厕所被拒后续！官方公布处理结果，保安被开除，老兵回应

180视角

2026-04-22 01:03:20

斯诺克赛程：决出首席8强，肖国栋或被墨菲淘汰，赵心童PK丁俊晖

斯诺克赛程：决出首席8强，肖国栋或被墨菲淘汰，赵心童PK丁俊晖

刘姚尧的文字城堡

2026-04-24 08:57:36

大反扑！骑士落后10分强势追平：奇兵单节轰12分，哈登6中1低迷

大反扑！骑士落后10分强势追平：奇兵单节轰12分，哈登6中1低迷

体坛小李

2026-04-24 09:26:39

女子被保安扇脸后续：确诊耳膜穿孔，当地人曝内情，更多恶行被扒

女子被保安扇脸后续：确诊耳膜穿孔，当地人曝内情，更多恶行被扒

奇思妙想草叶君

2026-04-23 23:52:54

4月23日俄乌最新：久加诺夫对普京的10次警告

4月23日俄乌最新：久加诺夫对普京的10次警告

西楼饮月

2026-04-23 20:49:09

罗德里：再这么多比赛我踢不到32岁，欧洲杯夺冠后我筋疲力尽

罗德里：再这么多比赛我踢不到32岁，欧洲杯夺冠后我筋疲力尽

懂球帝

2026-04-24 01:27:07

柬埔寨重大项目启动！中国电信全力参建！

柬埔寨重大项目启动！中国电信全力参建！

运营商段子手

2026-04-24 00:05:31

库明加爆发！老鹰109-108尼克斯，约翰逊24+10+8，麦科勒姆23+5+2

库明加爆发！老鹰109-108尼克斯，约翰逊24+10+8，麦科勒姆23+5+2

小徐讲八卦

2026-04-24 10:20:35

太狂了！苏州商场广告牌“首先GDP第一，其次比赛第一”走红网络

太狂了！苏州商场广告牌“首先GDP第一，其次比赛第一”走红网络

火山詩话

2026-04-24 08:48:26

校庆我捐700万被安排在角落，我愣了3秒，校长道：不坐就走不差你

校庆我捐700万被安排在角落，我愣了3秒，校长道：不坐就走不差你

吃货的分享

2026-04-22 20:30:21

英国泰晤士高等教育2026年亚洲大学排名公布：清华、北大分列第一、二，香港8所高校全部跻身前一百名

英国泰晤士高等教育2026年亚洲大学排名公布：清华、北大分列第一、二，香港8所高校全部跻身前一百名

极目新闻

2026-04-24 07:30:32

人社部、财政部通知：支持大学毕业生“回炉”读技校

人社部、财政部通知：支持大学毕业生“回炉”读技校

深度报

2026-04-23 22:43:47

女子被保安扇耳光后续！知情者曝内情，保安身份被扒，学校回应

女子被保安扇耳光后续！知情者曝内情，保安身份被扒，学校回应

180视角

2026-04-23 12:56:07

男子被扒光一事，引起公愤了！

胖胖说他不胖

2026-04-24 09:00:22

别把寄生于系统的繁荣当财富！亚马逊雨林减少80万平方公里，只因一个错误决策

别把寄生于系统的繁荣当财富！亚马逊雨林减少80万平方公里，只因一个错误决策

三言四拍

2026-04-24 08:22:31

各科医生最想跟你说的大实话，很有用！收藏好常看看

各科医生最想跟你说的大实话，很有用！收藏好常看看

华人星光

2026-04-23 12:00:20

鹰王24+10+8麦科勒姆绝杀，唐斯带不动2大铁匠，老鹰力克尼克斯

鹰王24+10+8麦科勒姆绝杀，唐斯带不动2大铁匠，老鹰力克尼克斯

钉钉陌上花开

2026-04-24 09:49:46

内蒙古一老板开1.6万月薪招人放3000只羊，包吃住，有Wi-Fi，有专人送物资，全年无休，回应：更适合夫妻档，一望无际的大草原常年见不到人

内蒙古一老板开1.6万月薪招人放3000只羊，包吃住，有Wi-Fi，有专人送物资，全年无休，回应：更适合夫妻档，一望无际的大草原常年见不到人

潇湘晨报

2026-04-23 22:14:14

俄副外长：俄方获邀以最高级别参加美国G20峰会

俄副外长：俄方获邀以最高级别参加美国G20峰会

财联社

2026-04-23 11:20:05

库克反思其15年CEO任期：苹果地图发布是“首个重大错误”，Apple Watch是最引以为豪的作品

库克反思其15年CEO任期：苹果地图发布是“首个重大错误”，Apple Watch是最引以为豪的作品

鲁中晨报

2026-04-23 13:16:04

灰度测试中

生活正在重构，目前还在灰度测试阶段，暂不全量发布。

1647文章数 18关注度

往期回顾全部

科技要闻

凌晨突发！GPT-5.5正式上线：跑分更猛

头条要闻

受AI冲击"霸总"回家种地：比拍戏难今年基本回不了本

头条要闻

受AI冲击"霸总"回家种地：比拍戏难今年基本回不了本

体育要闻

给文班剃头的马刺DJ，成为NBA最佳第六人

娱乐要闻

王思聪被绿！恋爱期间女友被金主包养

财经要闻

19家企业要"铝代铜"，格力偏不

汽车要闻

全景iDrive 续航近800km 新款宝马7系/i7亮相

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

时尚

艺术

数码

手机

教育要闻

相似无刻度直尺作图，一个视频学会！

今年最好看的3个颜色，太适合夏天了！

艺术要闻

罕见曝光！毛泽东 36 幅经典对联，每一幅都是绝品！

数码要闻

曝英特尔下代Z970芯片组将承接当前B860大部分市场定位

手机要闻

苹果更新推出Invites 1.8，支持iMessage直接分享邀请函

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版