网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌用一张图把AI训练成本砍了40%？

2026-04-17 00:03:30　来源: 我是一个粉刷匠2

北京举报

0

分享至

大模型训练烧钱如流水，但谷歌最近放了个「省钱大招」——用一张架构图让训练成本直降四成。这背后不是魔法，是对计算资源的重新理解。

一张图看懂：什么是「专家混合」？

谷歌这次的核心是「专家混合」（Mixture-of-Experts，简称MoE）。简单说：以前的大模型像个「全能学霸」，每道题都亲自算；MoE则像「专科会诊系统」，把任务分给不同领域的「小专家」。

关键设计在「门控网络」——它决定输入该找哪位专家。比如处理代码时激活编程专家，翻译时调用语言专家。每次只调用约10%的参数，其余「睡觉省电」。

谷歌Gemini 1.5 Pro就用了这招。万亿参数规模，推理成本却和百亿级模型相当。省下的不只是电费，是训练时间——从数月压缩到数周。

为什么现在才火？三个瓶颈刚打通

MoE不是新概念，1991年就有人提。但直到最近才实用化，因为三道坎：

第一，通信开销。专家分散在不同芯片，互相传数据曾是噩梦。谷歌用「路径并行」优化，让专家像本地调用一样快。

第二，负载均衡。如果所有请求都砸向「编程专家」，系统会崩溃。新算法强制均匀分配，谁闲谁上。

第三，训练稳定性。稀疏激活容易「塌房」——某些专家永远不被选中，变成废参数。谷歌加了辅助损失函数，逼每个专家都有活干。

省钱的代价：什么场景不适合？

MoE不是万能药。它的优势在「批量大、任务杂」——比如同时处理搜索、翻译、代码生成。但小批量、单任务场景，路由开销反而拖后腿。

更隐蔽的风险是「专家崩溃」：训练后期某些专家垄断特定任务， diversity（多样性）丧失。谷歌的解决方案是「专家容量限制」——每个专家有接单上限，倒逼系统保持弹性。

国内厂商也在跟进。DeepSeek-MoE、阿里Qwen-MoE都用了类似思路，但实现细节差异很大。谷歌这篇论文的价值，是把工程 trick（技巧）系统化，变成可复现的配方。

这对从业者意味着什么？

如果你在做大模型选型，记住这个公式：MoE适合「参数规模大、调用频次高、任务类型杂」的场景。创业公司可以用它撬动十倍参数量的效果，而不必烧同等算力。

更长远看，MoE代表了AI架构的进化方向——从「大力出奇迹」到「精准调度」。当算力不再是唯一壁垒，工程优化能力会成为新的护城河。

谷歌已经开源了部分实现。下次你的训练预算超支时，不妨先看看这张图——也许40%的成本，就藏在路由策略里。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

“龙虾”JiuwenClaw率先开启“Coordination Engineering”时代

量子位 2026-04-20 21:01:32
0 跟贴 0
谷歌联手Marvel研发下一代TPU，专为AI推理打造

智东西 2026-04-20 20:22:12
5 跟贴 5

你以为在举报AI烂片？谷歌：这招，我用验证码玩了15年

机器之心Pro 2026-04-20 10:50:32
0 跟贴 0

谁说Ultra是智商税？Find X9 Ultra第一个反对！

小喵说科技 2026-04-18 15:00:44
3 跟贴 3
时尚智能眼镜的品牌竞争正式开启

至顶AI实验室 2026-04-20 23:37:11
0 跟贴 0

DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0

87%的安卓车主不知道：你的车机藏着一个语音笔记系统

我是一个养虾人 2026-04-21 04:23:51
0 跟贴 0
让用户成为产品经理，我们和时空壶聊了聊100万用户背后的产品哲学

智东西 2025-11-10 19:26:45
0 跟贴 0

Mythos架构被22岁小伙“逆推”开源了！MoE和注意力借鉴DeepSeek

量子位 2026-04-20 16:05:47
7 跟贴 7
梁文锋，坐不住了

虎嗅APP 2026-04-20 17:18:44
0 跟贴 0
幼儿园的小朋友自学乘法，这种算法还是第一次见

蓬勃资讯 2026-04-19 10:28:49
85 跟贴 85
连按Tab完成重构：蚂蚁CodeFuse团队提出无指令代码编辑框架NES

机器之心Pro 2026-04-20 12:32:25
0 跟贴 0
文化输出赢麻了！国产智能翻译手表，无障碍沟通轻松拿捏！

莫扎旅行者 2026-04-20 09:46:57
0 跟贴 0
Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

智东西 2026-04-20 19:08:36
3 跟贴 3
AI斩杀线，Anthropic还要制造多少条？

钛媒体APP 2026-04-20 14:23:11
0 跟贴 0
「龙虾之父」吐槽人类互联网后，终于有人把这当个事儿办了

机器之心Pro 2026-03-31 11:09:26
0 跟贴 0
游戏开发门槛崩塌：AI原生工作流正在改写规则

碳基打工人 2026-04-20 09:57:04
0 跟贴 0
GEO如何改变品牌？中国人民大学新闻学院教授王菲：被正确理解，才能被持续看见

每日经济新闻 2026-04-20 20:56:03
0 跟贴 0
ABC急救剧未播先续：瑞恩·菲利普的侦探牌怎么打

影视情报室 2026-04-21 05:03:03
0 跟贴 0
医院系统崩了？微服务架构怎么拆

全栈遛狗员 2026-04-18 04:48:50
1 跟贴 1
一个击球手的"慢启动"为什么值101分

赛场名场面 2026-04-21 02:57:17
0 跟贴 0
千万不能逼一位不想翻译的人翻译

叒叒看看剧 2026-04-20 10:07:35
1 跟贴 1
科学谷歌阿尔法刚刚发现了我们并非孤身一人的证据！

素玉姑娘 2026-04-21 03:50:24
0 跟贴 0
法国通过文物归还法案敦煌藏经洞文物就能回归吗

澎湃新闻 2026-04-20 08:08:29
11788 跟贴 11788
灵光把手搓应用做成「朋友圈」，一人应用时代来了

36氪 2026-04-20 16:01:07
0 跟贴 0
哥哥真是吵也吵不过，打也打不过，这次加上了字幕翻译

矮脚虎凸凸 2026-04-20 09:16:14
0 跟贴 0
最低成本挑战太湖一日游——沃尔沃XC70 感恩版

新出行 2026-04-18 17:52:17
20 跟贴 20
北纬科技：公司物联网业务对AI算力及大模型API调用的直接需求较少，相关云服务调价对公司直接影响较小

每日经济新闻 2026-04-20 22:51:04
0 跟贴 0
海丽和女翻译同唱中文歌曲《月亮代表我的心》

小源同学m 2026-04-19 01:01:52
0 跟贴 0
4月21日外盘头条：特朗普称停火期不太可能延长苹果换帅！特努斯将接棒CEO 沃什提名听证会讲稿曝光

新浪财经 2026-04-21 06:00:16
0 跟贴 0
Anthropic CEO：如果我是25岁，不会选编程，会选

机器之心Pro 2026-04-18 12:00:00
0 跟贴 0
特朗普称达成“协议”前不解除对伊封锁；WTI原油涨近7%，美股指收跌；苹果：库克不再担任CEO；爱奇艺回应“AI艺人库”争议丨每经早参

每日经济新闻 2026-04-21 06:16:04
0 跟贴 0
睡前故事是智商税还是真有用？我扒了这篇儿科论文

晚风也遗憾 2026-04-21 03:10:53
0 跟贴 0
歼-35A装的果然是它：12吨推力，一个参数直接打破F-35神话

军武时间线 2026-04-19 19:32:18
0 跟贴 0
解放军133号舰艇编队从横当水道进入太平洋专家解读

环球网资讯 2026-04-20 12:17:06
160 跟贴 160
宁波男子收到陌生账号转账8万余元，三天后奢侈品牌商家找来：员工误将其收款码给客户

齐鲁壹点 2026-04-20 07:19:18
1527 跟贴 1527
媒体：日方有一种阴毒"战略" 在自卫队宣扬未来再侵华

新民周刊 2026-04-20 09:08:09
2367 跟贴 2367
第一个面临消失的职业，不是幼师，不是快递员，而是这三种工作？

天天热点见闻 2026-04-21 05:17:29
0 跟贴 0
欧宝旧厂不再造汽车，50人改造代码，帮欧洲摆脱美国科技巨头

暮雨咋歇着 2026-04-20 22:30:25
0 跟贴 0
长城发布“归元S”平台魏牌赵永坡：一场从底层逻辑出发的造车革命

中国经营报 2026-04-20 21:04:45
0 跟贴 0

追觅造车已进入实质性推进阶段，第二款旗舰SUV对标理想L9、问界M9 | 独家

追觅造车已进入实质性推进阶段，第二款旗舰SUV对标理想L9、问界M9 | 独家

钛媒体APP

2026-04-20 10:40:57

1944年刘少奇急请全军改名，毛主席为何宁犯众怒也要强行叫停？三年后全党惊出冷汗

1944年刘少奇急请全军改名，毛主席为何宁犯众怒也要强行叫停？三年后全党惊出冷汗

史海孤雁

2026-04-10 17:06:11

记者：狼队0-4赛后，阿罗科达雷与马内在更衣室发生肢体冲突

记者：狼队0-4赛后，阿罗科达雷与马内在更衣室发生肢体冲突

懂球帝

2026-04-20 11:52:02

57岁好莱坞女星太敢说：自曝生猛夫妻生活，不用生娃更尽兴

57岁好莱坞女星太敢说：自曝生猛夫妻生活，不用生娃更尽兴

橙星文娱

2026-04-18 16:47:02

韩国济州驶往上海邮轮上一中国籍男子坠海！

韩国济州驶往上海邮轮上一中国籍男子坠海！

看看新闻Knews

2026-04-21 00:40:17

大S到死都没料到！她走后，真心疼玥儿箖箖竟是被她拉黑的前婆婆

大S到死都没料到！她走后，真心疼玥儿箖箖竟是被她拉黑的前婆婆

情感大头说说

2026-04-20 15:16:32

突发！340亿开源巨头彻底撤离中国，419名顶级工程师被疯抢，18年深耕终落幕…

突发！340亿开源巨头彻底撤离中国，419名顶级工程师被疯抢，18年深耕终落幕…

新浪财经

2026-04-20 04:31:06

现役混得最差的5位状元：西蒙斯没球打，艾顿中产，他打发展联盟

现役混得最差的5位状元：西蒙斯没球打，艾顿中产，他打发展联盟

大西体育

2026-04-20 23:34:30

五大联赛首支降级队出炉中资劲旅征战英超8年后提前5轮跌入英冠

五大联赛首支降级队出炉中资劲旅征战英超8年后提前5轮跌入英冠

我爱英超

2026-04-21 06:16:23

日本军舰闯台海后，美国接到通知，中国东海划5处警戒区，有动作

日本军舰闯台海后，美国接到通知，中国东海划5处警戒区，有动作

说历史的老牢

2026-04-20 05:04:04

韩国一美女因晨跑健身“走红”，身材紧致太吸睛，网友：太漂亮了

韩国一美女因晨跑健身“走红”，身材紧致太吸睛，网友：太漂亮了

马拉松跑步健身

2026-04-19 06:30:13

杨钰莹济宁演唱会献唱，路人镜头下虎背熊腰，脸上满是岁月的痕迹

杨钰莹济宁演唱会献唱，路人镜头下虎背熊腰，脸上满是岁月的痕迹

小娱乐悠悠

2026-04-20 09:08:04

杭州湾“古斯特”要来了？极氪8S第三方设计图曝光

杭州湾“古斯特”要来了？极氪8S第三方设计图曝光

CNMO科技

2026-04-20 13:44:03

断油倒计时？高市没招了！为熬过石油危机，日本的自救能有多奇葩

断油倒计时？高市没招了！为熬过石油危机，日本的自救能有多奇葩

百科密码

2026-04-20 18:44:06

国家一级女演员陈丽云被逮捕！

许三岁

2026-03-28 09:24:30

过分，韩国北面歧视中国游客：“你所做的就是你国家的面貌。”

过分，韩国北面歧视中国游客：“你所做的就是你国家的面貌。”

设计癖

2026-04-18 12:50:09

浙江东阳一仓库起火黑烟冲天，附近商户：预计损失较大

浙江东阳一仓库起火黑烟冲天，附近商户：预计损失较大

新京报

2026-04-20 18:03:33

中国选手在世锦赛16强中占据8席，囧哥强势逆转晋级

中国选手在世锦赛16强中占据8席，囧哥强势逆转晋级

老汆古装影视解说

2026-04-21 05:59:35

全球媒体聚焦 | 巴基斯坦媒体：中国正从“世界工厂”迈向全球消费大国

全球媒体聚焦 | 巴基斯坦媒体：中国正从“世界工厂”迈向全球消费大国

国际在线

2026-04-20 19:29:05

终极较量！对日反击战，全面打响了！

终极较量！对日反击战，全面打响了！

大嘴说天下

2026-04-20 22:40:03

我是一个粉刷匠2

有态度网友ytd

1587文章数 24关注度

往期回顾全部

科技要闻

重磅官宣：库克卸任，特努斯接任苹果CEO

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力，但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成，字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻我腿软了

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

艺术

游戏

数码

家居

干细胞抗衰4大误区,90%的人都中招

艺术要闻

春天最适合小住三五天的地方

大司马回归两个月，某音人气稳居顶流行列，道出风光背后心酸现状

数码要闻

华为Pura90系列及Pura X Max折叠屏手机发布：5499元起

家居要闻

自然慢调慢享时光

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版