网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

英伟达偷偷重写MoE推理代码，1.84倍提速却藏着个扎心前提

2026-04-08 00:37:03　来源: 字节漫游指南

北京举报

0

分享至

Blackwell GPU刚量产，英伟达就甩出一组新数据：MoE模型的token生成速度提升了1.84倍。这个数字看着漂亮，但实现方式有点意思——他们不是换芯片，是把推理流水线整个拆了重建。

MoE模型向来是算力黑洞。专家网络稀疏激活的特性，让GPU显存带宽成了瓶颈，大量时间耗在数据搬运上。英伟达的解法很工程派：把token路由、专家计算、结果聚合三个环节重新排布，让Blackwell的第二代Transformer引擎能连续吞吐，减少显存往返。

「我们在软件层面重新设计了MoE的并行策略」，英伟达HPC副总裁Ian Buck的原话很克制，没提具体改了哪些指令调度。但1.84倍这个数字有前提——对比的是Hopper架构上的旧实现，而非同一硬件的软件优化空间。

换句话说，这既是Blackwell的卖点，也是Hopper用户的提醒。老卡还没捂热，新卡的软件护城河已经开始挖了。有开发者吐槽：「我的H100刚部署完，优化路线图就已经是过去式。」

英伟达没公布这项优化何时开源。目前它藏在CUDA工具链的更新日志里，版本号都没标红。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

省token神器3天狂揽4.1k星！19岁小哥开发，信息无损最高省87%

量子位 2026-04-08 11:26:59
4 跟贴 4
微信文件一键总结？腾讯元宝大更新：这功能太赞了

雷科技 2026-04-08 19:05:32
0 跟贴 0

干货！让Claude Cowork真好用的17个神操作

智东西 2026-04-08 23:05:26
0 跟贴 0

李飞飞World Labs双模齐发，能「造」超复杂大场景，一手实测

机器之心Pro 2026-04-08 18:18:54
0 跟贴 0
比亚迪英伟达联手，要让车“自己赚钱”：特斯拉已经落后？

无吝健康 2026-04-07 13:10:44
0 跟贴 0

科技巨头集体押注自研芯，AI芯片战场正加速向推理端迁移

华尔街见闻官方 2026-04-07 21:48:40
0 跟贴 0

美股芯片股上涨，英特尔涨超8%，英伟达涨3.4%，高通涨超2%

每日经济新闻 2026-04-08 22:06:08
1 跟贴 1
玩家吐槽云游戏是"垃圾"！最好的云游戏就是串流投屏

游民星空 2026-04-07 16:04:28
5 跟贴 5

黄仁勋全世界穿皮衣，唯独在中国换上了大花袄

雷科技 2026-01-27 17:19:30
0 跟贴 0
82岁退休的他，带出一系千亿级科技巨头，却不持有1股股权

华商韬略 2025-12-01 10:46:51
1 跟贴 1
芯片出海，征服日本汽车？

钛媒体APP 2026-04-08 22:33:08
0 跟贴 0
黄仁勋：GeForce是英伟达最成功的营销！伴随着玩家成长！

知了3C 2026-04-05 00:37:14
0 跟贴 0
全世界最贵的车！买了它是黄仁勋唯一的遗憾

雷科技 2026-02-06 23:52:44
0 跟贴 0
黄仁勋谈“唯一的遗憾”：在英伟达市值3亿美元时出售股票，给父母买了一辆奔驰车

财联社 2026-01-23 14:47:34
0 跟贴 0
大妈吃面顺走大半罐花椒带走店家：说好多次都没用管不了

荔枝新闻 2026-04-08 09:43:05
156 跟贴 156
8GB显卡能再战十年！NVIDIA纹理压缩技术让显存需求爆降85%

快科技 2026-04-06 18:37:25
0 跟贴 0
姑娘大街上直播跳舞，硬件条件太差了，想复制阿梓的路不可能

矜寡爱时尚 2026-04-06 09:17:05
0 跟贴 0
阿曼称已签署不对霍尔木兹海峡通行船只收费的协议

财联社 2026-04-08 18:36:13
10123 跟贴 10123
3岁女孩被公鸡扑倒，姥爷一把抓住当场拧脖

荔枝新闻 2026-04-08 09:42:57
142 跟贴 142
Claude Mythos官宣！性能碾压Opus 4.6，因太危险遭「囚禁」

量子位 2026-04-08 10:43:12
3 跟贴 3
国产版Ollama来了，Clawdbot终于不只属于Mac和英伟达-5

机器之心Pro 2026-02-03 14:47:06
0 跟贴 0
中俄投下反对票！傅聪：不给使用武力开通行证

看看新闻Knews 2026-04-08 16:59:04
9486 跟贴 9486
紧急情况！上海虹桥、浦东机场，接连有旅客被拦截！警察一句话，小伙当场吓懵：这一去，就回不来了

上观新闻 2026-04-08 14:19:19
294 跟贴 294
男子和小老外结婚三年，开始健身女友这样理解，婆婆秒接受指令！

搞笑大蘑菇 2026-04-05 13:19:09
0 跟贴 0
21年砸下80亿美元，离量产仅一步之遥美国为何放弃这款王牌直升机

暖阳喵 2026-04-07 10:31:50
1 跟贴 1
“祖先给的特权”，河南网友称祖坟在景区祭祖免票，景区回应：没过检票口，一般是附近住户的祖坟

大风新闻 2026-04-06 15:06:12
2294 跟贴 2294
便衣听到指令立刻变换姿势

美鹿莎 2026-04-07 01:32:58
0 跟贴 0
张雪机车LOGO被指抄袭，张雪曾表示花了40万元，设计公司回应

极目新闻 2026-04-08 12:16:43
3256 跟贴 3256
形势开始大变！西方媒体集体改口：中国已无需再向世界证明什么

小嵩 2026-04-08 21:00:14
2 跟贴 2
毛新宇携家人到杨开慧烈士陵园祭扫

政知新媒体 2026-04-05 08:48:13
2639 跟贴 2639
吴泳铭成立阿里技术委员会，为何这四人入选？

虎嗅APP 2026-04-09 05:04:02
0 跟贴 0
Meta首个“超级智能”模型亮相闭源路线大转弯

财联社 2026-04-09 03:43:09
0 跟贴 0
英特尔终止 Unity 引擎的 XeSS 官方支持

cnBeta.COM 2026-04-06 14:31:03
0 跟贴 0
日媒：“日本制造业输给了中国”

环球网资讯 2026-04-08 07:11:12
1450 跟贴 1450
WTI原油期货跌幅扩大至19%

澎湃新闻 2026-04-08 07:53:06
2146 跟贴 2146
万斯：若未达成协议美国或拿出“尚未动用的手段”

每日经济新闻 2026-04-08 07:21:56
432 跟贴 432
算力+存储双轮驱动，半导体设备ETF（159516）大涨超6%

每日经济新闻 2026-04-08 10:56:37
0 跟贴 0
能力太强，Mythos被Anthropic“冻结”

虎嗅APP 2026-04-09 03:25:07
0 跟贴 0
特斯拉Tesla鸿蒙版App正式上架！远程车控+手机钥匙一步到位

快科技 2026-04-07 15:35:39
21 跟贴 21
高手之间的对决，差距往往藏在细节，关键竟差在了硬件上

菠菜不算爱 2026-04-08 14:22:49
1 跟贴 1

跳水运动员全红婵涉嫌遭网暴，全红婵所在训练中心已向公安机关报警

跳水运动员全红婵涉嫌遭网暴，全红婵所在训练中心已向公安机关报警

界面新闻

2026-04-08 12:41:59

美国完全陷入中国的圈套！纽约时报：特朗普正在领导超级大国自杀

美国完全陷入中国的圈套！纽约时报：特朗普正在领导超级大国自杀

混沌录

2026-04-07 22:00:06

太可怜了！全红婵被霸凌，282人微信群聊天曝光，体育总局动真格

太可怜了！全红婵被霸凌，282人微信群聊天曝光，体育总局动真格

乌娱子酱

2026-04-08 14:10:45

大风315 | 在淘宝买卡萨帝冰箱，店家限时优惠又送高档电器，保温杯顶替冰箱发了货，冰箱没收到店铺已关闭

大风315 | 在淘宝买卡萨帝冰箱，店家限时优惠又送高档电器，保温杯顶替冰箱发了货，冰箱没收到店铺已关闭

大风新闻

2026-04-08 18:45:10

打了40天，没有输家？伊朗宣布大获全胜，特朗普宣布“完全胜利”

打了40天，没有输家？伊朗宣布大获全胜，特朗普宣布“完全胜利”

不掉线电波

2026-04-08 20:21:53

美国AI三巨头联手限制蒸馏：最便宜的那条路，被掐断了

美国AI三巨头联手限制蒸馏：最便宜的那条路，被掐断了

卢松松

2026-04-08 14:07:41

戏剧性转变：通牒到期，美伊停火

戏剧性转变：通牒到期，美伊停火

南风窗

2026-04-08 14:07:48

马上检查你家冰箱！23岁女孩开颅3次，元凶就在冰箱里，你家可能也有

马上检查你家冰箱！23岁女孩开颅3次，元凶就在冰箱里，你家可能也有

奇妙的本草

2026-04-08 12:01:43

有趣的医学案例：直肠射精！

黯泉

2026-04-07 21:58:25

脱口秀女演员思文官宣生子：正式介绍下，我儿子多多；此前发文与脱口秀演员程璐离婚

脱口秀女演员思文官宣生子：正式介绍下，我儿子多多；此前发文与脱口秀演员程璐离婚

极目新闻

2026-04-08 12:16:43

消失9年，芙蓉姐姐近况曝光：病中探望老友，衣着朴素身价过亿

消失9年，芙蓉姐姐近况曝光：病中探望老友，衣着朴素身价过亿

可爱小菜

2026-04-08 14:47:21

中俄投下反对票！傅聪：不给使用武力开通行证

中俄投下反对票！傅聪：不给使用武力开通行证

看看新闻Knews

2026-04-08 16:59:04

瑾汐和温州爸爸不再来往，爸爸账号清空，各自安好，大家各有说法

瑾汐和温州爸爸不再来往，爸爸账号清空，各自安好，大家各有说法

以茶带书

2026-04-08 16:34:40

巴塞罗那0-2马竞，赛后评分：不是马竞球员第1，巴塞罗那10号第1

巴塞罗那0-2马竞，赛后评分：不是马竞球员第1，巴塞罗那10号第1

侧身凌空斩

2026-04-09 04:56:44

2-0！夺冠大热门笑傲欧冠八强战 10.2亿豪门被按着打仅1射太狼狈

2-0！夺冠大热门笑傲欧冠八强战 10.2亿豪门被按着打仅1射太狼狈

狍子歪解体坛

2026-04-09 05:01:35

美伊停火后伊朗导弹射向以色列

财联社

2026-04-08 08:27:09

上海市格致中学原校长柴志洪因病逝世，享年83岁

上海市格致中学原校长柴志洪因病逝世，享年83岁

澎湃新闻

2026-04-08 10:34:26

布伦特原油失守90美元/桶，为3月11日以来首次

布伦特原油失守90美元/桶，为3月11日以来首次

每日经济新闻

2026-04-08 20:10:10

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

芳芳历史烩

2026-04-08 16:28:15

随着马竞2-0掀翻巴萨，利物浦溃败，欧冠四强席位基本浮出水面

随着马竞2-0掀翻巴萨，利物浦溃败，欧冠四强席位基本浮出水面

阿心文史

2026-04-09 06:01:17

字节漫游指南

有态度网友ytd

1254文章数 15关注度

往期回顾全部

科技要闻

造出地表最强AI，却死活不给你用！

头条要闻

特朗普认为北约未通过“考验” 将考虑“退群”

头条要闻

特朗普认为北约未通过“考验” 将考虑“退群”

体育要闻

40岁，但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假，一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶华境S是懂家庭的大六座

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

健康

亲子

本地

游戏

50岁，我妈在恋综抢男人

干细胞抗衰4大误区,90%的人都中招

亲子要闻

胡图图说他差几分就能兑换发卡

本地新闻

跟着歌声游安徽，听古村回响

曝《腐烂国度3》内部测试好玩的很简直不可思议！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版