网易首页 > 网易号 > 正文 申请入驻

Kimi K2模型测试:英伟达GB200 NVL72性能较HGX 200提升10倍

0
分享至

IT之家 12 月 4 日消息,科技媒体 Wccftech 昨日(12 月 3 日)发布博文,报道称在“混合专家”模型上,英伟达的 GB200 NVL72 AI 服务器取得重大性能突破。

基于开源大语言模型 Kimi K2 Thinking、Deepseek-R1-0528、Mistral Large 3 测试,相比上一代 Hopper HGX 200 性能提升 10 倍。




IT之家注:混合专家模型(MoE)是一种高效的 AI 大模型架构。它不像传统模型那样在处理每个任务时都动用全部“脑力”(参数),而是像一个专家团队,根据任务类型只激活一小部分最相关的“专家”(参数子集)来解决问题。这样做能显著降低计算成本,提高处理速度。


就像人脑使用特定区域执行不同任务一样,混合专家模型使用路由器来选择最相关的专家来生成每个 token。


自 2025 年初以来,几乎所有领先的前沿模型都采用 MoE 设计

英伟达为了解决 MoE 模型扩展时遇到的性能瓶颈,采用了“协同设计”(co-design)的策略,该方法整合了 GB200 的 72 芯片配置、高达 30TB 的快速共享内存、第二代 Transformer 引擎以及第五代 NVLink 高速互联技术。

通过这些技术的协同工作,系统能够高效地将 Token 批次拆分并分配到各个 GPU,同时以非线性速率提升通信量,从而将专家并行计算(expert parallelism)提升至全新水平,最终实现了性能的巨大飞跃。

除了硬件层面的协同设计,英伟达还实施了多项全栈优化措施来提升 MoE 模型的推理性能。例如,NVIDIA Dynamo 框架通过将预填充(prefill)和解码(decode)任务分配给不同的 GPU,实现了任务的解耦服务,允许解码阶段以大规模专家并行方式运行。


同时,系统还采用了 NVFP4 格式,这种数据格式在保持计算精度的同时,进一步提高了性能和效率,确保了整个 AI 计算流程的高效稳定。

该媒体指出,此次 GB200 NVL72 取得的性能突破,对英伟达及其合作伙伴具有重要意义。这一进展成功克服了 MoE 模型在扩展时面临的计算瓶颈,从而能够满足日益增长的 AI 算力需求,并巩固了英伟达在 AI 服务器市场的领先地位。



GB200 NVL72,图源:英伟达

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这算不算是顶级阳谋?修建厦金大桥台当局不同意,我们是照修不误

这算不算是顶级阳谋?修建厦金大桥台当局不同意,我们是照修不误

百态人间
2026-01-29 16:04:26
随着四川女篮4分险胜山东!WCBA常规赛结束:山西排第1,东莞第2

随着四川女篮4分险胜山东!WCBA常规赛结束:山西排第1,东莞第2

足球评论qs
2026-02-01 21:33:20
党毅飞立大功,淘汰韩世界冠军,8强中韩7:1,独苗申真谞遭中国包夹

党毅飞立大功,淘汰韩世界冠军,8强中韩7:1,独苗申真谞遭中国包夹

L76号
2026-02-02 10:04:00
2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

你食不食油饼
2026-01-11 06:41:42
广东一男子边打电话边看孩子,女儿在人行道上被撞伤,母亲看完监控退回车主500元赔偿:是爸爸监护不力,和他电话微信互相拉黑

广东一男子边打电话边看孩子,女儿在人行道上被撞伤,母亲看完监控退回车主500元赔偿:是爸爸监护不力,和他电话微信互相拉黑

大象新闻
2026-02-01 00:13:32
鱼的生长周期好像也没多长时间,为啥长江禁渔要长达10年?

鱼的生长周期好像也没多长时间,为啥长江禁渔要长达10年?

向航说
2026-01-18 00:50:03
口交不入刑,教材当废纸:丹阳案背后的黑色幽默

口交不入刑,教材当废纸:丹阳案背后的黑色幽默

有戏
2025-09-17 17:48:36
烤匠上海首店开业排队近4000桌最长等位13小时

烤匠上海首店开业排队近4000桌最长等位13小时

界面新闻
2026-02-02 10:17:03
詹姆斯22+6,东契奇30+15+8+5记3分创纪录,湖人不敌尼克斯

詹姆斯22+6,东契奇30+15+8+5记3分创纪录,湖人不敌尼克斯

一将篮球
2026-02-02 11:10:54
狄龙爆料当年曾差点去勇士 在库里身边他能达成如今的成就吗?

狄龙爆料当年曾差点去勇士 在库里身边他能达成如今的成就吗?

仰卧撑FTUer
2026-02-02 10:36:02
著名演员谭凯卖掉北京房产、注销北京户口,回青岛开一家饺子馆

著名演员谭凯卖掉北京房产、注销北京户口,回青岛开一家饺子馆

阿雹娱乐
2026-01-22 14:20:50
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
人口告别世界第一?二孩催生无效后,国家终于向住房出手了

人口告别世界第一?二孩催生无效后,国家终于向住房出手了

来科点谱
2026-01-13 08:54:22
牢A曝光“陪读妈妈”其实比女儿更危险,因为妈妈经历的更多

牢A曝光“陪读妈妈”其实比女儿更危险,因为妈妈经历的更多

静若梨花
2026-01-27 15:41:03
名垂青史,骑士丹尼斯·施罗德生涯第8次交易,刷新NBA历史纪录

名垂青史,骑士丹尼斯·施罗德生涯第8次交易,刷新NBA历史纪录

好火子
2026-02-01 23:53:53
苹果官网偷偷改版,这个购买页面已经消失了!

苹果官网偷偷改版,这个购买页面已经消失了!

XCiOS俱乐部
2026-02-01 10:48:57
委内瑞拉向美国供应石油,加拿大这才发现,自己是最大受害者

委内瑞拉向美国供应石油,加拿大这才发现,自己是最大受害者

碳基生物关怀组织
2026-01-18 22:55:02
武汉市应急管理局通报龙门吊倒塌事故

武汉市应急管理局通报龙门吊倒塌事故

每日经济新闻
2026-02-01 21:45:01
2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

忠于法纪
2026-01-20 18:30:40
【深度】中国财团亏损数亿美元,英国芯片FTDI 跨国并购何以崩盘?

【深度】中国财团亏损数亿美元,英国芯片FTDI 跨国并购何以崩盘?

界面新闻
2026-02-02 10:22:07
2026-02-02 12:08:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
327635文章数 606964关注度
往期回顾 全部

科技要闻

元宝发10亿红包,阿里千问:我跟30亿

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

亲子
本地
时尚
教育
公开课

亲子要闻

情绪稳定的姐姐,不哭不闹的弟弟,好温馨好幸福的家

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

教育要闻

牛津荣登榜首!2026QS欧洲大学排名公布!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版