网易首页 > 网易号 > 正文 申请入驻

华为 Ascend 950 VS Nvidia H200 与 AMD MI300:谁才是AI领域的王者?

0
分享至

近年来,AI 训练和推理计算的需求促使芯片制造商积极创新——内存带宽、数据格式、互连和总计算输出的效率,如今与原始 FLOPS 同样重要。

各家公司都瞄准了生成式 AI 训练和高性能计算等高要求场景,在这些场景下,AI 工具 越来越依赖快速加速器来处理海量数据。

不同品牌以各自的计算平台特性应对这一挑战——我们希望帮助大家理解这些差异,并澄清 Ascend 950 系列、H200 和 MI300 Instinct 的比较。

华为 Ascend 950、Nvidia H200 和 AMD MI300 Instinct 比较

类别

华为 Ascend 950DT

NVIDIA H200

AMD Radeon Instinct MI300

芯片系列/名称

Ascend 950 系列

H200 (GH100, Hopper)

Radeon Instinct MI300 (Aqua Vanjaram)

架构

华为专有 AI 加速器

Hopper GPU 架构

CDNA 3.0

工艺/制造厂

尚未公开确认

5 纳米 (台积电)

5 纳米 (台积电)

晶体管

未公开

80 亿

1530 亿

芯片尺寸

未公开

814 mm²

1017 mm²

优化

解码阶段的推理和模型训练

通用人工智能和高性能计算的加速

人工智能和高性能计算的加速

支持的格式有

FP8, MXFP8, MXFP4, HiF8

FP16, FP32, FP64(通过 Tensor/CUDA 核心实现)

FP16, FP32, FP64

最高性能

1 PFLOPS(FP8、MXFP8、HiF8),2 PFLOPS(MXFP4)

FP16:241.3 TFLOPS,FP32:60.3 TFLOPS,FP64:30.2 TFLOPS

FP16:383 TFLOPS,FP32/FP64:47.87 TFLOPS

向量处理

SIMD + SIMT 混合,128 字节内存访问粒度

使用 CUDA 和 Tensor 核心的 SIMT

SIMT + 矩阵/张量核心

内存类型

HiZQ 2.0 专有的 HBM(用于解码和训练的变体)

HBM3e

HBM3

内存容量为

144 GB

141 GB

128 GB

内存带宽

4 TB/s(每秒)

4.89 TB/s(每秒)

6.55 TB/s(每秒)

内存总线宽度

未提供

6144位

8192位

L2缓存

未提供

50 MB

未提供

互连带宽

2 TB/s

未提供

未提供

形态因素

卡,SuperPoD(服务器)

PCIe 5.0 x16(仅限服务器/HPC)

PCIe 5.0 x16(计算卡)

基础时钟/提升时钟

未提供

1365 / 1785 MHz

1000 / 1700 MHz

核心数/着色器数

未指定

CUDA: 16,896, Tensor: 528 (第4代)

14,080着色器,220计算单元,880张量核心

功率 (TDP)

未指定

600 W

600 W

总线接口

未指定

PCIe 5.0 x16

PCIe 5.0 x16

输出

无输出 (服务器使用)

无输出 (仅适用于服务器/HPC)

无输出 (计算卡片)

目标场景

大规模训练与解码推理 (LLMs,生成型AI)

AI 训练,HPC,数据中心

AI/HPC 计算加速

发布与可用性

2026 年第四季度

2024 年 11 月 18 日

2023 年 1 月 4 日

架构和设计方法

华为的 Ascend 950 系列是一种专有的 AI 加速器架构,针对推理的解码阶段以及模型训练进行了优化,而非传统的GPU。

其设计融合了 SIMD 和 SIMT 处理风格,具有 128 字节的内存访问粒度,旨在兼顾吞吐量和灵活性。

Nvidia的H200基于Hopper GPU架构,集成了16,896个CUDA核心和528个第四代Tensor核心。

它采用单芯片的GH100 GPU,使用5纳米的TSMC工艺制造,确保与Nvidia的软件栈和广泛的生态系统兼容。

AMD的MI300 Instinct使用Aqua Vanjaram GPU,基于CDNA 3.0架构,采用芯片级MCM设计,配备220个计算单元和880个矩阵核心。

这种设计提供了巨大的晶体管预算,并专注于高性能计算。

Ascend 950在使用FP8、MXFP8或HiF8数据格式时,峰值性能为1 petaflop,而使用MXFP4时可翻倍至2 petaflops。

这突显了华为对新兴低精度格式的重视,旨在提高推理过程的效率,同时不牺牲准确性。

Nvidia的H200在FP16下提供241.3 teraflops,在FP32下提供60.3 teraflops,而AMD的MI300在FP16下提供383 teraflops,FP32和FP64工作负载下接近48 teraflops。

MI300在FP64与FP32的平价,强调了其在科学计算中的适用性,双精度在此至关重要,而Nvidia则更侧重于AI的混合精度加速。

内存架构对大型语言模型的训练影响很大。

华为将Ascend 950配备144GB的HiZQ 2.0专有HBM,提供4TB/s的带宽和2TB/s的互连速度。

Nvidia为H200配备了141GB的HBM3e内存和4.89TB/s的带宽,略微领先于原始吞吐量。

AMD的MI300以128GB的HBM3脱颖而出,配备更宽的8192位总线和领先的6.55TB/s内存带宽。

在大规模模型训练或内存密集型仿真中,AMD在带宽上的优势可以转化为更快的数据移动,尽管其总内存容量不及华为。

H200和MI300的热设计功耗均为600W,适合无视频输出的PCIe 5.0 x16服务器配置,突显了它们的数据中心导向。

华为尚未披露官方的TDP数据,但提供了两种卡格式和集成的SuperPoD服务器,暗示其在AI基础设施解决方案中的部署灵活性。

其2TB/s的互连带宽可能是多芯片扩展在数据中心环境中的一个重要因素,尽管关于芯片尺寸和晶体管数量的细节仍未公开。

Nvidia得益于成熟的NVLink和InfiniBand生态系统,而AMD的多芯片模块设计则旨在减少计算芯片之间的延迟。

华为显然将Ascend 950瞄准大规模训练和生成AI的解码阶段推理,这是Nvidia长期占据的市场。

其预计在2026年第四季度可用,这意味着Nvidia的H200(于2024年末发布)和AMD的MI300(自2023年初以来可用)已经占据了时间优势。

当Ascend 950硬件到达客户时,两个竞争对手可能已经对其平台进行了更新。

不过,华为对高效低精度格式的重视,以及与其网络硬件的紧密集成,可能会吸引那些寻求替代美国供应商的买家。

换句话说,这些加速器反映了不同品牌的理念差异。

AMD优先考虑内存带宽和双精度在HPC工作负载中的优势,而Nvidia则利用成熟的生态系统和软件支持来维持在AI训练中的主导地位。

华为则试图通过强劲的FP8级性能和高容量的专有内存来挑战这两者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
18岁巴伦新亮相,黄金单身汉形象崩塌,小肚腩五官引讨论

18岁巴伦新亮相,黄金单身汉形象崩塌,小肚腩五官引讨论

超喜欢我
2026-01-03 08:22:02
57岁传奇数学家放弃终身教职后,竟选择为00后中国女孩打工?

57岁传奇数学家放弃终身教职后,竟选择为00后中国女孩打工?

新民周刊
2026-01-01 18:21:55
登基两年即猝死,周武王姬发灭商后的抑郁真相,远比你想象的沉重

登基两年即猝死,周武王姬发灭商后的抑郁真相,远比你想象的沉重

历史人文2
2026-01-02 12:56:38
中国为何按兵不动?一旦卷入战争,无国可为中国兜底!

中国为何按兵不动?一旦卷入战争,无国可为中国兜底!

文雅笔墨
2026-01-01 05:32:43
李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

荆楚寰宇文枢
2025-12-31 21:55:47
火箭队豪取4连胜!一口气迎6大喜讯:杜兰特破纪录+申京主动蜕变

火箭队豪取4连胜!一口气迎6大喜讯:杜兰特破纪录+申京主动蜕变

锅子篮球
2026-01-02 11:02:29
中大型SUV年度冠军之争:第一名基本能确定,年销量已突破15万台

中大型SUV年度冠军之争:第一名基本能确定,年销量已突破15万台

柳先说
2026-01-02 20:31:17
人民日报:真正的教育,是别让孩子从小过得“太顺” | 精选

人民日报:真正的教育,是别让孩子从小过得“太顺” | 精选

新东方家庭教育
2025-12-31 11:28:49
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
国乒教练竞聘结束!王励勤动真格,3位新人上任,王楚钦传好消息

国乒教练竞聘结束!王励勤动真格,3位新人上任,王楚钦传好消息

华史谈
2026-01-03 07:40:39
钱再多有什么用,64岁郎平如今的现状,给所有运动员们提了个醒

钱再多有什么用,64岁郎平如今的现状,给所有运动员们提了个醒

削桐作琴
2025-12-10 16:53:18
成都新能源汽车车主 路边停车“免费2小时”优惠政策已失效

成都新能源汽车车主 路边停车“免费2小时”优惠政策已失效

爱看头条
2026-01-02 09:47:03
记者:恩瓦内里或外租,斯凯利留队!阿尔特塔:表现比轮换重要!

记者:恩瓦内里或外租,斯凯利留队!阿尔特塔:表现比轮换重要!

足球侦探
2026-01-03 08:30:03
广东3消息!徐杰深夜发声,萨姆纳霸气回应,崔永熙复出时间确定

广东3消息!徐杰深夜发声,萨姆纳霸气回应,崔永熙复出时间确定

多特体育说
2026-01-02 07:20:03
停播7年,那个挽救无数司机的“网红交警”谭乔,却挽救不了自己

停播7年,那个挽救无数司机的“网红交警”谭乔,却挽救不了自己

以茶带书
2025-12-18 17:14:01
长春“唐僧”拒签合同!新合同砍至8万还想抢账号?

长春“唐僧”拒签合同!新合同砍至8万还想抢账号?

失宠的小野猪
2026-01-02 20:23:06
旷世奇案,只此一件

旷世奇案,只此一件

我是历史其实挺有趣
2025-12-24 10:42:04
宁愿孩子不上大学?家长的清醒发言,撕开了当代教育焦虑的遮羞布

宁愿孩子不上大学?家长的清醒发言,撕开了当代教育焦虑的遮羞布

青苹果sht
2026-01-03 05:36:57
曼联中场救星来了!20万 周薪全能王迫切加盟,补B 费伤缺漏洞

曼联中场救星来了!20万 周薪全能王迫切加盟,补B 费伤缺漏洞

奶盖熊本熊
2026-01-03 01:05:54
杜兰特工资3158万美元NBA第一,库里缩水最严重跌第5

杜兰特工资3158万美元NBA第一,库里缩水最严重跌第5

大眼瞄世界
2026-01-02 14:02:32
2026-01-03 09:52:49
智慧生活笔记
智慧生活笔记
分享生活小妙招、实用技巧和所见所得,让生活更简单更有趣。
604文章数 2998关注度
往期回顾 全部

数码要闻

Pebble推出Round 2手表:搭载彩色E-ink屏幕,无心率传感器设计

头条要闻

牛弹琴:伊朗面临40年来最严峻挑战 不是一个好兆头

头条要闻

牛弹琴:伊朗面临40年来最严峻挑战 不是一个好兆头

体育要闻

快船似乎又行了

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

人工智能四问:投资泡沫出现了吗?

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

汽车要闻

方程豹全年销量超23.4万辆 同比暴增316.1%

态度原创

亲子
时尚
本地
家居
公开课

亲子要闻

今天宝贝十周岁生日,我要让快乐永远把你包围!

上年纪的女人别乱买衣服!有这3件单品就够了,温暖体面一冬

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

家居要闻

无形有行 自然与灵感诗意

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版