网易首页 > 网易号 > 正文 申请入驻

比英伟达H100快90%!最强大模型AI芯片来了,首搭141GB HBM3e

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

作者 | 程茜
编辑 | 心缘

智东西11月14日消息,昨日晚间,英伟达在国际超算大会SC23上宣布推出新一代AI计算平台NVIDIA HGX H200

H200 GPU重点升级如下:

跑70B Llama 2,推理速度比H100快90%

跑175B GPT-3,推理速度比H100快60%

首撘141GB HBM3e,是H100显存容量的近1.8倍;带宽4.8TB/s,是H100带宽的1.4倍

2024年第二季度发货

▲H200完整参数表

需注意的是,虽然都是“200”,但与此前英伟达发布的GH200 Grace Hopper超级芯片不同,GH200是英伟达Grace CPU与H100 GPU的组合版,而H200是新一代GPU芯片,为大模型与生成式AI而设计,因此相比H100主要优化的是显存和带宽算力则与H100基本持平

一、内置全球最快内存,大模型推理成本大降

HGX H200支持NVIDIA NVLink和NVSwitch高速互连,可支持超过1750亿参数规模模型的训练和推理,相比于H100,H200的性能提升了60%到90%。英伟达高性能计算和超大规模数据中心业务副总裁Ian Buck将其描述为“世界领先的AI计算平台”。

这也是首款内置全球最快内存HBM3e的GPU,英伟达的新闻稿写道,GPT-3的推理表现中,H100的性能比A100提高了11倍,H200 Tensor Core GPU的性能比A100提高到了18倍

Buck称,英伟达将在未来几个月内继续增强H100和H200的性能,2024年发布的新一代旗舰AI芯片B100将继续突破性能与效率的极限。

在生成式AI基准测试中,H200 Tensor Core GPU每秒在Llama2-13B大型语言模型上每秒快速通过1.2万个tokens。

在HBM3e的助攻下,NVIDIA H200能以每秒4.8TB的速度提供141GB内存,与NVIDIA A100相比,容量几乎翻倍,且带宽增加了2.4倍

二、兼容H100,明年第二季度开始供货

英伟达还展示了一个服务器平台,可以通过NVIDIA NVLink互连连接四个NVIDIA GH200 Grace Hopper超级芯片,其具有四路和八路配置。

其中,四路配置在单个计算节点中配备了多达288个Arm Neoverse内核和16PetaFLOPS的AI性能,以及高达2.3TB的高速内存。

八路配置的HGX H200提供超过32PetaFLOPS的FP8深度学习计算和1.1TB聚合高带宽内存,可在生成式AI和HPC应用中实现最高性能。

当与具有超快NVLink-C2C互连的NVIDIA Grace CPU配合使用时,H200还创建了带有HBM3e的GH200 Grace Hopper超级芯片,这是可以服务于大规模HPC和AI应用的集成模块。

这些服务器主板与HGX H100系统的硬件和软件兼容。它还可用于英伟达8月份发布的采用HBM3e的新一代NVIDIA GH200 Grace Hopper超级芯片中。

基于此,H200可以部署在各种类型的数据中心中,包括本地、云、混合云和边缘。包括华硕、戴尔科技、惠普等在内的英伟达全球生态系统合作伙伴服务器制造商也可以使用H200更新其现有系统。

H200将于2024年第二季度开始向全球系统制造商和云服务提供商供货。

除了AI算力和云服务公司CoreWeave、亚马逊无服务器计算服务Lambda和云平台Vultr之外,AWS、谷歌云、微软Azure和甲骨文云将从明年开始成为首批部署基于H200实例的云服务提供商。

三、全球TOP 500超算榜,基于英伟达技术的系统达379个

此外,基于10月英伟达发布的TensorRT-LLM开源库,英伟达GH200超级芯片的速度是双插槽x86 CPU系统的110倍,能效是x86 CPU + H100 GPU服务器的近2倍

在全球TOP 500超算榜中,得益于由NVIDIA H100 Tensor Core GPU提供支持的新系统,英伟达在这些系统中提供了超过2.5ExaFLOPS的HPC性能,高于5月份排名中的1.6ExaFLOPS。

同时,新的全球TOP 500超算榜名单中包含了有史以来使用英伟达技术数量最多的系统为379个,而5月份的榜单中为372个,其中还包括了38台超级计算机

英伟达加速计算平台还提供了强大的软件工具支持,能使开发人员和企业构建和加速从AI到HPC的生产就绪型应用程序,其中包括用于语音、推荐系统和超大规模推理等工作负载的NVIDIA AI Enterprise软件套件。

结语:围绕大模型核心痛点,剑指加速计算需求

生成式AI催生的大量加速计算需求仍然在不断增长,大模型开发和部署带来的算力需求也成为企业的核心痛点,性能更强的AI芯片仍然是当下大模型企业竞争的重点之一。

如今,英伟达再次围绕着生成式AI的开发和部署甩出了一系列硬件基础设施和软件工具,帮助企业突破大模型开发和部署的核心痛点,并且通过在数值、稀疏性、互联、内存带宽等方面的革新,不断巩固其在AI时代的霸主地位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

澎湃新闻
2026-04-26 12:32:27
37岁男篮传奇人物:定居广东,身居要职财富自由,娶娇妻生双胞胎

37岁男篮传奇人物:定居广东,身居要职财富自由,娶娇妻生双胞胎

寻墨阁
2026-04-26 01:21:55
2.4亿顶薪打没了!季后赛场均9+8,不像魔兽霍华德,更像小乔丹

2.4亿顶薪打没了!季后赛场均9+8,不像魔兽霍华德,更像小乔丹

你的篮球频道
2026-04-26 08:17:48
上海人终于体会到了引进印度人的“快乐”!

上海人终于体会到了引进印度人的“快乐”!

步论天下事
2026-04-25 09:34:47
一旦武统台湾,这4个台湾人必上“斩首”名单,一个都跑不掉!

一旦武统台湾,这4个台湾人必上“斩首”名单,一个都跑不掉!

混沌录
2026-04-23 21:14:04
首组2-2!尼克斯大胜老鹰进天王山 唐斯20+10+10布伦森19分

首组2-2!尼克斯大胜老鹰进天王山 唐斯20+10+10布伦森19分

醉卧浮生
2026-04-26 08:52:23
河北一女子称用轮椅推患病亲人到银行取钱被拒:急需入院治疗,人都快没气了;银行致歉

河北一女子称用轮椅推患病亲人到银行取钱被拒:急需入院治疗,人都快没气了;银行致歉

大象新闻
2026-04-25 21:45:03
森林狼3比1掘金:逆境中杀出了多孙穆?!

森林狼3比1掘金:逆境中杀出了多孙穆?!

张佳玮写字的地方
2026-04-26 12:02:17
男子带9岁儿子到广州一酒店泡温泉碰到两条蛇,酒店回应

男子带9岁儿子到广州一酒店泡温泉碰到两条蛇,酒店回应

潇湘晨报
2026-04-26 13:36:00
两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

大象新闻
2026-04-24 16:49:09
特朗普:美国总统是危险职业 不想生活在恐惧之中

特朗普:美国总统是危险职业 不想生活在恐惧之中

财联社
2026-04-26 12:16:05
交警提醒:5月开始全国严查,这些行为一律扣分罚款,车主别大意

交警提醒:5月开始全国严查,这些行为一律扣分罚款,车主别大意

复转这些年
2026-04-25 23:39:55
62岁单身大爷坦言:晚年搭伙两次后才明白,原来女人都是一个德行

62岁单身大爷坦言:晚年搭伙两次后才明白,原来女人都是一个德行

惟来
2026-04-25 13:00:17
玩什么?!火箭今天停掉所有训练!

玩什么?!火箭今天停掉所有训练!

柚子说球
2026-04-26 09:57:07
“两万名海面上的‘活靶子’,随时可能被炸成灰烬”

“两万名海面上的‘活靶子’,随时可能被炸成灰烬”

中国新闻周刊
2026-04-26 07:26:10
天涯神贴之东三省人口持续流出的真正原因

天涯神贴之东三省人口持续流出的真正原因

回旋镖
2026-04-26 13:42:15
赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

齐鲁壹点
2026-04-26 07:18:18
确诊癌症别先住院!先去政务中心,50万费用只花2万多

确诊癌症别先住院!先去政务中心,50万费用只花2万多

苗苗情感说
2026-04-25 21:52:52
伊朗政权秋后算账,绞死更多抗议者

伊朗政权秋后算账,绞死更多抗议者

一种观点
2026-04-25 19:08:26
突发!A股前董事长疑涉美国性侵丑闻

突发!A股前董事长疑涉美国性侵丑闻

凤凰网财经
2026-04-26 11:09:13
2026-04-26 15:31:01
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11687文章数 117047关注度
往期回顾 全部

数码要闻

电视反光严重怎么办?华为智慧屏 S7 Pro展现低反光硬核实力

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

旅游
教育
房产
家居
数码

旅游要闻

下一站|一天体验越南三大特色

教育要闻

麻省理工公开课19:吉尔伯特教授线性代数课-

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

家居要闻

自然肌理 温润美学

数码要闻

小米截至2025年底全球授权专利超4.5万项 智能座舱专利中国第一

无障碍浏览 进入关怀版