网易首页 > 网易号 > 正文 申请入驻

比英伟达H100快90%!最强大模型AI芯片来了,首搭141GB HBM3e

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

作者 | 程茜
编辑 | 心缘

智东西11月14日消息,昨日晚间,英伟达在国际超算大会SC23上宣布推出新一代AI计算平台NVIDIA HGX H200

H200 GPU重点升级如下:

跑70B Llama 2,推理速度比H100快90%

跑175B GPT-3,推理速度比H100快60%

首撘141GB HBM3e,是H100显存容量的近1.8倍;带宽4.8TB/s,是H100带宽的1.4倍

2024年第二季度发货

▲H200完整参数表

需注意的是,虽然都是“200”,但与此前英伟达发布的GH200 Grace Hopper超级芯片不同,GH200是英伟达Grace CPU与H100 GPU的组合版,而H200是新一代GPU芯片,为大模型与生成式AI而设计,因此相比H100主要优化的是显存和带宽算力则与H100基本持平

一、内置全球最快内存,大模型推理成本大降

HGX H200支持NVIDIA NVLink和NVSwitch高速互连,可支持超过1750亿参数规模模型的训练和推理,相比于H100,H200的性能提升了60%到90%。英伟达高性能计算和超大规模数据中心业务副总裁Ian Buck将其描述为“世界领先的AI计算平台”。

这也是首款内置全球最快内存HBM3e的GPU,英伟达的新闻稿写道,GPT-3的推理表现中,H100的性能比A100提高了11倍,H200 Tensor Core GPU的性能比A100提高到了18倍

Buck称,英伟达将在未来几个月内继续增强H100和H200的性能,2024年发布的新一代旗舰AI芯片B100将继续突破性能与效率的极限。

在生成式AI基准测试中,H200 Tensor Core GPU每秒在Llama2-13B大型语言模型上每秒快速通过1.2万个tokens。

在HBM3e的助攻下,NVIDIA H200能以每秒4.8TB的速度提供141GB内存,与NVIDIA A100相比,容量几乎翻倍,且带宽增加了2.4倍

二、兼容H100,明年第二季度开始供货

英伟达还展示了一个服务器平台,可以通过NVIDIA NVLink互连连接四个NVIDIA GH200 Grace Hopper超级芯片,其具有四路和八路配置。

其中,四路配置在单个计算节点中配备了多达288个Arm Neoverse内核和16PetaFLOPS的AI性能,以及高达2.3TB的高速内存。

八路配置的HGX H200提供超过32PetaFLOPS的FP8深度学习计算和1.1TB聚合高带宽内存,可在生成式AI和HPC应用中实现最高性能。

当与具有超快NVLink-C2C互连的NVIDIA Grace CPU配合使用时,H200还创建了带有HBM3e的GH200 Grace Hopper超级芯片,这是可以服务于大规模HPC和AI应用的集成模块。

这些服务器主板与HGX H100系统的硬件和软件兼容。它还可用于英伟达8月份发布的采用HBM3e的新一代NVIDIA GH200 Grace Hopper超级芯片中。

基于此,H200可以部署在各种类型的数据中心中,包括本地、云、混合云和边缘。包括华硕、戴尔科技、惠普等在内的英伟达全球生态系统合作伙伴服务器制造商也可以使用H200更新其现有系统。

H200将于2024年第二季度开始向全球系统制造商和云服务提供商供货。

除了AI算力和云服务公司CoreWeave、亚马逊无服务器计算服务Lambda和云平台Vultr之外,AWS、谷歌云、微软Azure和甲骨文云将从明年开始成为首批部署基于H200实例的云服务提供商。

三、全球TOP 500超算榜,基于英伟达技术的系统达379个

此外,基于10月英伟达发布的TensorRT-LLM开源库,英伟达GH200超级芯片的速度是双插槽x86 CPU系统的110倍,能效是x86 CPU + H100 GPU服务器的近2倍

在全球TOP 500超算榜中,得益于由NVIDIA H100 Tensor Core GPU提供支持的新系统,英伟达在这些系统中提供了超过2.5ExaFLOPS的HPC性能,高于5月份排名中的1.6ExaFLOPS。

同时,新的全球TOP 500超算榜名单中包含了有史以来使用英伟达技术数量最多的系统为379个,而5月份的榜单中为372个,其中还包括了38台超级计算机

英伟达加速计算平台还提供了强大的软件工具支持,能使开发人员和企业构建和加速从AI到HPC的生产就绪型应用程序,其中包括用于语音、推荐系统和超大规模推理等工作负载的NVIDIA AI Enterprise软件套件。

结语:围绕大模型核心痛点,剑指加速计算需求

生成式AI催生的大量加速计算需求仍然在不断增长,大模型开发和部署带来的算力需求也成为企业的核心痛点,性能更强的AI芯片仍然是当下大模型企业竞争的重点之一。

如今,英伟达再次围绕着生成式AI的开发和部署甩出了一系列硬件基础设施和软件工具,帮助企业突破大模型开发和部署的核心痛点,并且通过在数值、稀疏性、互联、内存带宽等方面的革新,不断巩固其在AI时代的霸主地位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
电脑涨疯了,连卖电脑的都劝你别买

电脑涨疯了,连卖电脑的都劝你别买

辉哥说动漫
2026-07-05 20:37:44
一夜3次!四川绵竹连续发生地震,暗藏什么?地磁场曾24小时异常

一夜3次!四川绵竹连续发生地震,暗藏什么?地磁场曾24小时异常

八戒说科学
2026-07-06 01:36:35
“台独记者”范琪斐,狂黑大陆几十年,亲赴大陆后下场大快人心

“台独记者”范琪斐,狂黑大陆几十年,亲赴大陆后下场大快人心

阿郎娱乐
2026-07-04 06:22:27
1995年看露天电影时,邻家嫂子偷偷摸了一下我的手,示意我跟她走

1995年看露天电影时,邻家嫂子偷偷摸了一下我的手,示意我跟她走

千秋文化
2026-07-02 19:32:08
前挪威国脚:我认为挪威有概率击败巴西,因为球队比98年更强了

前挪威国脚:我认为挪威有概率击败巴西,因为球队比98年更强了

懂球帝
2026-07-06 02:35:09
7闺蜜众筹70万开咖啡馆  4个月后从“七仙女”变成“战国七雄”

7闺蜜众筹70万开咖啡馆 4个月后从“七仙女”变成“战国七雄”

尘埃里的看客
2026-06-28 10:42:41
美媒评10大最被低估签约!火箭续签伊森在列 76人太阳均两度上榜

美媒评10大最被低估签约!火箭续签伊森在列 76人太阳均两度上榜

罗说NBA
2026-07-05 21:43:42
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
歌手2026第七期帮唱嘉宾出炉,阵容离谱!网友:请不到人就别办

歌手2026第七期帮唱嘉宾出炉,阵容离谱!网友:请不到人就别办

星宿影视鸭
2026-07-03 14:29:23
一家3代短命!蔡磊处境曝光,斥资续命收效甚微,儿子也成牺牲品

一家3代短命!蔡磊处境曝光,斥资续命收效甚微,儿子也成牺牲品

周哥一影视
2026-07-04 20:40:16
1931年,周恩来带人处决叛徒顾顺章家人,放过仨小孩,却酿成祸患

1931年,周恩来带人处决叛徒顾顺章家人,放过仨小孩,却酿成祸患

阿胡
2024-07-31 11:50:32
4种中国式大妈发型:“自以为时髦,实际油腻显老”,看看是你吗

4种中国式大妈发型:“自以为时髦,实际油腻显老”,看看是你吗

白宸侃片
2026-07-05 00:26:23
西安严鹏追悼仪式曝光:现场全是花圈,外地网友送千束菊花

西安严鹏追悼仪式曝光:现场全是花圈,外地网友送千束菊花

娱乐圈圈圆
2026-07-05 13:27:55
“先把车费结了再哭”,一句话让1548万人破防

“先把车费结了再哭”,一句话让1548万人破防

阿振观点
2026-07-06 03:18:30
巴蒂:劳塔罗、小蜘蛛都是世界级前锋,很难在其中选择一人

巴蒂:劳塔罗、小蜘蛛都是世界级前锋,很难在其中选择一人

天光破云来
2026-07-05 17:13:10
美股指期货开盘上涨,标普500指数期货开盘涨0.4%

美股指期货开盘上涨,标普500指数期货开盘涨0.4%

每日经济新闻
2026-07-06 06:09:05
喜事将近?霍家正式官宣!让香港四大家族刮目相看,郭晶晶说对了

喜事将近?霍家正式官宣!让香港四大家族刮目相看,郭晶晶说对了

天天热点见闻
2026-07-05 08:55:05
金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

赴一场山海啊
2026-07-03 00:59:33
中吉乌铁路加紧建设,线路图铺开一看,哈萨克斯坦被绕得干干净净

中吉乌铁路加紧建设,线路图铺开一看,哈萨克斯坦被绕得干干净净

雅儿姐在遛弯
2026-05-16 16:17:07
把意大利踢出局,2-1淘汰巴西!这支北欧弱旅,正在颠覆世界杯

把意大利踢出局,2-1淘汰巴西!这支北欧弱旅,正在颠覆世界杯

萌兰聊个球
2026-07-06 06:52:02
2026-07-06 07:40:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12176文章数 117121关注度
往期回顾 全部

数码要闻

iOS 27提前泄露带摄像头AirPods:苹果无线耳机解锁全新玩法

头条要闻

男子为救3岁儿童变成植物人 妻子咬丈夫脚趾将其唤醒

头条要闻

男子为救3岁儿童变成植物人 妻子咬丈夫脚趾将其唤醒

体育要闻

哈兰德绝杀巴西:效率恶魔,吃人不眨眼

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

时尚
本地
游戏
房产
数码

3年赚46亿,杨幂喊出一个安徽富豪

本地新闻

国内足球之旅?这座小城给你高分答案

顽皮狗光头女主新作不输《美末》?听名字就高端吗

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

数码要闻

10999元 机械革命耀世18 Pro上新:Ultra 7 251HX、RTX5060

无障碍浏览 进入关怀版