网易首页 > 网易号 > 正文 申请入驻

英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍

0
分享至

在 Hot Chips 34 大会期间,英特尔再次详细介绍了 Sapphire Rapids HBM 处理器 + Ponte Vecchio(2-Stack)GPU 平台的潜力,称该服务器平台的性能可达英伟达 A100 竞品的 2.5 倍。英特尔首席 GPU 计算架构师 Hong Jiang 在演讲中指出,Ponte Vecchio 具有三种配置。

(via WCCFTech)

从单一 OAM、到配备 Xe Links 的 x4 子系统,Ponte Vecchio GPU 不仅能够单独运行、也可部署于 Sapphire Rapids 双路服务器平台之上。

其中 OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑,辅以英特尔 oneAPI 软件堆栈。

作为一个零级(Level Zero)API,其为跨架构编程支持提供了低层级的硬件接口。

oneAPI 主要特性如下:

● 提供面向其它工具和加速器设备的接口; ● 支持精细的增益控制、以及低延迟的加速器特性; ● 具有多线程设计; ● 将 GPU 作为驱动程序的一部分而提供。

性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置),可提供高达 52 TFLOP 的 FP64 / FP32 算力。

另有 419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP 的 BF16 / FP16,以及 1678 TFLOPs 的 INT8 算力。

英特尔还详细说明了 Ponte Vecchio 的缓存大小 / 峰值带宽 —— 比如 GPU 上的寄存器为 64 MB,提供 419 TB/s 的带宽。

L1 缓存也为 64 MB,带宽 105 TB/s(4:1)。L2 缓存为 408 MB,带宽 13 TB/s(8:1)。HBM 内存池高达 128 GB,辅以 4.2 TB/s(4:1)的带宽。

以下是英特尔为 Ponte Vecchio 配备的系列计算效率(compute efficiency)技术。

Register File(寄存器文件):

● Register Caching(寄存器缓存) ● Accumulators(累加器)

L1 / L2 Cache:

● Write Through(直写) ● Write Back(回写) ● Write Streaming(流式写入) ● Uncached(不缓存)

Prefetch(预取):

● 支持 L1 和(或)L2 缓存的软件(指令)预取; ● 支持到 L2 获取指令和数据的 Command Streamer 预取。

英特尔解释称,更大的 L2 缓存,可为 2D-FFT 和 DNN 等工作负载带来巨大的效益,并且分享了完整 Ponte Vecchio GPU 和 80 / 32 MB 模块之间的一些性能比较。

此外英特尔搬出了运行 CUDA 和 SYCL 的英伟达 Ampere A100,与使用 SYCL 的 Ponte Vecchio GPU 平台展开了性能横比。

在 miniBUDE(一种可预测配体与目标结合能的计算工作负载)中,Ponte Vecchio GPU 模拟测试结果的速度,更是 Ampere A100 的 2 倍。

另外在 ExaSMR 核反应堆设计仿真设计中,英特尔 Ponte Vecchio GPU 也以 1.5 倍领先于英伟达竞品方案。

不过需要指出的是,英伟达早已向市场投放了性能更加强悍的 Hopper H100,所以英特尔这里拿 Ampere A100 进行比较还是相当投机取巧的。

言归正传,英特尔概述了 Ponte Vecchio 旗舰数据中心 GPU 的一些关键特性,例如 128 个 Xe 内核、128 个光追(RT)单元、HBM2e 显存、以及连接到一起的 8 个 Xe-HPC GPU 。

该芯片在两个独立的堆栈中提供了高达 408 MB 的 L2 缓存、之间通过 EMIB 互连,且各部分芯片混用了 Intel 7 和台积电 N7 / N5 等多个工艺节点。

由两块(2 Tiles)组成的每个堆栈有 16 裸片,最大的 active die 尺寸为 41 m㎡、Compute Tile 则是 650 m㎡ 。

以下是 Ponte Vecchio GPU 的完整小芯片 / 工艺节点描述:

● 英特尔 7nm ● 台积电 7nm ● Foveros 3D 封装 ● EMIB 互连 ● 10nm 增强型 Super Fin ● Rambo Cache ● HBM2 高带宽显存

以下是英特尔 Ponte Vecchio 芯片的 47 块(Tiles)组成:

● 16 个 Xe HPC(内/外部) ● 8 个 Rambo Cache(内部) ● 2 个 Xe Base(内部) ● 11 个 EMIB(内部) ● 2 个 Xe Link(外部) ● 8 个 HBM(外部)

Ponte Vecchio GPU 使用了 8 个 HBM 8-Hi 堆栈,总共包含 11 个 EMIB 互连,完整封装尺寸为 4843.75 m㎡ 。

设计中还提到了高密度 3D Forveos 封装的 Meteor Lake CPU,可知其 bump pitch 的间距为 36u 。

【总结】Ponte Vecchio GPU 不是一个单独的芯片,而是由 47 个不同工艺制程的小芯片“组合”得来。

遗憾的是,受英特尔多次跳票的影响,使用 Ponte Vecchio GPU 和 Sapphire Rapids CPU 的 Aurora 超级计算机项目也被迫推迟。

即便如此,英特尔还是透露了下一代 Rialto Bridge GPU 。可知作为 Ponte Vecchio GPU 的继任者,其有望于 2023 年开始提供样品。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昔日6号秀遭放弃!魔术正式裁掉艾萨克 节省650万美元奢侈税

昔日6号秀遭放弃!魔术正式裁掉艾萨克 节省650万美元奢侈税

罗说NBA
2026-06-28 06:07:53
全国唯一健在长征女红军在四川过105岁生日,“红军的火把,是她见过最亮的光”

全国唯一健在长征女红军在四川过105岁生日,“红军的火把,是她见过最亮的光”

封面新闻
2026-06-28 04:44:16
北大哲学系主任毕业致辞:请原谅我不敢用堆砌起来的一组形容词来祝福你们

北大哲学系主任毕业致辞:请原谅我不敢用堆砌起来的一组形容词来祝福你们

新民周刊
2026-06-27 13:33:58
“山西挖眼案”受害男孩高考721分,报道该案记者:嫌疑人跳井身亡后动机成谜,曾近距离跟记者打招呼;其伯母为嫌疑人

“山西挖眼案”受害男孩高考721分,报道该案记者:嫌疑人跳井身亡后动机成谜,曾近距离跟记者打招呼;其伯母为嫌疑人

大风新闻
2026-06-27 20:28:18
1场1-0,给韩国雪中送炭!出线突然柳暗花明,世界杯冠军耻辱出局

1场1-0,给韩国雪中送炭!出线突然柳暗花明,世界杯冠军耻辱出局

侃球熊弟
2026-06-27 10:01:27
世界杯疯狂一夜:26队晋级,亚洲4队出局,韩国起死回生

世界杯疯狂一夜:26队晋级,亚洲4队出局,韩国起死回生

许钇很机智
2026-06-27 10:16:29
终于弄明白了为什么开空调蚊子就不咬了——不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了

终于弄明白了为什么开空调蚊子就不咬了——不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了

二胡的岁月如歌
2026-06-27 15:11:11
电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

明叔杂谈
2026-06-27 20:18:56
动辄没收,本质上是那灰色十年的思维

动辄没收,本质上是那灰色十年的思维

林中木白
2026-06-27 10:31:05
韩国在实时算分!韩媒:洪明甫真是走了狗屎运!谢谢救世主西班牙

韩国在实时算分!韩媒:洪明甫真是走了狗屎运!谢谢救世主西班牙

童叔不飙车
2026-06-28 01:25:36
原杭州大学新闻传播学院副院长李寿福逝世,享年90岁

原杭州大学新闻传播学院副院长李寿福逝世,享年90岁

澎湃新闻
2026-06-27 19:54:26
世界杯0-0平局,韩国自食其果遗憾遭淘汰

世界杯0-0平局,韩国自食其果遗憾遭淘汰

老揽才是我的外号
2026-06-27 21:12:20
世界杯L组全剧终:英格兰夺头名 克罗地亚升第2出线 韩国预定出局

世界杯L组全剧终:英格兰夺头名 克罗地亚升第2出线 韩国预定出局

侃球熊弟
2026-06-28 07:15:23
西班牙队遭到巨大打击

西班牙队遭到巨大打击

体育哲人
2026-06-27 21:25:03
“签单陪你睡!”女业务员献身客户,半年后被约,拼命逃出报警

“签单陪你睡!”女业务员献身客户,半年后被约,拼命逃出报警

一丝不苟的法律人
2026-06-27 14:59:29
一觉睡醒天塌了!世界杯两大冠军出局,韩国队3分垫底出线彻底悬了

一觉睡醒天塌了!世界杯两大冠军出局,韩国队3分垫底出线彻底悬了

体育见习官
2026-06-28 06:07:12
东鹏饮料紧急辟谣,所谓饭局视频为凭空捏造!公司市值一周蒸发超70亿元,张雪发声

东鹏饮料紧急辟谣,所谓饭局视频为凭空捏造!公司市值一周蒸发超70亿元,张雪发声

21世纪经济报道
2026-06-27 21:41:44
上海403分本科线“引全网怒喷”——凭啥沪爷高考,拿的是站票?

上海403分本科线“引全网怒喷”——凭啥沪爷高考,拿的是站票?

妍妍教育日记
2026-06-26 08:45:06
苹果上调14款产品的价格,马斯克回应涨价:这绝对是我这辈子见过,涨价幅度最大的一次

苹果上调14款产品的价格,马斯克回应涨价:这绝对是我这辈子见过,涨价幅度最大的一次

鲁中晨报
2026-06-27 13:59:07
2-1!2-0!世界杯L组结局:夺冠热门第1出线 韩国又被捅1刀

2-1!2-0!世界杯L组结局:夺冠热门第1出线 韩国又被捅1刀

叶青足球世界
2026-06-28 07:04:56
2026-06-28 08:12:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
68872文章数 70220关注度
往期回顾 全部

数码要闻

华硕RTX 5060 Dual显卡新增两款型号,Boost频率可达2587MHz

头条要闻

美以黎框架协议被指"签了个寂寞" 以高官:重大错误

头条要闻

美以黎框架协议被指"签了个寂寞" 以高官:重大错误

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

汽车要闻

搭载华为乾崑ADS 5 全新猛士M817上市售29.99万起

态度原创

本地
教育
游戏
公开课
军事航空

本地新闻

世界杯球迷节:比球赛更好玩的派对

教育要闻

假如给你一个亿默写D开头单词

《GTA6》PC版遥遥无期!销量太低不备重视?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

黎以美达成三方框架协议

无障碍浏览 进入关怀版