网易首页 > 网易号 > 正文 申请入驻

3D芯片的三种方法

0
分享至

来源:内容由半导体行业观察(ID:icbank)编译自IEEE,谢谢。

最近亮相的一批高性能处理器表明,延续摩尔定律的新方向即将到来。根据约定速成的规定,每一代处理器都需要比上一代拥有更好的性能。这意味着将更多的逻辑集成到硅片上。但是这会面临两个问题:一个是我们缩小晶体管及其构成的逻辑和内存块的能力正在放缓。另一个是芯片已经达到了它们的尺寸极限。光刻工具只能图案化大约 850 平方毫米的区域,这大约是顶级 Nvidia GPU 的大小。

几年来,片上系统的开发人员已经开始将他们越来越大的设计分解成更小的小芯片,并将它们在同一个封装内链接在一起,以有效增加硅面积及其他优势。在 CPU 中,这些链接大多是所谓的 2.5D,其中小芯片彼此并排设置,并使用短而密集的互连连接。由于大多数主要制造商已就 2.5D 小芯片到小芯片通信标准达成一致,这种集成的势头可能只会增长。

但是,要像在同一个芯片上一样将真正大量的数据传输出去,您需要更短、更密集的连接,而这只能通过将一个芯片堆叠在另一个芯片上来实现。面对面连接两个芯片可能意味着每平方毫米有数千个连接。

它需要大量的创新才能使其发挥作用。工程师必须弄清楚如何防止堆栈中一个芯片的热量杀死另一个芯片,决定哪些功能应该去哪里以及应该如何制造,防止偶尔出现的坏小芯片导致大量昂贵的哑系统,并处理随之而来的是一次解决所有这些问题的复杂性。

以下是三个示例,从相当简单到令人困惑的复杂,展示了 3D 堆叠现在的位置:

AMD 的 Zen 3

AMD 的 3D V-Cache 技术将一个 64 兆字节的 SRAM 缓存 [红色] 和两个空白结构小芯片连接到 Zen 3 计算小芯片上。

长期以来,PC 都提供了添加更多内存的选项,从而为超大型应用程序和数据繁重的工作提供更快的速度。由于 3D 芯片堆叠,AMD 的下一代 CPU 小芯片也提供了该选项。当然,这不是售后市场的附加组件,但如果您正在寻找具有更多魅力的计算机,那么订购具有超大缓存内存的处理器可能是您的选择。

尽管Zen 2和新的Zen 3处理器内核都使用相同的台积电制造工艺制造——因此具有相同尺寸的晶体管、互连和其他一切——AMD 进行了如此多的架构改动,这让他们即使没有额外的高速缓存的前提下,Zen 3也能平均提供 19% 的性能提升。其中一个架构瑰宝是包含一组硅通孔 (TSV),垂直互连直接穿过大部分硅。TSV 构建在 Zen 3 的最高级别缓存中,即称为 L3 的 SRAM 块,它位于计算小芯片的中间,并在其所有八个内核之间共享。

在用于数据繁重工作负载的处理器中,Zen 3 晶圆的背面被减薄,直到 TSV 暴露出来。然后使用所谓的混合键合将一个 64 兆字节的 SRAM 小芯片键合到那些暴露的 TSV 上——这一过程类似于将铜冷焊在一起。结果是一组密集的连接可以紧密到 9 微米。最后,为了结构稳定性和热传导,附加空白硅芯片以覆盖 Zen 3 CPU 芯片的其余部分。

通过将额外的内存设置在 CPU 芯片旁边来添加额外的内存不是一种选择,因为数据需要很长时间才能到达处理器内核。“尽管 L3 [缓存] 大小增加了三倍,但 3D V-Cache 仅增加了四个 [时钟] 周期的延迟——这只能通过 3D 堆叠来实现,” AMD 高级设计工程师 John Wuu表示。

更大的缓存在高端游戏中占有一席之地。使用台式机锐龙 CPU 和 3D V-Cache 可将 1080p 的游戏速度平均提高 15%。它也适用于更严肃的工作,将困难的半导体设计计算的运行时间缩短了 66%。

Wuu 指出,与缩小逻辑的能力相比,业界缩小 SRAM 的能力正在放缓。因此,您可以预期未来的 SRAM 扩展包将继续使用更成熟的制造工艺制造,而计算芯片则被推向摩尔定律的前沿。

Graphcore 的 Bow AI 处理器

Graphcore Bow AI 加速器使用 3D 芯片堆叠将性能提升 40%。

即使堆栈中的一个芯片上没有单个晶体管,3D 集成也可以加快计算速度。总部位于英国的 AI 计算机公司Graphcore仅通过在其 AI 处理器上安装供电芯片,就大幅提高了其系统性能。添加供电硅意味着名为 Bow 的组合芯片可以运行得更快(1.85 GHz 与 1.35 GHz 相比),并且电压低于其前身。与上一代相比,这意味着计算机训练神经网络的速度提高了 40%,能耗降低了 16%。重要的是,用户无需更改其软件即可获得这种改进。

电源管理芯片由电容器和硅通孔组合而成。后者只是为处理器芯片提供电力和数据。真正与众不同的是电容器。与 DRAM 中的位存储组件一样,这些电容器形成在硅中又深又窄的沟槽中。由于这些电荷储存器非常靠近处理器的晶体管,因此功率传输变得平滑,从而使处理器内核能够在较低电压下更快地运行。如果没有供电芯片,处理器必须将其工作电压提高到高于其标称水平才能在 1.85 GHz 下工作,从而消耗更多的功率。使用电源芯片,它也可以达到该时钟频率并消耗更少的功率。

用于制造BoW的制造工艺是独一无二的,但不太可能保持这种状态。大多数 3D 堆叠是通过将一个小芯片粘合到另一个小芯片上来完成的,而其中一个仍然在晶圆上,称为晶圆上芯片 [参见上面的“AMD 的 Zen 3”]。相反,Bow 使用了台积电的晶圆对晶圆,其中一种类型的整个晶圆与另一种类型的整个晶圆键合,然后切割成芯片。Graphcore 首席技术官Simon Knowles表示,这是市场上第一款使用该技术的芯片,它使两个裸片之间的连接密度高于使用晶圆上芯片工艺所能达到的密度。

尽管供电小芯片没有晶体管,但它们可能会出现。Knowles 说,仅将这项技术用于供电“对我们来说只是第一步”。“在不久的将来,它会走得更远。”

英特尔的 Ponte Vecchio 超级计算机芯片

英特尔的 Ponte Vecchio 处理器将 47 个小芯片集成到一个处理器中。

Aurora 超级计算机旨在成为 美国 首批突破 exaflop障碍的高性能计算机 (HPC)之一——每秒进行 10 亿次高精度浮点计算。为了让 Aurora 达到这些高度,英特尔的 Ponte Vecchio 将 47 块硅片上的超过 1000 亿个晶体管封装到一个处理器中。英特尔同时使用 2.5D 和 3D 技术,将 3,100 平方毫米的硅片(几乎等于四个Nvidia A100 GPU )压缩成 2,330 平方毫米的占地面积。

英特尔研究员 Wilfred Gomes告诉参加IEEE 国际固态电路会议的工程师,该处理器将英特尔的 2D 和 3D 小芯片集成技术推向了极限。

每个 Ponte Vecchio 都是使用英特尔 2.5D 集成技术 Co-EMIB 捆绑在一起的两个 镜像小芯片集。Co-EMIB 在两个 3D 小芯片堆栈之间形成高密度互连的桥梁。桥本身是嵌入封装有机基板中的一小块硅。硅上的互连线的密度可以是有机衬底上的两倍。

Co-EMIB 管芯还将高带宽内存和 I/O 小芯片连接到“基础块”,这是堆叠其余部分的最大小芯片。

基础tile使用英特尔的 3D 堆叠技术,称为 Foveros,在其上堆叠计算和缓存小芯片。该技术在两个芯片之间建立了密集的芯片到芯片垂直连接阵列。这些连接可以是 36 微米,除了短铜柱和焊料微凸块。信号和电源通过硅通孔进入这个堆栈 ,相当宽的垂直互连直接穿过大部分硅。

八个计算tile、四个缓存tile和八个用于从处理器散热的空白“热”tile都连接到基础tile。基础本身提供缓存内存和允许任何计算块访问任何内存的网络。

不用说,这一切都不容易。Gomes 说,它在良率管理、时钟电路、热调节和功率传输方面进行了创新。例如,英特尔工程师选择为处理器提供高于正常电压(1.8 伏)的电压,以便电流足够低以简化封装。基础块中的电路将电压降低到接近 0.7 V 以用于计算块,并且每个计算块必须在基础块中有自己的电源域。这种能力的关键是新型高效电感器,称为同轴磁性集成电感器。因为这些都内置在封装基板中,所以在向计算块提供电压之前,电路实际上在基础块和封装之间来回蜿蜒。

Gomes 说,从 2008 年的第一台 petaflop 超级计算机到今年的 exaflops机器, 用了整整 14 年。Gomes 告诉工程师,但高级封装(如 3D 堆叠)是可以帮助将下一个千倍计算改进缩短到仅六年的技术之一。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大爆冷!湖人117-135黄蜂,本场谁是罪魁祸首,数据不会说谎!

大爆冷!湖人117-135黄蜂,本场谁是罪魁祸首,数据不会说谎!

刘哥谈体育
2026-01-16 14:32:46
贾国龙开撕罗永浩的真相

贾国龙开撕罗永浩的真相

首席品牌评论
2026-01-16 23:47:37
帮手全到齐,伊朗导弹库存暴增,中方及时声援,美英连夜通告撤军

帮手全到齐,伊朗导弹库存暴增,中方及时声援,美英连夜通告撤军

回京历史梦
2026-01-15 18:33:08
农村香烟突然卖不动了,这4个原因普遍存在,看看有没有你?

农村香烟突然卖不动了,这4个原因普遍存在,看看有没有你?

文雅笔墨
2026-01-16 12:41:40
罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

瓜汁橘长Dr
2025-12-29 11:29:56
活到60岁我才懂:如果女人没有给过你这三样东西,说明她并不爱你

活到60岁我才懂:如果女人没有给过你这三样东西,说明她并不爱你

林林故事揭秘
2025-09-03 14:08:02
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
“两岸统一”突破点不在马英九,也不在国民党,可能在这个人身上

“两岸统一”突破点不在马英九,也不在国民党,可能在这个人身上

趣文说娱
2026-01-12 17:36:51
油烟直排造成大气污染 北京烤肉刘被罚7000元

油烟直排造成大气污染 北京烤肉刘被罚7000元

信网
2026-01-16 07:16:44
湖北某光伏公司快倒闭了!

湖北某光伏公司快倒闭了!

黯泉
2026-01-16 22:16:46
美媒叹息:中国几百万“剽窃”美国熔盐堆技术,如今技术反超10年

美媒叹息:中国几百万“剽窃”美国熔盐堆技术,如今技术反超10年

牛牛叨史
2026-01-15 02:48:46
北京多场“京味”活动鼓励市民到京郊过年

北京多场“京味”活动鼓励市民到京郊过年

新京报
2026-01-15 18:28:05
重庆一死者被定为三人恶势力成员引争议,曾被检方认定为微罪不诉,发回重审后成黑社会骨干

重庆一死者被定为三人恶势力成员引争议,曾被检方认定为微罪不诉,发回重审后成黑社会骨干

大风新闻
2026-01-16 17:00:04
优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

美食格物
2025-12-29 16:58:15
上海崇明区政协原党组副书记张荣,被开除党籍!沉迷赌博,大搞权钱交易

上海崇明区政协原党组副书记张荣,被开除党籍!沉迷赌博,大搞权钱交易

上观新闻
2026-01-15 18:24:11
A股:刚刚,中央一部门发声,释放一信号,下周两个关键位定生死

A股:刚刚,中央一部门发声,释放一信号,下周两个关键位定生死

云鹏叙事
2026-01-17 00:00:06
有男生愿意吗?湖南一独生女招上门女婿,给10万彩礼孩子跟女方姓

有男生愿意吗?湖南一独生女招上门女婿,给10万彩礼孩子跟女方姓

唐小糖说情感
2026-01-15 19:32:55
河南省离退休人员超600万,人均养老金能有3000元吗?一起算一下

河南省离退休人员超600万,人均养老金能有3000元吗?一起算一下

暖心人社
2026-01-16 20:41:43
向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

心静物娱
2025-12-24 11:02:28
台媒指大S离世一年,汪小菲与徐家重开协商,抚养费之争出现转机

台媒指大S离世一年,汪小菲与徐家重开协商,抚养费之争出现转机

手工制作阿歼
2026-01-17 04:56:32
2026-01-17 06:00:49
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12705文章数 34764关注度
往期回顾 全部

数码要闻

雷军发布新一代SU7卡布里蓝全套壁纸:免费用!

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

数码
教育
房产
时尚
本地

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

教育要闻

初中三年,最怕“掉队式沉默”

房产要闻

喜封金顶 臻境初呈丨中粮·铂悦壹号3#楼封顶大吉!

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

无障碍浏览 进入关怀版