网易首页 > 网易号 > 正文 申请入驻

一位资深CPU架构师的观察

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

随着工艺技术的进步,性能和晶体管密度提升的潜力日益受到功耗和散热限制。尽管材料、互连和器件结构的创新仍然至关重要,但它们现在必须与架构策略紧密结合,才能充分实现系统级效率。与此同时,人工智能计算需求的爆炸式增长已经超越了传统的扩展曲线,这加剧了架构和工艺技术在严格的功耗和散热限制下实现前所未有的性能的压力。

本文重点阐述了微架构和工艺技术的协同设计如何应对不断增长的热密度、功耗挑战和性能需求,并敦促工艺研究人员在其扩展路线图中考虑架构的影响。

引言

摩尔定律并未失效,但它正在经历深刻的变革。在原子级材料工程、导电金属层、三维晶体管层、背面供电、新型高密度三维封装等诸多领域的新研究推动下,晶体管尺寸不断缩小,但传统的尺寸缩小优势正日益受到功率密度和散热限制的挑战。随着晶体管尺寸的缩小和三维结构的普及,集成度不断提高,性能瓶颈也随之转移:如今的系统不再受限于晶体管的开关速度或数量,而是越来越依赖于其有效管理能量和散热的能力。

与此同时,人工智能工作负载的爆炸式增长——其特点是海量模型、密集型训练流程和低延迟推理——使计算需求呈数量级增长,进一步加剧了数据中心和边缘设备的功耗和散热压力。

在这个新时代,微架构创新不再是次要的优化,它必须与工艺技术同步发展。电源供应、散热管理和计算效率必须在设备和系统堆栈层面进行整体考量。本文提出了一种协作视角:微架构不断演变的需求如何指导工艺技术的发展,以及工艺突破如何才能在架构层面得到充分考虑,从而转化为实际的性能提升。

热密度

A.

更高的集成度会放大热密度。

热密度定义为单位面积的功率,而面积的快速缩小会放大热密度。更小的特征尺寸和更高的集成度虽然能够提升性能,但也会增加局部发热。Fred Pollack 在 1999 年的 MICRO32 主题演讲(图 1)中指出,功率密度已经超过了热板,并预计将达到核反应堆的水平。


Debbie Marr 在 2024 年的 MICRO56 主题演讲(图 2)中表明,英特尔核心处理器的功率如今已经超过了这一水平。虽然关于核反应堆功率密度的说法经常存在争议,但毫无疑问,如今的硅芯片可以在极短的时间内达到临界温度。


硅芯片从安全温度升至临界温度的速度如此之快,以至于必须从一开始就考虑热传感器和散热措施。曾经只在高性能系统中才会遇到的散热挑战,如今也影响到了主流设备和移动设备。

B.

传统散热管理的局限性

散热片和风扇等传统散热策略已不再适用。液冷、均热板和新型相变材料虽然有所帮助,但这些散热方案在成本、可靠性和尺寸方面都存在局限性。因此,微架构和芯片布局已成为散热管理的首要工具。

C.

支持散热管理的架构策略

微架构师现在采用多种技术来分散和避免热热点。这些技术包括:

  • 热感知布局规划:将低活动逻辑放置在高活动模块附近,以实现热扩散。

  • 通过复制缓解热点:复制关键发热逻辑并轮换活动,以实现局部冷却。

  • 传感器驱动控制:嵌入温度传感器,以动态快速地调整工作负载和电压/频率设置。

  • 利用面积进行散热:不再仅仅最小化面积,而是利用面积来空间分散功率并降低峰值温度。

高效节能性能

A.

性能与功耗:电压调节图

图 2 显示了 CPU 设计的性能与功耗曲线,

其中性能和功耗受以下关系控制:


其中,IPC 指的是每个周期平均指令数,或者说是 CPU 内核执行指令的速率。C 是设计中晶体管在程序执行过程中切换所需的平均动态电容,V 是施加在晶体管上的电压。曲线的电压缩放区域是大多数 CPU 内核执行指令的区域。电压缩放表明性能如何随电压的增加而提高(由于更高的频率),但功耗呈指数级增长,这凸显了降低漏电和减少电容的工艺技术的必要性。图 4 显示了芯片的热成像图,其中显示了热点和冷点。


B.

工艺技术进步

如图 5 所示,工艺技术的进步使得在恒定功耗下实现更高的性能(例如,通过更快的晶体管、降低电容)以及在恒定性能下实现更低的功耗(例如,通过低漏电材料和堆叠器件)。

然而,激进的尺寸缩小可能会加剧热密度,因此需要采取架构方面的应对措施。工艺研究人员必须认识到,能够提高导热性和支持非均匀电压域的材料和布局创新是下一代架构的关键推动因素。


C.

微架构性能特性

如图 6 所示,添加微架构性能特性可以实现更高的性能,例如更大的结构或更多的层压结构。但通常情况下,增加电容也会提高性能。


如图 7 所示,通过简化微架构(更小的结构尺寸、更少的推测),可以减小面积,从而降低目标频率,进而降低电容和漏电(如果电容和漏电在整体系统设计中至关重要)。

结合高性能和低功耗的 CPU 内核是实现所需性能和整体系统功耗优化的有效方法。


系统级扩展

A.

阿姆达尔定律与多处理器可扩展性

图 8 展示了阿姆达尔定律对多处理器性能可扩展性的限制。并行程序通常包含串行执行区域和并行执行区域。阿姆达尔定律指出,并行程序的性能会渐近地接近一个由程序串行部分决定的极限。


图 9 展示了由于硬件和软件共享资源(例如锁、缓存、内存、网络延迟和带宽)而导致的多处理器可扩展性限制。尽管工艺节点允许每个芯片容纳更多核心,但阿姆达尔定律和多处理器可扩展性限制了实际工作负载可达到的性能。事实上,如图 9 所示,多处理器可扩展性对于整数工作负载很少超过 0.97,对于浮点工作负载很少超过 0.90。


另一个关键考虑因素是典型工作负载条件下活动核心数的利用率。实际上,当对多种工作负载进行测量时,工作负载在核心上的分布通常如图 10 所示,其中最常见的情况是只有一个核心处于活动状态。其次是所有核心都处于活动状态,然后是 2 个、3 个等等核心处于活动状态。


B.

对处理器设计的影响

功耗和带宽由活动核心数共享,而活动核心数可能会动态变化。这会对应用于每种类型核心的数量、类型和微架构优化产生影响。第二节中描述的热约束和功率约束及解决方案也可以应用于整个系统,以针对各种工作负载场景进行优化。

关键工艺研究方向与架构需求相契合

为了支持架构目标,以下工艺研究领域至关重要:

  • 低漏电、低电容材料:支持频率扩展,同时避免功耗失控。

  • 热感知 3D 集成:管理堆叠芯片中的垂直热流。

  • 精细化电源门控:实现每个模块的功耗控制。

  • 片上热传感器:实现实时架构热管理。

  • 异构集成:支持在同一芯片上实现高性能和高效率核心。

工艺和架构团队过去在各自独立的设计阶段开展工作。如今,反馈循环至关重要:架构热图必须指导器件布局和封装;工艺限制必须指导架构布局规划和性能目标。协同优化能够实现更明智的权衡和更快的路径规划。

结论

先进的半导体工艺技术正在释放出卓越的性能——但如果没有架构意识,其优势将受到功耗和散热的限制。一种新的架构与工艺协同设计模式必须出现。下一代计算不仅需要更小的晶体管,还需要更智能的系统。通过将能效和散热约束视为共同的责任,我们可以将摩尔定律的轨迹延伸至一个可持续的、高性能的未来。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4277期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢



求推荐


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普撤销拨款 美国公共广播公司解散

特朗普撤销拨款 美国公共广播公司解散

每日经济新闻
2026-01-06 12:51:23
为什么凤姐没有跌入斩杀线?不吸毒、没助学贷、生活在华人社会保护圈里

为什么凤姐没有跌入斩杀线?不吸毒、没助学贷、生活在华人社会保护圈里

西虹市闲话
2026-01-05 15:18:06
高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

趣文说娱
2026-01-04 16:34:24
美媒:特朗普的算盘空了,委内瑞拉的高价油,中国连一桶都不肯买

美媒:特朗普的算盘空了,委内瑞拉的高价油,中国连一桶都不肯买

娱乐小可爱蛙
2026-01-07 13:42:37
单亲妈妈的崩溃!400元海底捞引爆母女大战,养的狗比亲妈还金贵

单亲妈妈的崩溃!400元海底捞引爆母女大战,养的狗比亲妈还金贵

蝴蝶花雨话教育
2026-01-05 09:07:40
柯蓝:某人上完培训学校,怀上男明星的孩子;储殷:嫁不进真豪门

柯蓝:某人上完培训学校,怀上男明星的孩子;储殷:嫁不进真豪门

荣亭小吏
2026-01-06 14:23:58
李小孩的“小绿瓶”,在国博很没存在感,为何永久禁止出境?

李小孩的“小绿瓶”,在国博很没存在感,为何永久禁止出境?

收藏大视界
2026-01-04 17:32:26
中国母女在老挝一火灾中遇难,涉案嫌疑人已被抓获,总领馆:正在跟进案件

中国母女在老挝一火灾中遇难,涉案嫌疑人已被抓获,总领馆:正在跟进案件

极目新闻
2026-01-07 13:46:22
多地城投大降薪!

多地城投大降薪!

黯泉
2026-01-06 22:42:14
朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

云霄纪史观
2025-12-27 15:49:05
特朗普称格陵兰岛“到处是俄罗斯和中国船只” 丹麦外相:不实

特朗普称格陵兰岛“到处是俄罗斯和中国船只” 丹麦外相:不实

新京报
2026-01-07 10:36:04
80条人命被淹没,特朗普不打招呼就动手,国际法庭的卷宗又厚一叠

80条人命被淹没,特朗普不打招呼就动手,国际法庭的卷宗又厚一叠

起喜电影
2026-01-07 16:24:58
中美关系生变,特朗普一声令下,中国92台起重机被查,果然不简单

中美关系生变,特朗普一声令下,中国92台起重机被查,果然不简单

观星赏月
2026-01-07 16:31:52
富得流油的新四军第七师,每人每月三条香烟,开着汽艇向日军收税

富得流油的新四军第七师,每人每月三条香烟,开着汽艇向日军收税

别人都叫我阿腈
2026-01-07 09:00:02
Here we go!罗马诺:塞门约6500万英镑转会费加盟曼城

Here we go!罗马诺:塞门约6500万英镑转会费加盟曼城

懂球帝
2026-01-07 07:13:28
罗德里-桑切斯:西甲只有梅西和C罗会被记住;为了钱去卡塔尔

罗德里-桑切斯:西甲只有梅西和C罗会被记住;为了钱去卡塔尔

懂球帝
2026-01-07 16:57:30
浙江首家宜家商场,确定关店!宜家中国刚刚宣布,关闭7家

浙江首家宜家商场,确定关店!宜家中国刚刚宣布,关闭7家

都市快报橙柿互动
2026-01-07 12:35:22
历史玩笑!乌克兰还没倒下,垄断全球富豪资产的瑞士,先顶不住了

历史玩笑!乌克兰还没倒下,垄断全球富豪资产的瑞士,先顶不住了

至死不渝的爱情
2025-12-10 15:32:29
俄乌冲突最新进展:1月7日下午最新消息

俄乌冲突最新进展:1月7日下午最新消息

第一校尉
2026-01-07 16:10:31
轮到特朗普本人被审判了,中俄支持下,安理会将紧急召开会议

轮到特朗普本人被审判了,中俄支持下,安理会将紧急召开会议

博览历史
2026-01-06 15:22:52
2026-01-07 17:43:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12643文章数 34757关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

手机
本地
旅游
数码
公开课

手机要闻

iPhone 21首搭2亿像素,「全力追赶」安卓?

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

旅游要闻

安徽省怀远县白乳泉新年游园会暨2026年文商旅促消费活动圆满收官

数码要闻

乐奇Rokid亮相CES 2026,AI+AR眼镜引领人机交互新时代

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版