网易首页 > 网易号 > 正文 申请入驻

一文读懂,可重构芯片为何是AI的完美搭档

0
分享至

来源:半导体行业观察

在当今数字化时代,人工智能(AI)无疑是最为耀眼的技术领域之一。从早期简单的机器学习算法,到如今复杂的深度学习和 Transformer 模型,AI 算法正以前所未有的速度快速发展。这种快速演进使得 AI 在各个领域的应用不断拓展,从边缘端的高能效场景,如智能安防摄像头、智能家居设备,到云端的大算力场景,如数据中心的智能分析、智能语音交互系统等,AI 正逐步渗透到人们生活和工作的方方面面。

在边缘端,设备对能耗限制严格,需在有限电量下完成复杂任务,像实时图像识别、简单语音指令处理等。而在云端,面对海量数据和复杂计算需求,如大规模图像数据集处理、复杂自然语言处理任务等,需要强大计算能力支撑。无论哪种场景,AI 芯片都至关重要,其性能直接决定 AI 应用效果。然而,随着 AI 算法不断革新,传统固定架构芯片逐渐暴露出诸多局限性,难以满足 AI 算法日益增长的多样化需求,无法充分发挥硬件性能优势。

现代神经网络模型作为AI算法的核心,具有一系列复杂多样的特征,这些特征对芯片的设计和性能产生了深远的影响。

神经网络的拓扑结构复杂且不断演变。早期神经网络主要由卷积层和全连接层构成,结构简单,功能单一。但随着技术发展,为提升网络性能和处理复杂任务的能力,诸如 ResNet 的残差连接结构、注意力机制等复杂拓扑不断涌现。ResNet 的残差连接解决了梯度消失问题,使网络可构建得更深,学习更复杂特征;注意力机制通过动态生成矩阵提取全局信息相关性,带来不规则拓扑结构,能更聚焦关键信息。例如在 2023 年特斯拉 AI Day 展示的网络中,包含更多类型节点和更复杂连接,旨在模拟人类大脑神经连接,实现更高级智能处理能力。不同网络拓扑结构决定数据在网络中的流动和处理方式,对芯片的计算资源分配和数据传输路径提出多样化需求。

图1. AI算法呈现出复杂演变的特点

神经网络模型存在多维度的稀疏性,涵盖输入、权重和输出。为模拟大脑中非活跃神经元,提高计算效率,稀疏性在神经网络研究中备受关注。实际计算中,稀疏(0 值)操作数不影响计算结果,跳过无效计算可减少整体计算量和内存访问需求。早期对稀疏性的研究集中在基于剪枝的一维权重稀疏性,如今已发展到利用输入、权重和输出的三维稀疏性。例如,在一些模型中,通过检测输入数据中的 0 值元素,直接跳过相关计算,避免不必要的计算资源浪费。

图2. 神经网络模型精度不断变化

神经网络模型在不同层对数据精度要求差异较大。推理阶段,模型最初常被量化为统一精度,如 INT8,这种方式虽简单,但在某些情况下无法充分发挥模型性能。后来发展为每层量化,根据不同层需求调整数据精度,提高推理效率。近期,甚至出现元素级混合精度应用,进一步优化计算资源利用。训练阶段,早期常用的 FP32 和 FP16 虽能保证较高计算精度,但会带来较高内存和功耗开销。为降低训练成本,有人提出使用 FP8,但因其数据表示能力有限,会导致训练精度损失。因此,混合精度训练(如 FP16 和 FP8 混合)成为平衡训练精度和能效的有效解决方案。

这些复杂的模型特征给芯片设计带来诸多严峻挑战。不同网络拓扑结构导致数据重用模式和数据访问时间差异显著。数据访问,尤其是对 DRAM 的访问,相较于计算会带来显著时间和功耗开销。在高性能 AI 芯片设计中,减少内存访问成本至关重要,这就要求芯片具备灵活的数据流支持能力,以适应不同数据重用模式,降低数据访问量。不同类型的稀疏性特点不同,增加了芯片设计难度。输入和权重稀疏性需逐元素计算跳过,输出稀疏性导致逐向量计算跳过。AI 芯片要充分利用这些稀疏性消除冗余计算,必须具备灵活处理不同稀疏性的能力。不同应用对数据位宽要求不同,AI 芯片需处理多种数据精度,这对处理器的计算单元提出很高要求,需要一个高效的 MAC 单元,既能满足不同精度计算需求,又能在功耗和面积方面进行优化。

图3. 硬件重构优于软件编程

为应对这些挑战,硬件重构成为关键技术,相较于软件编程具有明显优势。软件编程在处理不同拓扑结构时具有一定灵活性,通过插入分支指令处理不同节点,但在处理元素级稀疏性和多种精度时存在局限。软件编程无法充分利用稀疏性优化计算,对于不同精度计算也难以灵活切换,无法满足 AI 芯片对灵活性的全面要求。例如,在处理大规模稀疏矩阵计算时,软件编程可能耗费大量时间和资源处理 0 值元素,而硬件重构能够全面适应神经网络的各种结构、稀疏模式和计算精度。它可根据不同神经网络模型和任务需求,在硬件层面快速调整,实现资源高效利用。处理稀疏性时,硬件重构可通过专门电路设计,直接对稀疏数据进行处理,避免无效计算,提高计算效率。例如,通过设计特定的稀疏数据处理单元,可快速检测和跳过 0 值操作数,减少计算资源浪费。应对多种数据精度时,硬件重构能灵活切换计算单元精度模式,满足不同层计算需求。例如,在同一芯片上,可根据不同层需求,动态调整计算单元精度,从低精度的 INT4 到高精度的 FP16,实现资源优化配置。

硬件重构主要在芯片级、处理单元阵列(PEA)级和处理单元(PE)级三个层次进行。芯片级重构旨在处理输入、权重和输出的稀疏性,提高硬件利用率,可以通过 BENES 网络实现。BENES 网络由双向开关单元组成,每个开关有旁路和交叉两种模式。处理输入和权重稀疏性时,根据操作数是否为零,配置 BENES 网络为对称或不对称结构,将非零操作数路由到 PE 进行计算,并在计算后恢复结果的稀疏位置。对于输出稀疏性,传统顺序计算存在硬件利用率低和数据重复访问问题,而乱序计算通过 BENES 网络优化计算顺序,减少向量内存访问,提高硬件资源利用率。例如,在处理大规模稀疏矩阵乘法时,通过 BENES 网络的乱序计算,可优化原本需多次访问内存的数据,减少内存访问次数,提高计算效率。数据显示:清微智能从边缘端 TX5至云端TX8系列可重构芯片 ,硬件利用率均可提升 50% 以上。

PEA 级重构分为整体重构和交错重构。整体重构中,整个 PE 阵列以特定数据流运行,适用于不同神经网络顺序执行的场景;交错重构允许多个数据流在单个 PE 阵列上同时运行,适用于需同时计算多个神经网络的场景。其目的是通过改变数据流,根据不同神经网络模型的张量大小和数据重用模式,选择固定某一张量,让其他张量流动,从而最小化数据访问。通过调整数据流向和计算顺序,提高数据重用率,减少数据在内存和计算单元之间的传输次数,进而降低功耗和提高计算效率。与 GPU 相比,GPU 硬件利用率通常仅达 50%,而可重构芯片通过灵活的阵列级重构,能达到 80% 以上的硬件利用率。例如,在处理多个不同类型的神经网络任务时,可重构芯片的交错重构能力可同时处理不同任务的数据流,充分利用硬件资源,避免资源闲置。清微智能的 TX8 系列可重构大算力芯片通过这种数据流计算范式使中间数据直接在计算单元之间传递,避免大量重复访存,计算性能和能效水平显著提升。

PE 级重构的目标是支持多种数据精度,常见技术包括位串行、位融合、浮点融合和部分积重构。位串行从最高有效位(MSB)到最低有效位(LSB)逐位计算,通过配置控制位决定计算周期,适用于超低功耗应用,但吞吐量有限。位融合由多个并行的位砖单元组成,通过空间重组实现灵活的位宽配置,可支持不同精度计算,能显著提升计算速度,但带宽利用率较低。在训练中分离特征图为 FP16 和 FP8 组,可提高训练能效,但存在硬件资源浪费问题。浮点融合用于混合精度浮点训练,通过共享乘法器、对齐器、加法器和归一化逻辑实现不同精度计算,从而显著提高硬件资源利用率。部分积重构支持混合整数和浮点计算,通过不同的部分积计算单元配置实现不同精度计算,硬件利用率较高,但功耗相对较大。例如,在对功耗要求极高的边缘设备中,位串行技术可充分发挥其超低功耗优势;在对计算速度要求较高的云端应用中,位融合技术可显著提升计算速度。

图4. 可重构芯片可实现多层次硬件重构

可重构芯片凭借芯片级、阵列级和 PE 级三级重构能力,在保持编程灵活性的情况下,通过对硬件资源的精细化重构调度和高效利用,实现更高性能和更高能效的 AI 芯片设计。在芯片级,由于 AI 处理的数据存在稀疏性,可重构芯片的芯片级重构能力能跳过无效的 0 值计算,减少内存访问次数,提高硬件使用效率,更好发挥硬件性能并提高计算能效。在阵列级,可重构芯片能利用其阵列级重构能力,实现数据流计算范式,减少中间数据在存储器之间的反复搬运,降低访存能耗,解决 “存储墙” 问题,同时提高硬件资源利用效率。在 PE 级,可重构芯片利用其 PE 级多精度配置、定浮点融合和资源共享等重构能力,精细控制和调度底层计算资源,显著提高资源利用率,从而提高芯片面积利用率。

随着 AI 技术的不断发展,可重构芯片的应用前景将更加广阔。它有望为 AI 的持续创新提供强大硬件支持,推动人工智能技术迈向新高度。

在未来,随着 AI 算法进一步发展和应用场景不断拓展,可重构芯片将在更多领域发挥重要作用。国内规模最大的可重构芯片厂商清微智能,目前已量产TX5和TX8两大系列十余款芯片,覆盖云边端应用场景,广泛应用至智能安防、智能机器人、智算中心,大模型市场,实现可重构芯片从0到1的探索实践。脱胎于斯坦福大学顶尖科研团队的 SambaNova Systems,在2023年就成为AI 芯片估值最高的独角兽标杆。

1.Shouyi Yin. Reconfigurable Machine Learning Processor: Fundamental Concepts, Applications, and Future Trends.ASSCC 2023 Tutorial.

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
109.34亿元主力资金今日撤离有色金属板块

109.34亿元主力资金今日撤离有色金属板块

证券时报
2026-03-13 16:54:12
学医后才知道,血压最危险信号,不是头晕,而是频繁出现4症状

学医后才知道,血压最危险信号,不是头晕,而是频繁出现4症状

叙说医疗健康
2026-03-12 18:55:10
以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

上官晚安
2026-01-06 08:08:35
狐狸尾巴藏不住!张纪中被指转移3亿后,杜星霖演都不想演了

狐狸尾巴藏不住!张纪中被指转移3亿后,杜星霖演都不想演了

一窥究竟
2026-03-11 17:41:48
81岁潘迎紫:身段保养好年轻,曾拒绝前夫复合,离婚47年活得清醒

81岁潘迎紫:身段保养好年轻,曾拒绝前夫复合,离婚47年活得清醒

以茶带书
2026-03-13 18:07:54
你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

另子维爱读史
2026-03-13 23:30:14
重磅!中国苹果税下调至25%!

重磅!中国苹果税下调至25%!

DataEye
2026-03-13 09:46:55
广西平南县:已成立联合调查组

广西平南县:已成立联合调查组

澎湃新闻
2026-03-13 17:11:11
在“平等”的古巴,我重新理解了“贫穷”

在“平等”的古巴,我重新理解了“贫穷”

刘润
2026-03-13 08:37:30
恭喜!武汉这些小区要升值了!

恭喜!武汉这些小区要升值了!

说故事的阿袭
2026-03-13 21:12:34
中国女篮不敌比利时,听听各界媒体专家怎么说,宫鲁鸣一针见血

中国女篮不敌比利时,听听各界媒体专家怎么说,宫鲁鸣一针见血

孙馄北漂拍客
2026-03-14 00:19:58
冻干草莓测出二十几种农药,多家公司主动收购问题冻干草莓,“农残超标的话我们一般销售国内”,超标、过期无所谓,可当合格品卖或打粉加工冰淇淋等食品

冻干草莓测出二十几种农药,多家公司主动收购问题冻干草莓,“农残超标的话我们一般销售国内”,超标、过期无所谓,可当合格品卖或打粉加工冰淇淋等食品

观威海
2026-03-13 18:19:09
特朗普终于醒悟了,赶在中美谈判前,先对中国退了一大步

特朗普终于醒悟了,赶在中美谈判前,先对中国退了一大步

我叫汤姆
2026-03-13 23:41:43
雨雪进入最强时段!江苏最新预测

雨雪进入最强时段!江苏最新预测

无锡eTV全媒体
2026-03-13 15:53:39
铜价站稳10万+!有色金属告别周期,成战略稀缺资产迎价值重估

铜价站稳10万+!有色金属告别周期,成战略稀缺资产迎价值重估

户外钓鱼哥阿旱
2026-03-14 00:18:55
以色列严管媒体却堵不住手机,越封锁越显心虚,真相终将曝光!

以色列严管媒体却堵不住手机,越封锁越显心虚,真相终将曝光!

眼界看视野
2026-03-12 06:46:56
电视剧收视率排行榜,《逐玉》跌至第三,第一收视高达1.848%

电视剧收视率排行榜,《逐玉》跌至第三,第一收视高达1.848%

圆头讲电影
2026-03-11 12:49:00
WOC!詹姆斯击碎质疑!最后一次为湖人做牺牲!

WOC!詹姆斯击碎质疑!最后一次为湖人做牺牲!

漫川舟船
2026-03-14 00:09:04
中方未致贺电,小哈梅刚上台就被架空?事实证明,西方媒体猜错了

中方未致贺电,小哈梅刚上台就被架空?事实证明,西方媒体猜错了

他想要很多很多的梦
2026-03-12 20:44:36
特朗普强令扩产武器,背后算计几何?

特朗普强令扩产武器,背后算计几何?

烽火瞭望者
2026-03-13 06:38:22
2026-03-14 01:40:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4577文章数 37431关注度
往期回顾 全部

科技要闻

龙虾热卷到AI硬件 “无脑”硬件或被淘汰

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

体育要闻

叕战奥运,张雨霏要做回“小将”

娱乐要闻

广电总局公布演员将用姓氏笔画定番位

财经要闻

“十五五”规划纲要,全文来了!

汽车要闻

置换补贴价8.68万 五菱缤果S 525km旗舰款上市

态度原创

本地
旅游
时尚
房产
公开课

本地新闻

坐标北京,过敏季反向迁徒

旅游要闻

春满来凤山,花开迎客忙!腾冲茶花基地13万游人踏春“打卡”

扎十一惹:像鸟飞往她的山

房产要闻

不容易啊!海口终于又要卖地了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版