![]()
近日,清微智能TX81芯片一举斩获“2025中国创新IC-强芯领航奖”,彰显其芯片技术硬核实力。
作为国内半导体行业最具影响力的评选之一,此次评选由中国集成电路设计创新联盟主办。经评委专家综合评审、网络投票等,基于申报企业及产品的竞争力、技术创新、市场潜力等多维度表现,TX81芯片最终将奖项收入囊中,其中网络投票结果更是位列榜单第一名,充分体现了清微智能在AI芯片“可重构数据流”架构上的行业贡献和领航地位。
![]()
同为“数据流架构”的谷歌近期亦备受关注:它开始为ChatGPT提供算力服务,且OpenAI此次采用“GPU训练 + TPU推理”混合架构模式,不仅是在为自身寻求多元化保障,也是为谷歌TPU芯片投出了一枚信任票。《印度时报》的报道直指核心:“谷歌或助力OpenAI降低对英伟达的依赖”。此外,苹果、Anthropic、Safe Superintelligence等巨头的相继入局,也让谷歌TPU阵营日渐壮大。
这标志着英伟达长期以来在AI领域筑起的坚固堡垒被撕开了一道口子。正所谓”天下苦秦久矣”,非GPU赛道的芯片企业终于迎来与之较量的机会。一场撼动固有GPU秩序的AI算力变局,正以不可阻挡之势上演。
01
武林争锋:GPU与可重构的华山论剑
从技术根源来说,目前AI算力芯片存在两大技术流派:一派是以GPU为代表的共享式集中计算派(简称GPU派),另外一派则是以可重构芯片RPU(Reconfigurable Processing Unit)可重构数据流、谷歌TPU固定数据流为代表的数据流派,近年来随着AI大模型的迅猛发展异军突起。
在这个风云际会的AI芯片江湖中,两大技术流派如同武林界的泰山北斗——少林与武当。
谈到GPU派,门派宗师为芯片巨头英伟达,摩尔线程、沐曦等国内芯片企业也师承此道。
GPU架构就像精密的工业流水线,计算单元如同训练有素的工人,严格遵循CPU主管的指令,在冯·诺依曼架构的框架下高效运转。其最大优势在于数十年精心构筑的成熟软硬件生态,标准化程度高,用户几乎可以即插即用。然而,GPU架构芯片的性能提升越来越依赖于制程微缩的极限突破以及HBM带宽的艰难提升,如同攀登愈发陡峭的山峰。
再来看数据流派,大弟子为谷歌TPU,国内的代表企业为“脱胎”于清华可重构实验室的清微智能RPU。此外,特斯拉Dojo、斯坦福系SambaNova、美国初创公司Groq均为该门派的得意门生。
其精髓在于硬件能够根据瞬息万变的计算任务动态重组,构建出最高效的专用通道。这如同赋予了流水线工人自主协作的智慧,天然契合AI算法并行、流式、密集的核心特质,使得AI芯片具备灵活性和专用集成电路高效性的优势。早在2015年,它就被国际半导体技术路线图(ITRS)预见为“未来最具前景的芯片架构”,被学术界和产业界视为继CPU、FPGA和GPU之外的第四类通用计算芯片。
02
可重构数据流派,AI的天生搭档
此次,OpenAI选择谷歌TPU承载大模型推理任务,揭示了当前AI算力领域生态与技术路线的双重博弈。大模型训练如同构建精密仪器,高度依赖成熟完备的工具链与开发环境,这正是英伟达GPU凭借二十年深耕打造的生态护城河。
相比之下,伴随AI而生的数据流派,其生态体系仍处于成长阶段,门下弟子需要持续投入时间不断完善工具链与软件栈。但值得关注的是,尽管当前生态建设是数据流派的短板,但数据流派的芯片技术正以惊人速度演进,在强化架构原生优势的同时,积极吸纳前沿技术成果,持续丰满技术羽翼,在算力瓶颈突破上有着巨大的潜能。
底层技术路线的分野为两大门派带来了两种截然不同的发展轨迹。
国内师承英伟达GPU架构的芯片公司,凭借成熟的硬件基础与软件生态获得了较高起点,但却面临难以突破的天花板。这种路径虽能保障基础性能的稳定性,但其终极高度受制于原始技术框架,只能长期处于跟随状态。
而可重构数据流技术路线与AI计算需求天然适配,可谓是为AI行业而生。其底层技术原理展现出有望突破芯片物理限制的颠覆性潜力,尤其体现在与芯片前沿技术结合,能够产生1+1大于2的效果。
目前,AI算力行业困局重重。一方面,大模型参数以“亿”为单位狂飙,对算力的需求呈现指数级增长;另一方面,摩尔定律逐渐逼近物理极限,传统芯片制程微缩技术瓶颈问题日益凸显,严重制约了AI算力的提升。
在多种对未来芯片技术路径的探索中,晶圆级芯片技术作为突破空间约束的关键路径,被视为“明日之星”。其革命性价值在于三维空间重构——能够在单位空间内集成更多单元电路,具有更高的晶体管密度与算力。
此时,芯片间的高效互联就变得尤为关键。可重构数据流派自研的C2C算力网格技术展现出天然适配优势,允许多芯片间建立点对点直连通道,实现数据间的高效传输,规避传统交换机的带宽瓶颈与通信延迟。反观GPU架构,若强行适配晶圆级芯片集成,由于原始架构技术限制,只能依赖外部交换机进行“削足适履”式连接,可谓是“强扭的瓜不甜”。
在芯片设计维度,技术基因的差异同样深刻。传统GPU的计算存储布局受限于二维平面思维,而可重构数据流架构从底层就具备三维扩展的天然优势。这种空间自由度使其与晶圆级集成、3.5D堆叠等立体封装技术产生深度契合,迸发出较强的性能突破潜力。
恰似汽车产业革命,可重构数据流架构正如具备颠覆基因的新能源汽车,虽发展历程短于燃油车的百年积淀,但通过在“三电系统”(电池、电机、电控)等核心领域的持续突破,终将完成对传统动力系统的历史性替代。
03
可重构芯片获认可,AI江湖谁主沉浮
诚然,数据流派作为新兴势力,其生态厚度尚无法与深耕数十年的GPU派并肩。但数据流派的技术创新正以前所未有的速度迭代演进,展现出蓬勃发展的生机与活力。
国外,SambaNova的可重构芯片性能已达英伟达旗舰H100的3.1倍;Groq的LPU语言处理器在推理速度上实现十倍提升,成本却仅为GPU的十分之一;特斯拉倾力打造的Dojo超算系统,其数据流架构正是支撑其通用人工智能(AGI)的基石。此外,数据流派迈出商业化重要一步的里程碑事件——OpenAI采用谷歌TPU用于ChatGPT推理,更是昭示着这一门派不仅在技术上持续突破,商业上也已开枝散叶,正强有力地驱动着整个生态的加速成熟与扩张。
在这场全球性的技术竞逐中,中国力量正崭露头角。其中,清微智能无疑是国内可重构数据流芯片领域的领航企业,技术血脉源自清华大学深厚的可重构计算研究积淀,其高算力TX8系列芯片已实现规模化量产,成为AI落地应用的关键支撑。
![]()
面向智算中心等云计算场景,清微智能最新TX81单个RPU模组算力可达到512TFLOPS(FP16),庞大的REX1032训推一体服务器单机算力可达4 PFLOPS,单机可支持DeepSeek R1/V3满血版推理,支持万亿以上参数大模型部署,可实现千卡直接互联,无需交换机成本。目前,清微已在国内多个省份落地千卡智算中心,同时在多个行业实现服务器部署。
在技术前沿,清微的8系芯片已迭代至“可重构3.0”,创新自研C2C算力网格技术,并前瞻性布局了“3.5D大芯片”堆叠技术与晶圆级芯片等尖端方向。
放眼当下的AI芯片江湖,格局日益呈现出多元化态势:英伟达GPU派根基深厚,稳踞一方;数据流派锐意创新,来势凶猛,华为昇腾等芯片企业则探索着兼容并蓄的融合之道。这恰似一场精彩绝伦的武林盛会,各路高手切磋技术、各显神通,共同为AI发展注入不竭动力,支撑着智能时代浪潮奔涌向前。
THE END
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.