**先说结论版:**
- 北大孙仲团队确实做了一块很有代表性的“高精度模拟矩阵计算芯片”,是全球范围内第一次把模拟计算做到24位定点精度(误差压到千万分之一量级),能效和吞吐在特定矩阵运算上比传统数字芯片高很多,而且原理上可以在28nm及以上成熟工艺量产,不依赖EUV这样的高端光刻机。【turn0search2】【turn0fetch0】
- 但:它目前还处在“实验室阶段”,阵列规模不大、没有大规模量产,也谈不上已经“取代英伟达”或全面“打穿美国封锁”。更合适的说法是:它证明了一条新的、可以绕开“先进制程+高端光刻机”的AI算力路线,给中国在算力博弈中多了一张牌。
- 网络上那种“完美突破美国围剿”“秒杀一切”的说法,属于把“有前景的重大科研突破”夸张成了“已经赢下整局游戏”,这个差距非常大。
下面我分几块讲清楚:这芯片到底牛在哪、现在真实进展怎样、跟“美国围剿”的关系、以及未来可能怎么走。
## 一、孙仲团队的芯片,本质上是什么?
**简单说:** 它不是传统CPU/GPU那种“数字逻辑门堆出来的芯片”,而是用“物理系统直接算方程”的模拟计算芯片。
- 背景团队:北京大学人工智能研究院/集成电路学院的孙仲,联合集成电路学院蔡一茂、王宗巍等。【turn0search2】
- 核心器件:用“阻变存储器(RRAM)”作为核心器件,而不是传统硅晶体管逻辑门,把“矩阵方程”直接映射到电路的物理量上,让电路“自发”去解方程,而不是一步步逻辑推算。【turn0fetch2】
- 关键指标:
- 精度:从传统模拟计算的约1%误差,压到“千万分之一”量级,相当于24位定点精度,大致能对标主流数字计算的FP32(32位浮点)精度。这是全球首次把模拟计算拉到这个精度水平。【turn0search2】【turn0fetch2】
- 性能表现(特定任务):
- 在求解32×32矩阵求逆这类问题时,单核算力已超过高端GPU单核;
- 当问题规模扩大到128×128时,计算吞吐量可以达到顶级数字处理器的1000倍以上;
- 在相同精度下,能效比传统数字处理器高超过100倍。【turn0fetch0】
- 工艺要求:团队明确表示,它可以在28nm及以上成熟工艺上量产——也就是说,不需要依赖目前被美国严控的EUV光刻机、7nm/5nm这种尖端制程,就能做出具备竞争力的AI矩阵计算芯片。【turn0search2】【turn0fetch0】
更直观一点,可以用一个结构图概括它的技术路线和价值:
```mermAId
mindmap
root((孙仲团队 高精度模拟矩阵计算芯片))
技术本质
模拟计算:利用物理量(电压、电流等)直接“类比”求解矩阵方程
采用阻变存储器RRAM作为核心器件
不同于传统CPU/GPU的数字逻辑门堆叠
关键指标
24位定点精度
相对误差约10⁻⁷(千万分之一)
可对标FP32数值精度
性能表现
32×32矩阵求逆:算力超越高端GPU单核
128×128问题:吞吐量达顶级数字处理器1000倍以上
相同精度下能效提升超100倍
工艺与制造
可在28nm及以上成熟工艺量产
不依赖EUV等极紫外光刻机
可沿用现有半导体产线(不需要像量子/光计算那样另起炉灶)
应用方向
6G大规模MIMO等通信场景
AI训练,尤其是二阶训练方法(需大量矩阵方程求解)
具身智能(机器人等)
超级计算(气象、量子力学、热扩散等偏微分方程场景)
当前阶段
实验室阶段
阵列规模尚不大(目标两年内从16×16扩展到128×128乃至512×512)
属原理性验证,尚未大规模商用
## 二、这条技术路线为什么被说成“绕开光刻机卡脖子”?
美国这几年对中国的芯片围堵,核心抓手有两个:
1)掐“先进制程”:通过控制EUV光刻机、相关设备和材料,卡死7nm/5nm及以下的制程升级。
2)掐“高端AI芯片”:通过出口管制限制H100、A100、H200等高性能GPU对中国供应,以及相关的制造设备、软件生态等。【turn0search8】【turn0search5】
而孙仲团队这条路线,确实从“算力范式”上换了一条赛道:
- 它的算力优势主要来自:
- 模拟计算本身“用物理定律直接算”,省去了数字计算里大量的“翻译/编码/逻辑门”步骤;
- 面对矩阵方程这种AI与6G中的核心负载,它天然更适合“一次解掉”,而不是数字方式的一步一步算。【turn0fetch2】
- 因为不再死磕“堆更多纳米级晶体管”的传统数字路线,所以它不需要7nm、5nm这种极限制程。
- 团队明确说:可以在28nm及以上成熟工艺上量产,这对中国来说,是完全可自主、可规模生产的工艺节点。【turn0search2】【turn0fetch0】
换句话说:
美国下的是“数字GPU + 先进制程 + EUV光刻机”这一局棋,但孙仲团队提出的是:
- 用“模拟计算 + RRAM + 成熟工艺”
- 去打“矩阵方程/AI训练与推理/6G”这些关键场景的局部仗
从战略上讲,这是典型的“换道超车/非对称突围”:
不在你最强的那一块硬碰硬,而是换一套规则,在你控制没那么严的地方发力。
孙仲自己在访谈里也强调:
当前GPU是靠“堆晶体管+摩尔定律”这条传统路径走到今天的,但随着摩尔定律放缓、能耗与碳排放压力巨大,探索新的计算范式(比如模拟计算)是必然方向。【turn0fetch2】
## 三、现在真实进展到哪一步?远没到“完美破局”
网上不少标题写的是“算力是英伟达千倍,能耗却只有百分之一”“彻底打破美国封锁”“完美突破美国围剿”之类的,这明显是对科研结果的情绪化放大,需要注意边界:
1)这是“实验室成果”,不是成熟产品
- 团队在采访中非常明确:目前芯片还处在实验室阶段,阵列规模较小,只能做原理性验证,尚无法与高端数字芯片全面抗衡。【turn0fetch2】
- 报道也提到:
- 目前“芯片尚处于实验室阶段,未来有望服务于6G通信、人工智能等重点领域”;【turn0fetch0】
- 更适用于“中等规模场景”,太小规模性能不及数字芯片,太大规模目前还够不着。【turn0fetch2】
2)所谓“算力是英伟达千倍”是有严格前提的
- “1000倍”是指在某些特定任务(例如128×128规模的矩阵运算)下,计算吞吐量可以做到顶级数字处理器的1000倍以上,是“在特定矩阵任务上的局部优势”,不是在所有AI任务上都碾压英伟达通用GPU。【turn0fetch0】
- 实际大模型训练涉及的远不止一种矩阵运算,还包括复杂的数据移动、内存访问、通信、软件栈、框架适配等等,这些都需要一整套生态。这方面传统GPU + CUDA生态仍然非常强势。
3)从实验室到大规模落地,还有很长的工程链路
孙仲自己列举了下一步要做的事:
- 扩大阵列规模:计划在两年内从16×16做到128×128,并力争扩展到512×512,这在工程上会面临寄生效应、良率、功耗分布等一系列挑战。【turn0fetch2】
- 流片与验证:需要真正去代工厂做工程流片、测试、可靠性验证等,这是从“实验室样片”到“可量产芯片”的巨大跨越。
- 生态与市场:要说服产业链伙伴放弃既有成熟方案,去采用一套新范式,这本身就是长期市场博弈。【turn0fetch2】
所以,与其说“已经成功突围”,不如说:
“中国已经验证了一条完全不同于传统数字GPU的新技术路径,这条路径在关键指标上展示出巨大潜力,而且不依赖被严控的先进光刻机。”
## 四、“美国围剿”这个层面,应该怎么看?
更客观地看,可以把“围剿 vs 反围剿”理解成一个动态博弈,而不是“一刀切”的封锁或成功:
1)美国对华芯片围堵的现状
- 在高端制程和高端AI GPU上,美国依然掌握很大优势,并通过不断加码出口管制、拉拢日本/荷兰限制光刻机设备出口等,试图把中国压在成熟制程和“算力天花板”之下。【turn0search8】【turn0search7】
- 同时,美国内部在“要不要继续严控”上有分歧:
- 一方面,有议员推动《安全芯片法案》,进一步收紧高端AI芯片对华出口;
- 另一方面,又传出允许英伟达对华出口H200(但要抽成)等信号,反映出美国既想保持技术领先,又不想完全放弃中国市场。【turn0search7】【turn0search6】
2)中国这边的应对不是“单点突围”,而是“多点开花”
除了孙仲团队的模拟矩阵计算芯片,最近几年中国在:
- 先进制程和自主产线建设(中芯国际等);
- 国产GPU/AI加速芯片(华为昇腾、寒武纪、沐曦、壁仞等);
- 车规/智驾芯片(比如黑芝麻的华山A2000通过美国商务部与国防部审查、可在全球范围销售);【turn0search16】
- 以及算法与开源模型层面(如DeepSeek-R1等)
都在持续突破,整体上是在把“被围堵的局面”转成“多条路线并行发展”的格局。【turn0search15】【turn0search18】
3)比尔·盖茨那种话,更多是战略判断,而不是预言某一款芯片
- 媒体会引用比尔·盖茨的警告:美国过早对华断供芯片,等于提前“发战书”,倒逼中国加快自研;长期看,这会培养出更强的对手。【turn0search10】【turn0search15】
- 这类观点和孙仲团队的出现可以放在同一叙事下理解:
封锁在短期内确实制造了巨大压力,但也让中国更早、更坚决地在多条技术路线上重投入,包括像模拟计算、量子计算、光计算等“换道”尝试。【turn0search18】
从这个角度看:
孙仲团队的芯片,是中国应对围堵的一张“技术储备卡”,而不是“终结一切的王炸”。
## 五、未来几年,这块芯片可能怎么走?
结合团队公开信息和技术逻辑,可以大致判断几个可能的发展方向(不是确定预言):
- 1–3年内:
- 更多是在科研圈和产业试点里验证:
- 在特定场景(比如某类6G MIMO信号处理、特定AI训练任务、超算中的某类偏微分方程求解)做小规模或中等规模部署测试;
- 持续把阵列从16×16扩展到128×128、512×512,解决工程化难题。【turn0fetch2】
- 3–5年内:
- 如果工程化顺利、可靠性达标,有可能看到:
- 面向“AI加速卡”或“专用矩阵计算加速器”的商用产品,与现有GPU形成互补而不是完全替代;
- 在能效敏感的场景(比如部分边缘AI、基站侧AI推理、车端某些算法加速)率先落地。
- 更长期维度:
- 这条路线会不会形成像当年GPU那样的大浪潮,很大程度取决于:
- 二阶训练方法会不会在大模型/超算等领域真正爆发式普及;
- 业界是否愿意围绕模拟计算重构部分算法栈和工具链;
- 中国产业链能否在器件、工艺、封装、软件等层面形成完整生态。
也就是说,它现在更像是在“打地基”:
地基打得好,未来才有机会盖起一座与传统数字GPU并列的大楼。
## 六、怎么理解你说的“完美突破美国围剿”?
如果把“完美突破”理解成:
- 中国完全不再被美国卡脖子;
- 高端芯片随便造,全球市场随便进;
- 短期内就在所有算力场景全面取代美国产品;
那显然现在离那个状态还差很远:
无论是在高端制程、EDA、设备和全球生态层面,美国仍然拥有巨大优势。
但如果把“突破”理解成:
- 在关键赛道上,中国已经掌握了一些“不被你卡死”的技术选项;
- 美国再想通过单一手段(比如断供某一款GPU或某一款光刻机)就锁死中国AI与算力发展,变得越来越难;
- 从战略上,中国已经具备“多条路并行、多点反制”的能力;
那么,孙仲团队的模拟矩阵计算芯片,确实可以被视为其中一个标志性的“突破点”之一——
而且是真正意义上的“原始创新 + 非对称优势”,而不是简单的“追赶型国产化”。
**一句话总结:**
- 这块模拟矩阵计算芯片,是非常扎实、非常有想象力的一项科研成果,给中国提供了一个不依赖先进光刻机的高效能AI算力选项,对打破美国围堵具有“潜在战略价值”;
- 但它现在还处在“实验室+小规模验证”阶段,距离大规模产业化和全面替代传统GPU还有很长的路要走;
- 用它来说“中国找到了一条新路、可以在局部绕开围堵”,是成立的;
- 用它来说“完美突破美国围剿、一切问题都解决了”,就是情绪化宣传了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.