美国人这几年搞“小院高墙”,门焊死了,就想把华为活活困死在里头。
结果呢?美国人傻眼了。
华为非但没死,反手在2025年9月的全联接大会上,扔出个终极“王炸”:一套构建百万卡AI集群的宏伟蓝图!
这已经不是突围,这是要正面掀桌子了。
384张卡“掀桌子”:拿“系统”硬刚“单点”
必须承认,美国的封锁一度让华为非常难受。
大模型时代,算力就是一切。可这玩意儿,以前基本只有英伟达一家能上桌打牌。
在美国层层加码的芯片管制下,华为拿不到先进制程,导致单颗昇腾芯片的算力,只有英伟达BlackwellGPU的大概三分之一。
![]()
差距是客观存在的。华为专家自己都坦承,过去客户用昇腾,很多时候是因为被美国断供,“被迫用昇腾”。
那个时候,别说客户了,连华为内部都弥漫着一股焦虑:“昇腾算力到底能不能行?”
所有人都以为华为这局“死定了”。
但美国人忘了,华为这家公司,最擅长的就是“不按套路出牌”。
你卡我单芯片?行,那我就不跟你玩“单点PK”了。
华为内部搞了个“算力会战”,把华为云、模型、底座、芯片、硬件、基础软件全喊到一块,干了票大的。
![]()
这叫什么?华为云CEO张平安管这叫“发挥‘大杂烩’的优势”。
翻译过来就是:用“系统工程”,拿“集群”的规模优势,硬刚你“单卡”的性能优势。
这场“掀桌子”的代表作,就是已经开始发货的“昇腾384超节点”(CloudMatrix384)。
这玩意儿,可不是把384张卡插在一个大插排上那么简单。
为了让384颗昇腾NPU和192颗鲲鹏CPU像“一个超级大脑”一样思考,华为几乎把自己的老底都掏出来了。
![]()
首先,扔掉老架构。
华为打破了以CPU为中心的传统冯诺依曼架构,搞出了一套自有标准的“全对等互联架构”。
华为创始人任正非打过一个比方:西方的架构是“百衲衣”,衣服破了不断打补丁,协议五花八门,互通效率很低。
华为干脆不补了,重新定义了总线,统一了通信协议,把有效载荷拉满。
其次,砸钱上“硬科技”。
芯片堆在一起,数据传输就是个致命难题。
华为的办法是“上光”!在384超节点里,塞进了3168根光纤和6912个400G光模块。用光通信的高带宽、低损耗,解决跨机架的“堵车”问题。
还有散热。这么多芯片堆一起,热量大到能“瘫痪系统”。
华为直接上了“液冷散热”。华为专家说,这背后是材料科学的胜利,是华为在全球的8个材料实验室、86个基础技术实验室“用数学补物理”的成果。
![]()
这就是华为的打法:“以面积换能力、以堆叠增容量、以集群扩规模”。
你芯片是厉害,但我用光通信、新材料、新架构这些“系统”能力,照样能跟你掰手腕。
性能“反向碾压”?黄仁勋:它超越了英伟达
这条“系统换单点”的邪路,华为还真就走通了。
走通的结果,“吓人一跳”。
2025年8月,华为云CEO张平安在中国国际大数据产业博览会上,扔出了第一个数据:
华为的昇腾AI云服务,不在意它是7纳米还是10纳米,在意的是“最终计算结果”。
结果就是,在CloudMatrix384超节点上,每张卡(50ms时延下)可以生产出2400个Token。
这是什么概念?
张平安说:“这个效率是H20的三倍。”
![]()
这还没完。
华为云透露,在智能驾驶领域,多个项目的实际测试显示,在典型感知模型上,384超节点可以达到或者超过H100的2.5-3倍。
最狠的对比,来自英伟达自家的“王牌”。
英伟达最新的GB200NVL72系统,集成了72块BlackwellGPU,单柜算力惊人。
而华为的昇腾384超节点,可提供高达300PFlops的密集算力。
有专家指出,这个性能表现,接近英伟达GB200NVL72系统的两倍。
![]()
这一下,全球科技圈都“炸锅”了。
要知道,英伟达的CEO黄仁勋,在2024年2月才首次把华为列为AI芯片等多个类别的“主要竞争对手”。
仅仅几个月后,黄仁勋在评价华为时,用词已经变成了“非凡”(extraordinary)。
黄仁勋在接受采访时说,华为是一家“规模和实力非凡的公司”,“拥有强大芯片设计能力、系统设计和系统软件”。
他甚至罕见地承认:“从技术参数看,华为的CloudMatrix384超节点,性能上超越了英伟达。”
![]()
这是什么?这就是对手的“尊重”。
黄仁勋说,华为是“对手,不是敌人”,他对华为的感情是“钦佩、尊重,并且充满竞争意识”。
能让黄仁勋说出“钦佩”两个字,华为靠的不是别的,正是这种在绝境中“硬干实干”,用“系统”砸出一条血路的能力。
终极蓝图:百万卡集群,美国最不想看的局
如果说384超节点是华为“掀桌子”的第一步,那它在2025年9月18日全联接大会上公布的蓝图,就是“终极阳谋”。
华为轮值董事长徐直军在上海宣布,华为将构建“百万卡规模超节点AI集群”。
这不是吹牛,这是一张清晰的技术路线图。
2026年第四季度,率先推出基于下一代昇腾950芯片的集群,实现超过50万张AI卡的规模。
![]()
到2027年第四季度,正式建成基于昇腾960芯片、规模达到百万卡级别的集群。
美国人最不想看到的一幕,正在发生。
美国搞“小院高墙”,本意是彻底锁死中国的AI算力发展。
可他们没想到,你封锁硬件,华为就“以集群扩规模”;你垄断CUDA生态,华为就自建CANN和MindSpore软件栈。
英伟达的CUDA生态,就像AI界的“Windows系统”,全球90%的AI框架都基于它开发。
这曾是国产芯片“鬼门关”。
![]()
但现在,华为正通过聚焦Transformer等主流模型的核心算子(从几万个收敛到几百个),快速补齐生态短板。
华为专家说,我们不会跟在西方标准后面“打补丁”,我们要重新定义架构,打造基于“中国标准”的“爱马仕”。
这个“百万卡集群”计划,就是中国实现AI算力自给战略目标的关键落子。
它将为中国的大模型产业提供强大的本土算力支持,筑起一道坚实的“算力长城”。
外交部发言人毛宁说得好:“事实证明,‘小院高墙’挡不住中国创新发展的步伐。”
美国这波操作,非但没能“困死”华为,反而“唤醒了一个沉睡的巨人”,逼着中国在AI算力这条最关键的赛道上,开辟了一条完全自主的道路。
参考资料
英伟达首次将华为列为“对手”,外交部:“小院高墙”挡不住中国创新发展步伐.中国青年报.2024-02-27
全球最强!华为发布超节点和百万卡算力集群!.太平洋科技.2025-09-19
华为昇腾384卡掀桌!国产算力撕破英伟达垄断这局必须赢!.新浪财经.2025-07-29
黄仁勋谈中国芯片企业:是对手不是敌人实力非凡值得钦佩.国际在线.2025-07-21
华为计划三年内在AI芯片领域超越英伟达.新浪财经.2025-09-23
华为云CEO:384超节点每卡性能可达英伟达H20三倍.新浪财经.2025-08-30
用“系统工程”打破算力封锁昇腾的另类突围路径.每日经济新闻.2025-06-17
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.