![]()
来源:制造界 原创:秀二
2025 年8 月5 日,无疑是具有里程碑意义的一天。北京昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布:昇腾AI核心软件平台CANN将全面开源。并Mind系列应用套件及工具链同步开放,支持开发者深度定制。
华为将CANN代码库向全球开发者敞开,恰如当年Linux打破操作系统霸权。是中国AI 算力产业的一座灯塔,照亮了国产算力突破技术封锁、实现自主创新的前行道路。徐直军说,“使能每一位创新者”,正在将算力主权交还人类。
1/AI原子弹时刻, 撼动英伟达
这一决定被业界视为中国AI算力生态的“原子弹时刻”——在英伟达CUDA生态垄断全球AI计算二十年后,中国首次拥有了从芯片、框架到应用的全栈开源生态。英伟达的“CUDA帝国”似乎听到了围墙开裂的声音。
英伟达的护城河从来不是硬件,而是近二十年构建的CUDA开发者生态,在全球数百万开发者形成的“细胞记忆”,让即使性能接近的国产芯片也难以撬动市场。华为此次开源,正是瞄准这一核心痛点。打破英伟达生态垄断。
长期以来,英伟达凭借其成熟的CUDA 生态系统,在全球AI 算力市场占据着近乎垄断的地位。CUDA 将英伟达的GPU 硬件与软件开发环境紧密结合,为开发者提供了高效的编程模型和丰富的工具库,吸引了全球600 多万开发者投身其中,构建起了一道难以逾越的技术壁垒。
这一封闭生态虽然推动了AI 技术的早期发展,却也带来了高昂的硬件成本、严苛的技术锁定以及潜在的供应链风险。2023 - 2024 年间,英伟达推出专为中国市场定制的A800/H800 系列,后又将其列入管制清单,2025 年H20 芯片的禁售与解禁反复,充分彰显了这场技术博弈的复杂性与激烈性。对中国AI 产业而言,过度依赖英伟达技术,犹如在咽喉处悬了一把利刃,严重制约着产业的自主可控发展。
CANN 的全面开源开放,为中国AI 产业提供了打破这一垄断格局的利刃。通过开放其核心技术,使得开发者无需再受限于英伟达的技术体系,能够直接对昇腾硬件的底层算力进行调用与优化,打破以往依赖英伟达GPU 时的性能瓶颈。
在编译器生态方面,华为毕昇编译器开放AscendNPU IR 接口,这一举措更是具有变革性意义。让国产AI 开发体系摆脱了对国外编译器技术的依赖,在技术创新的道路上轻装上阵。
2/全球变局,AI算力将全栈崛起
CANN开源不仅是技术事件,更在重构全球AI权力结构,开启中国AI算力新纪元。2025 年 CANN 开源,或将成为中国算力生态的“新原点”。
短期看,CUDA仍主导欧美市场,而CANN+昇腾成为中国及新兴市场首选,新兴国家据成本与政策灵活选择。多元竞争推动全球算力价格下行,预计五年内AI训练成本降低30%以上。
2025年中国算力生态正从碎片化走向整合。华为昇腾、沐曦、壁仞科技等国产芯片厂商罕见联手,避免生态内耗。昇腾已在中国移动AI设备集采拿下70%份额,并赋能东方国信、直真科技等开发行业方案,边缘场景开发周期缩短50%。
2024年,华为昇腾910C在实测中展现出超越英伟达H100的效率,其先进的架构设计与强大的计算能力,为中国AI 算力提供了坚实支撑。天数智芯的天垓 100 芯片在金融领域市占率突破15%,凭借对金融场景的深度优化,实现了高效的算力输出。寒武纪思元590 更是以惊人的42.3 倍季度营收增长,印证了国产 AI 芯片的市场竞争力。
据IDC 数据显示,2025 年上半年国产算力占比已跃升至42%,较2022 年大幅提升近 30 个百分点,这一数据直观地反映出国产算力在技术封锁下的逆袭态势。
全栈自主生态的构建
在芯片设计环节,寒武纪、沐曦、壁仞等企业不断发力。寒武纪持续迭代思元系列芯片,在智能安防、智能驾驶等多领域广泛应用;沐曦推出的曦云C600 GPU,实现从设计到封装的 100% 国产供应链闭环,性能对标国际旗舰产品;壁仞科技自主原创架构的大算力通用GPU 液冷模组壁励166L,为超节点建设提供核心动力。
芯片制造层面,中芯国际取得重大突破。通过自研蚀刻补偿算法和对DUV 设备的改造,在无 EUV 光刻机的情况下成功实现5 纳米工艺验证,量产良率达92%,超越台积电初代5 纳米水平,为国产AI 芯片制造奠定了坚实基础,有力保障了芯片供应的自主性与稳定性。
华为昇腾384 超节点在 2025 世界人工智能大会上惊艳亮相。它整合384 颗升腾NPU 和192 颗鲲鹏CPU,总算力达300PFlops,超越英伟达GB200 NVL72 系统。
其创新采用的MatrixLink 全对等互联技术,将芯片间通信带宽提升至 269TB/s,是传统方案的数倍,有效打破跨机通信瓶颈,使千亿级模型性能提升2.5 倍以上,为大规模 AI 训练与推理提供了强大动力。
光互连技术也取得重大突破。曦智科技联合壁仞科技、中兴推出全球首款分布式光交换(dOCS)超节点,采用硅光芯片实现GPU 间光互连。极大提升了算力集群的灵活性与可扩展性。
新兴算力探索同样成果丰硕。浙江大学研发的“悟空” 类脑计算机,拥有超20亿神经元,规模接近猕猴大脑,运行功耗仅2 千瓦,却能实现复杂逻辑推理、语言理解等功能,为AI 算力架构提供了全新思路,开辟了类脑计算的新赛道;
本源悟空量子计算机成功完成全球首个十亿参数AI 模型微调任务,能耗降低70%,训练效率提升数百倍,实现量子计算与AI 的深度融合,有望为AI 算力带来颠覆性变革。
全球格局中的中国力量
在全球AI 算力格局中,中国正从追随者逐步转变为引领者。中国智能算力规模预计2025 年达1037.3EFLOPS,全球占比超25%,2026 年将翻倍至1460.3EFLOPS,成为全球智能算力增长的重要引擎。
牛津大学报告显示,中国拥有22 座AI 算力工厂,其中3 座完全采用华为芯片,在全球130 座工厂中占比17%,彰显了中国在AI 算力基础设施建设方面的强大实力。
全球变局之下,中国AI 算力全栈崛起已成为不可阻挡的趋势。从技术突破到生态构建,从产业协同到政策支持,中国正全方位打造具有国际竞争力的AI 算力产业体系。
联系我们:txm176(值班微信)广告及商务合作:电话18660411611投稿及采访约谈:邮箱447377407@qq.com
版权声明:制造界除发布原创文章外,亦致力于优秀文章的交流分享。转载注明文章来源和作者;申请转载授权请在文末或后台留言。版权所有,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.