梁文锋说了句大实话。
"没有昇腾910B这颗芯片,DeepSeek等国产大模型将依赖英伟达。"
![]()
这话不是客套,2026年4月,DeepSeek V4发布,万亿参数模型全面适配华为昇腾950PR芯片,底层代码从英伟达CUDA迁移到华为CANN框架,耗时五个月。
中国最火的AI大模型,把算力命脉从美国芯片换成了中国芯片,五个月,重写一切
迁移过程不是"调几个接口"那么简单。
CUDA是英伟达的护城河——它不只是一套编程工具,是十几年积累的模型、框架、芯片协同演化的生态,全球AI开发者都是在CUDA上写代码、调模型、跑训练。
DeepSeek团队要做的是:把整套底层代码全部重写,不是翻译,是重构,从指令集到算子适配,从内存管理到分布式训练策略,从优化器到推理引擎。
五个月,放在AI行业里,这个速度不慢。
但真正的挑战不在代码层面。梁文锋团队在做适配的时候,还要同时应对外部攻击,DeepSeek曾遭遇大规模恶意黑客攻击,团队一边修复漏洞一边推迁移进度,借了华为毕昇防御系统来做攻击溯源。
![]()
等到V4发布,DeepSeek把华为昇腾NPU和英伟达GPU并列写进了官方硬件验证清单,这是第一次有国产万亿级大模型这么做。
梁文锋为什么选择这么做呢?
英伟达高端GPU对中国的供应一直不稳定,你今天用H100跑得欢,明天可能就被断供,对于DeepSeek这种级别的企业,技术路线不可控等于命脉被人掐着。
梁文锋的选择本质上是底线思维:与其随时担心外面断供,不如花五个月把根扎到自己的土地上。
还有一个产业层面的逻辑。DeepSeek适配昇腾,不只是为自己省钱,它是给整个中国AI产业打了个样——头部大模型用国产芯片跑通了,后面的中小模型公司才会跟上来,芯片和模型之间是协同演化的关系,用的人越多,芯片生态越成熟。
![]()
根据行业分析,DeepSeek全面适配昇腾后,部署成本降了约70%,万亿参数模型能跑在国产芯片上,这个成本变化对AI应用的规模化落地,影响很大,国产算力生态,从"能跑"到"好用"
这事的意义不在DeepSeek一家。
过去国产芯片和AI大模型的关系是"芯片被动适配模型"——模型在英伟达上训练好了,再尝试搬过来跑跑。这次V4是反过来:模型和芯片在开发过程中就开始协同优化。
"Sora出来的时候,大家觉得差距又拉大了,但DeepSeek V4适配昇腾这件事,让我们重新相信,差距可以缩小。"这是行业里的普遍看法。
从产业角度看,华为造芯、DeepSeek炼模,这种头部企业的深度合作,正在从"单点突围"走向"生态协同",芯片、框架、模型三层打通,这才有可能真正建成中国自己的AI基础设施。
![]()
五个月迁移,不是一个技术问题的解决,而是一条路的确认。
你觉得中国AI的底层算力,能彻底摆脱对英伟达的依赖吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.