最近DeepSeek V4彻底刷爆科技圈与投资圈,公开跑分追平甚至部分超越GPT-4o、Claude 3 Opus等海外顶级模型,英伟达CEO黄仁勋更是罕见公开发出“灾难性影响”的警告,看似是中国AI扬眉吐气的里程碑事件。我翻完37页官方技术报告、捋完近3个月的算力供应链政策与产业动态后,却半点轻松不起来。这场狂欢的底色,是中国AI产业在高端算力封锁下被逼到极致的“螺蛳壳里做道场”,所有耀眼突破背后都拖着现实引力的沉重枷锁,远不到开香槟庆功的时候。
![]()
我在AI产业圈摸爬滚打8年,见过太多PPT造神的闹剧,这次DeepSeek的突破之所以让人五味杂陈,核心是它走的路完全不同于硅谷的“土豪模式”。不管是OpenAI还是Anthropic,背后都有微软、亚马逊的无限算力支撑,动辄几万张英伟达B200、GB200组成的统一架构集群,底层逻辑就是“大力出奇迹”——算力够多够好,算法上的瑕疵完全可以用硬件冗余掩盖。 而DeepSeek的极致优化,本质是“穷人的智慧”。我们必须承认一个客观现实:当前国内拿不到英伟达最顶级的AI芯片,哪怕是降配特供芯片或国产算力集群,规模扩展到万卡级别时,通信损耗会呈指数级上升。
据IDC 2025年发布的《中国AI算力集群效能白皮书》,异构万卡集群的有效算力损耗最高可达42%,一万张性能为10的卡,实际输出仅相当于5800张卡的效果。这就是为什么DeepSeek对显存、激活参数的压榨到了近乎痴迷的地步,把MoE架构玩出花,死磕每个Token的计算效率——不是为了炫技,是为了给受限的硬件打补丁,这种在螺蛳壳里做道场的极致内卷,可敬,却也透着无奈。
![]()
真正让行业震动的,不是V4的跑分,而是两个配套动作:一是开源TileKernels算子,二是华为昇腾官宣V4将在昇腾平台首发。这才是整场发布会的核心杀招:DeepSeek正在强行把国产算法和国产硬件焊死在一起。 英伟达的护城河从来不是单卡算力,而是CUDA软件生态。信通院2025年《全球AI开发生态报告》显示,过去15年全球累计1200万AI开发者基于CUDA写代码,国内92%的AI项目默认适配英伟达硬件,国产算力芯片的平均软件适配率不足28%——不是国产卡跑分不行,是没有足够的底层算子适配,代码跑起来卡顿、报错,效率连英伟达卡的1/10都达不到。而DeepSeek这次开源的TileKernels,直接把MoE路由、FP8训练推理的底层适配在国产芯片上一次性搞定,相当于给所有国产大模型厂商铺好了适配国产算力的路,也给昇腾950的大规模量产做了顶级“试金石”。
我上个月跟昇腾的底层工程师吃饭,他说为了适配V4的MoE架构,团队连续2个月每天盯到凌晨3点,光通信协议的bug就改了170多版。这种没人愿意干的脏活累活,DeepSeek干了,本质是在挖英伟达CUDA生态的墙脚。更关键的是,官方明确提到,下半年昇腾950量产后V4的API价格将大幅下调,这意味着DeepSeek正在实质性摆脱对英伟达昂贵算力的依赖,跟“英伟达税”彻底脱钩。黄仁勋怕的从来不是某一个中国模型跑分高,而是中国企业跑通了“没有英伟达也能做顶级大模型”的路径——一旦这个路径被验证可行,英伟达软硬捆绑收割全球的万亿市值逻辑,在中国市场就撕开了一道无法修补的裂痕。
![]()
但硬币的另一面,是三个绕不开的现实难题,这也是我高兴不起来的核心原因。 第一个是物理鸿沟无法靠算法抹平。单卡显存带宽、芯片互联技术的代差是客观存在的,哪怕算法优化到极致,也不可能违反物理定律。1.6万亿参数的V4在异构集群上训练,根本不是公关稿里写的那么云淡风轻:集群崩溃、梯度爆炸、连夜排查bug、漫长的断点续训都是常态,我听DeepSeek的内部人说,V4训练期间曾出现过一次集群故障,光是恢复数据、续训就花了整整一周,这种代价,硅谷团队根本不需要承担。
第二个是烧钱的无底洞。据36氪2026年4月独家报道,DeepSeek拟启动的首轮市场化融资估值达210亿美元,阿里、腾讯均已进入尽调环节,打破了其成立3年不接受巨头投资的惯例。原因很残酷:大模型越往后越像重资产基建,哪怕昇腾950量产后硬件成本下降,一个几万张卡的超算中心,每天的电费、冷却费、折旧费就超过百万元,在商业化闭环跑通之前,自有资金根本填不满这个吞金兽。拿巨头的钱能续命,但代价是未来的商业化路线、开源节奏,不可避免要受到资本意志的影响。 第三个是人才的全球化争夺。
![]()
近期圈内确实有DeepSeek核心人员流失的传闻,我从来不觉得这是什么道德问题——AI领域的人才竞争是全球化的,硅谷巨头开得出百万美元年薪加期权,国内其他大厂也愿意掏两三倍薪水挖角,顶尖研究员不是苦行僧,不能指望他们永远用爱发电。如何留住这些最聪明的大脑,是比技术优化更难解的题。
DeepSeek创始人梁文锋是我非常佩服的极客,从幻方量化到DeepSeek,他一直是个纯粹的技术理想主义者,但现在他面临着一个几乎无解的“不可能三角”。第一是团队纯粹性与工程泥泞的矛盾:DeepSeek一直靠小而精的顶尖团队著称,但为了适配国产芯片,要做大量琐碎、毫无美感的底层搬砖工作,要维持极客文化就很难应对海量的工程需求,要补工程短板就必然要扩张团队,稀释原有的文化氛围。
第二是独立性与算力饥渴的矛盾:DeepSeek之前之所以受尊敬,就是因为它是少有的不绑定巨头的独立大模型公司,但现在要迭代下一代模型,必须要有源源不断的资金买算力,拿巨头的钱是必然的妥协,可未来还能不能坚持现在的开源节奏、不被巨头的业务需求绑架,还是个未知数。第三是价格普惠与人才成本的矛盾:V4承诺下半年API降价,继续做价格屠夫,但现在AI人才薪资水涨船高,没有足够的利润,根本拿不出匹配硅谷的薪酬留人才,一味降价换市场,最后可能留不住核心团队。
![]()
DeepSeek V4绝对是中国AI发展史上的里程碑,它的伟大从来不是跑分碾压海外,而是在极度受限的环境下,硬生生杀出了一条血路,证明了中国工程师哪怕没有最顶级的芯片,也能做出世界一流的大模型。但我真的劝大家别忙着狂欢,中国AI产业没有捷径,也没有弯道超车的可能。我们没有最先进的光刻机,拿不到最顶级的芯片,还要面临随时升级的制裁风险,曾国藩说的“结硬寨,打呆仗”,就是未来十年中国AI产业的唯一出路。 不要指望某一个天才算法能扭转乾坤,也不要沉迷于发布会的参数狂欢,真正决定生死的,是聚光灯之外的苦活累活:一行行重写底层算子,一个个填平国产芯片的bug,一笔笔算清商业化的经济账。V4只是用血肉之躯在荆棘地里趟平了第一段路,整个中国科技产业的漫漫长征,才刚刚开始。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.