![]()
DeepSeek时刻再现!V4版本正式发布,打破欧美垄断,中国算力体系崛起!
对于中国AI届来说,今天是一个注定载入史册的日子,不仅仅是在OpenAI发布GPT-5.5的几个小时后,DeepSeek-V4预览版正式上线并同步开源。
更重要的是,这意味着中国顶尖的大模型公司,从0开始适配中国自己的芯片算力体系。
![]()
DeepSeek-V4 正式发布
今天,我们就来深度解析DeepSeek V4发布背后的技术突破、算力博弈,以及中美AI竞争的新格局。
码字不易,欢迎点赞,转发,收藏。
周五王炸!DeepSeek V4到底带来了什么?
说实话,这次V4的发布,等得太久了。从2025年初V3发布之后,关于V4什么时候发、是不是跳票、是不是已经被别家超越的传言,在中英文AI圈来来回回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。
然而,这一次的DS依然没有让我们失望。4月24日午间,DeepSeek V4预览版正式上线。一口气发了两个版本:
第一个,DeepSeek-V4-Pro,定位旗舰版,参数1.6万亿,激活490亿,预训练数据33万亿,对标顶级闭源模型。在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
![]()
DeepSeek-V4性能是开源模型“天花板”
第二个,DeepSeek-V4-Flash:轻量版,参数2840亿,激活130亿,预训练数据32万亿。推理能力接近Pro,世界知识储备稍逊,但参数更小、速度更快、成本更低。
两个版本最大上下文都是1M(百万词元),支持百万字超长上下文。输出长度最大为384K tokens。虽然对于普通人来说早就够用,但是对于有专业需求,利用AI干活的人来说,这是一个非常大的利好消息。
因为去年的时候,1M长度的上下文还是一个非常高级的玩意,但是DS大模型利用新的算法技术,直接把原本搞搞早上的参数打成了白菜价。
![]()
DeepSeek V4在其Vibe Code Benchmark中"以压倒性优势"成为开源权重模型第一
V4是怎么做到的?官方技术报告直接给出了答案,DS的V4版本开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力一起用,相比传统方法,对计算和显存的需求大幅降低。
这也非常符合DeepSeek在去年春节期间给我们的印象,那就是利用中国人的聪明才智,开创新的算法来弥补我们算力被美国卡脖子的境地,从而追赶甚至和美国的先进大模型,并驾齐驱。
那么,在使用DeepSeek方面,这次的V4版本,还是一样的“物美价廉”么》去年的DeepSeek做到了,今年的DeepSeek是否会让我们失望?
直接做一个对比。
美国方面,OpenAI刚刚发布GPT-5.5,号称"迄今为止最智能、最直观的版本",主打Agent能力和多模态。定价方面,每百万输出token 30美元,继续走高端路线。
而中国这边的DeepSeek V4同步开源,性能达到最强开源模型,以及顶级闭源模型,但是其价格却非常低。到底有多低呢?
![]()
简单来说,DeepSeek V4 是目前成本最低的先进大模型
根据凤凰网的数据,DeepSeek-V4凭借全新稀疏注意力与同策略蒸馏技术,把推理成本压到新低,V4-Flash版输出价仅为GPT-5.5 Pro的1.55‰
如果换成其他的国外大模型,从使用成本来看,他们的成本依然是DeepSeek-V4的几十倍。
低价带来一个好处,就是可以迅速的普及DeepSeek-V4的使用,造福中国乃至全世界的消费者,迅速占领市场。更别提两者的差距虽然有,但是对普通人来说已经忽略不计。
就连DeepSeek自己都说,公司内部已经用DeepSeek-V4开始写代码了。
DeepSeek-V4,要构建中国自己的算力体系
刚刚我们说了一个问题,为什么这次DeepSeek-V4版本的发布拖了很久?其实DeepSeek有了一个野心,那就是要让中国的AI大模型,跑在中国的芯片上。
众所周知,现在全球最赚钱的几个企业之一,就是英伟达,英伟达之所以赚钱,除了因为台积电的先进芯片代工工艺之外,英伟达自己有一个“生态”,那就是CUDA。
![]()
英伟达的CUDA,是其生态的护城河
如果DeepSeek继续买英伟达的芯片,去买特朗普开绿灯卖给中国的H200芯片,那么DeepSeek的发布日期肯定会快上几个月,但是DeepSeek却选择了一条更加难走的路:主动适配国产芯片。
根据DS官方技术报告"我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。"
华为计算官微紧随其后发文:昇腾一直同步支持DeepSeek系列模型,本次双方通过芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。
寒武纪也不甘落后。就在V4官方信息发布后,寒武纪通过其官方公众号表示,已基于vLLM推理框架完成对DeepSeek V4两个模型版本的"Day 0适配"。
再叠加美商务部长近日证实,英伟达H200芯片"一块芯片也没卖出去"的实际情况,这次的DeepSeek真正做到了用国产芯片来跑国产大模型,中国真正意义上实现了具有先进水平的“AI自主”。
![]()
美商务部长:英伟达H200芯片尚未售予中国企业
当然,由于时间的问题,我们依然面临巨大的挑战。
DS官方表示,"受限于高端算力,目前V4 Pro的服务吞吐能力有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。"
这句话的意思是,由于时间比较短,现在的国产算力难以满足目前的高需求,但是等下半年以后,情况就会好转,到时候原本就很低的成本,会因为搭载更多的国产AI芯片,价格变的更低。
此外,DeepSeek还在不断的改变过去自己制定一些规则。
比如此前的DeepSeek表示自己完全不需要融资。但是现在情况不同了,DeepSeek主动寻求200亿美元以上的融资。
![]()
众所周知,其实DeepSeek的母公司就是幻方量化,幻方根本就不差钱,所以这次DeepSeek主动寻求融资,一方面是为了给公司期权定价,使员工手中的期权价值变得清晰,从而留住核心研究人才,抵御来自大厂和高估值初创公司的挖角。
其次,AI模型的研发和部署极度依赖算力资源。融资可以换取像国内巨头和战略投资者的算力、客户渠道和产业协同支持,DS的官方文章也提到,DeepSeek在V4发布时坦承算力受限,融资是缓解此压力的现实路径。
当然,DeepSeek的挑战依然存在。
比如多模态能力的缺失、核心人才的流失、国产算力的大规模商用仍需时间,这些都是DeepSeek需要面对的现实问题。
但正如DeepSeek在发布稿结尾引用的那句话:"不诱于誉,不恐于诽,率道而行,端然正己。"这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。
![]()
不诱于誉,不恐于诽,率道而行,端然正己
按照自己的想法和道路,做自己最满意的产品,梁文峰已经做到了两次,我也相信,DeepSeek不会让所有期待它的人失望。
【樱狼财经】探寻热点背后的真相,欢迎点赞、评论、赞赏。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.