![]()
2026年4月24日,DeepSeek一口气发布了两款新模型,V4-Pro和V4-Flash,宣布以每百万输出token仅3.48美元和0.28美元的价格,提供与Claude Opus 4.6和GPT-5.4相当的性能。
对比一下就明白这个数字的冲击力:Claude Opus 4.6的输出价格是每百万token 25美元,GPT-5.4是15美元。也就是说,DeepSeek V4-Pro的定价比这两个顶级闭源模型便宜了80%到86%,而性能在多数基准测试中几乎并驾齐驱。
这不是第一次了。DeepSeek早在R1模型发布时就用同样的方式震撼了行业,那次成本差距高达90%,直接导致英伟达股价单日蒸发数千亿美元市值。
这一次,DeepSeek选择了"卷土重来"。
两个模型,各司其职
![]()
V4-Pro是这次发布的旗舰产品,规模相当庞大,总参数量1.6万亿,活跃参数490亿,基于33万亿token的数据预训练而成。V4-Flash则轻巧许多,总参数2840亿,活跃参数仅130亿,但依然共享100万token的超长上下文窗口,两款模型均完全开源。
在架构层面,DeepSeek引入了自研的DSA稀疏注意力机制,结合token压缩技术,使得百万级上下文推理成为默认选项,而不是需要额外付费的高级功能。这一点在行业内颇为罕见,大多数服务商要么对长上下文设置使用门槛,要么单独收费。
V4-Flash与V4-Pro之间的性能差距比外界预期的小得多。在MMLU-Pro测试中,两者相差仅1.3个百分点;SWE-Verified软件工程任务测试中,差距不到2个百分点。真正出现明显分化的,是Terminal Bench(复杂多步骤工具使用)和SimpleQA(事实记忆检索)这两项测试,V4-Flash在这里的表现明显弱于V4-Pro。对于大多数日常开发场景来说,V4-Flash已经完全够用,而不只是个简配版替代品。
基准数字背后的真相
![]()
DeepSeek发布的基准测试数据相当详细,直接与全球顶级闭源模型进行对比,逐项摊开来看,结果相当有说服力,但并非全面碾压。
在编程领域,V4-Pro是毫无争议的赢家。LiveCodeBench得分93.5,领先于Gemini-3.1-Pro(91.7)和Claude Opus 4.6(88.8);Codeforces竞技编程评分3206,同样超越了GPT-5.4(3168)和Gemini(3052)。
数学推理方面,V4-Pro同样表现亮眼,IMOAnswerBench得分89.8,大幅领先Claude(75.3)和Gemini(81.0),仅略逊于GPT-5.4的91.4分。
![]()
相对薄弱的领域是"丰富的世界知识检索"。在HLE(人类最后的考试)测试中,V4-Pro得分37.7,低于GPT-5.4(39.8)、Claude(40.0)和Gemini(44.4);SimpleQA-Verified测试中,V4-Pro以57.9分落后于Gemini的75.6分。DeepSeek在技术文档中坦承了这一差距,表示这是V4-Pro目前已知的能力边界。
这种坦诚本身值得关注。一家愿意在发布文档中直接写明自己弱点的公司,往往比那些只展示精选测试结果的公司更值得信任。
价格战的连锁效应
这场价格冲击已经不是DeepSeek第一次发动,但每一次它依然有效。
R1发布后,OpenAI在极短时间内向免费用户开放了高级模型。这一次,V4的定价压力落在了企业市场和API开发者群体上,因为在那些场景里,每百万token的价格直接决定产品是否具有商业可行性。
值得关注的是,此次V4-Pro已与Claude Code、OpenClaw和OpenCode等主流智能体框架完成集成,这说明DeepSeek已经不再满足于跑基准分,而是着眼于真实的开发者工作流。当一个开源模型以同等性能嵌入到开发者每天使用的工具链中,闭源模型的溢价逻辑就会受到真实的挑战。
DeepSeek自2023年成立至今走过了一条并不平坦的路。R1的爆红之后,阿里巴巴的Qwen系列逐渐追上并在部分测试中超越了它。这次V4双模型的同步发布,被外界解读为DeepSeek重新夺回技术话语权的一次主动出击。
不管最终市场格局如何演变,V4的出现已经在事实上重新设定了行业对"顶级AI模型应该卖多少钱"这个问题的预期。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.