网易首页 > 网易号 > 正文 申请入驻

DeepSeek新发布:远低于GPT 5.4和Opus 4.6

0
分享至



2026年4月24日,DeepSeek一口气发布了两款新模型,V4-Pro和V4-Flash,宣布以每百万输出token仅3.48美元和0.28美元的价格,提供与Claude Opus 4.6和GPT-5.4相当的性能。

对比一下就明白这个数字的冲击力:Claude Opus 4.6的输出价格是每百万token 25美元,GPT-5.4是15美元。也就是说,DeepSeek V4-Pro的定价比这两个顶级闭源模型便宜了80%到86%,而性能在多数基准测试中几乎并驾齐驱。

这不是第一次了。DeepSeek早在R1模型发布时就用同样的方式震撼了行业,那次成本差距高达90%,直接导致英伟达股价单日蒸发数千亿美元市值。

这一次,DeepSeek选择了"卷土重来"。

两个模型,各司其职



V4-Pro是这次发布的旗舰产品,规模相当庞大,总参数量1.6万亿,活跃参数490亿,基于33万亿token的数据预训练而成。V4-Flash则轻巧许多,总参数2840亿,活跃参数仅130亿,但依然共享100万token的超长上下文窗口,两款模型均完全开源。

在架构层面,DeepSeek引入了自研的DSA稀疏注意力机制,结合token压缩技术,使得百万级上下文推理成为默认选项,而不是需要额外付费的高级功能。这一点在行业内颇为罕见,大多数服务商要么对长上下文设置使用门槛,要么单独收费。

V4-Flash与V4-Pro之间的性能差距比外界预期的小得多。在MMLU-Pro测试中,两者相差仅1.3个百分点;SWE-Verified软件工程任务测试中,差距不到2个百分点。真正出现明显分化的,是Terminal Bench(复杂多步骤工具使用)和SimpleQA(事实记忆检索)这两项测试,V4-Flash在这里的表现明显弱于V4-Pro。对于大多数日常开发场景来说,V4-Flash已经完全够用,而不只是个简配版替代品。

基准数字背后的真相



DeepSeek发布的基准测试数据相当详细,直接与全球顶级闭源模型进行对比,逐项摊开来看,结果相当有说服力,但并非全面碾压。

在编程领域,V4-Pro是毫无争议的赢家。LiveCodeBench得分93.5,领先于Gemini-3.1-Pro(91.7)和Claude Opus 4.6(88.8);Codeforces竞技编程评分3206,同样超越了GPT-5.4(3168)和Gemini(3052)。

数学推理方面,V4-Pro同样表现亮眼,IMOAnswerBench得分89.8,大幅领先Claude(75.3)和Gemini(81.0),仅略逊于GPT-5.4的91.4分。



相对薄弱的领域是"丰富的世界知识检索"。在HLE(人类最后的考试)测试中,V4-Pro得分37.7,低于GPT-5.4(39.8)、Claude(40.0)和Gemini(44.4);SimpleQA-Verified测试中,V4-Pro以57.9分落后于Gemini的75.6分。DeepSeek在技术文档中坦承了这一差距,表示这是V4-Pro目前已知的能力边界。

这种坦诚本身值得关注。一家愿意在发布文档中直接写明自己弱点的公司,往往比那些只展示精选测试结果的公司更值得信任。

价格战的连锁效应

这场价格冲击已经不是DeepSeek第一次发动,但每一次它依然有效。

R1发布后,OpenAI在极短时间内向免费用户开放了高级模型。这一次,V4的定价压力落在了企业市场和API开发者群体上,因为在那些场景里,每百万token的价格直接决定产品是否具有商业可行性。

值得关注的是,此次V4-Pro已与Claude Code、OpenClaw和OpenCode等主流智能体框架完成集成,这说明DeepSeek已经不再满足于跑基准分,而是着眼于真实的开发者工作流。当一个开源模型以同等性能嵌入到开发者每天使用的工具链中,闭源模型的溢价逻辑就会受到真实的挑战。

DeepSeek自2023年成立至今走过了一条并不平坦的路。R1的爆红之后,阿里巴巴的Qwen系列逐渐追上并在部分测试中超越了它。这次V4双模型的同步发布,被外界解读为DeepSeek重新夺回技术话语权的一次主动出击。

不管最终市场格局如何演变,V4的出现已经在事实上重新设定了行业对"顶级AI模型应该卖多少钱"这个问题的预期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世锦赛一夜崩三冠!奥沙利文杀疯了,特鲁姆普第5局又断在59分

世锦赛一夜崩三冠!奥沙利文杀疯了,特鲁姆普第5局又断在59分

宝哥精彩赛事
2026-04-26 15:59:53
从巴萨对孔德的使用,看出弗里克和哈维的不同

从巴萨对孔德的使用,看出弗里克和哈维的不同

米奇兔
2026-04-26 19:49:19
这是迄今为止,我见过身材最美的女人之一,不接受反驳

这是迄今为止,我见过身材最美的女人之一,不接受反驳

小椰的奶奶
2026-04-11 12:33:07
穆里尼奥葡超31轮不败!本菲卡4-1大胜,距榜首4分,欧冠席位稳吗

穆里尼奥葡超31轮不败!本菲卡4-1大胜,距榜首4分,欧冠席位稳吗

万花筒体育球球
2026-04-26 20:22:50
刘亦菲在豪宅休息,肤白貌美,注意看她脚下踩着床头柜颇高贵!

刘亦菲在豪宅休息,肤白貌美,注意看她脚下踩着床头柜颇高贵!

小椰的奶奶
2026-04-25 10:52:43
打也不打,谈也不谈,美国就是想耗死伊朗

打也不打,谈也不谈,美国就是想耗死伊朗

廖保平
2026-04-26 09:33:28
4月26日,养老金调整通知公布了吗?上海方案预测:定额增加超50元

4月26日,养老金调整通知公布了吗?上海方案预测:定额增加超50元

王五说说看
2026-04-26 09:25:54
范思哲晚宴生图:被边走边“提胸”的高叶吓到了,皮松肉垮大浓妆

范思哲晚宴生图:被边走边“提胸”的高叶吓到了,皮松肉垮大浓妆

小徐讲八卦
2026-04-24 06:11:56
伊朗用血泪给中国换来了教训:最大的敌人,并不是美国和以色列

伊朗用血泪给中国换来了教训:最大的敌人,并不是美国和以色列

墨印斋
2026-04-23 15:42:00
外贸玩具工厂突发通知:即日起停业破产,上千人饭碗被砸!

外贸玩具工厂突发通知:即日起停业破产,上千人饭碗被砸!

灯锦年
2026-04-26 14:03:21
悲催!37岁名牌大学毕业、年薪30万女医生被技术男嫌弃,当场崩溃

悲催!37岁名牌大学毕业、年薪30万女医生被技术男嫌弃,当场崩溃

火山詩话
2026-04-24 06:14:58
人均奖金600万!三星员工成群结队跳槽海力士,有人薪资翻9倍!

人均奖金600万!三星员工成群结队跳槽海力士,有人薪资翻9倍!

EETOP半导体社区
2026-04-26 12:39:20
我46岁守寡,姐夫来出差暂住我家,半个月后,我彻底破防

我46岁守寡,姐夫来出差暂住我家,半个月后,我彻底破防

娱乐洞察点点
2026-04-26 17:10:46
山东菏泽一修车工打开机盖瞬间防冻液喷出数米高,三人仓皇逃跑,当事人:大概熄火有十几分钟,高温不能轻易打开水箱盖,人都没事

山东菏泽一修车工打开机盖瞬间防冻液喷出数米高,三人仓皇逃跑,当事人:大概熄火有十几分钟,高温不能轻易打开水箱盖,人都没事

潇湘晨报
2026-04-26 11:18:23
沈伯洋换发型同框蒋万安,战台北市箭在弦上?

沈伯洋换发型同框蒋万安,战台北市箭在弦上?

郭茂辰海峡传真
2026-04-25 22:00:35
普京被迫打开金库,俄罗斯黄金连夜运往中国,中方发话果断接盘

普京被迫打开金库,俄罗斯黄金连夜运往中国,中方发话果断接盘

至死不渝的爱情
2026-04-26 18:41:13
稀土完全断供?日本将派经济相强访中国,中方刚说了三个“绝不”

稀土完全断供?日本将派经济相强访中国,中方刚说了三个“绝不”

知鉴明史
2026-04-25 21:05:03
东方甄选 “剩者为王”!YOYO 熬走所有对手,终成独苗主播

东方甄选 “剩者为王”!YOYO 熬走所有对手,终成独苗主播

南万说娱26
2026-04-26 10:54:10
300965,重大资产重组!明天停牌!

300965,重大资产重组!明天停牌!

证券时报e公司
2026-04-26 17:29:23
突发!台高层已抵达斯威士兰,大陆彻底看清了:特朗普的最坏打算

突发!台高层已抵达斯威士兰,大陆彻底看清了:特朗普的最坏打算

触摸史迹
2026-04-26 15:15:42
2026-04-26 21:36:49
呼呼历史论
呼呼历史论
分享有趣的历史
493文章数 16908关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

数码
艺术
房产
家居
公开课

数码要闻

MOREFINE上架G2外置显卡,内置RTX 5060 Ti

艺术要闻

18幅 列宾美院教师Artem Tikhonov风景写生

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

家居要闻

自然肌理 温润美学

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版