网易首页 > 网易号 > 正文 申请入驻

实测DeepSeek V4:不炸裂了,但在做更重要的事

0
分享至

来源:市场资讯

(来源:沃垠AI)

千呼万唤始出来,DeepSeek V4终于发布了。

这次一共有2个版本,V4 Pro和V4 Flash,都是1M上下文,也都开源。

  • V4 Pro,1.6T(1.6万亿)总参数,49B激活。

  • V4 Flash,284B(2840亿)总参数,13B激活。

在网页端/APP,V4 Pro对应「专家模式」,V4 Flash「快速模式」。


一图看懂DeepSeek V4,图由GPT生成

据DeepSeek自己介绍,V4的Agent能力仅比肩Claude Sonnet 4.5,离Opus 4.6、4.7还有差距;世界知识离Gemini-Pro-3.1还有差距;推理性能,与GPT-5.4旗鼓相当。

官方report也直言,“发展轨迹约滞后前沿闭源模型3到6个月”。

API价格方面,DeepSeek V4比V3.2有所上涨,V4 Pro涨了约6倍,V4 Flash降了约50%。另外,并没有Coding Plan。

以上,来自官方信息。下面,我们基于实测来评估一下这个模型。


一手实测

1)编程:3D任务

先测一个3D任务,主要看模型的前端能力,考验模型对空间想象和逻辑推理的能力。

提示词:制作一个3D的雪山场景html,雪山中间有一个日式的寺庙,整体风格参考塞尔达旷野之息。

Qwen3.6-Plus:


GLM-5.1:


DeepSeek V4 Pro:


MiniMax M2.7:


Gemini-3.1-Pro:


为什么不对比kimi K2.6?Kimi说他有点累了,让我晚点再问一下。

整体来看,“开源五杰”表现不一。

GLM-5.1、Qwen3.6-Plus和Gemini-3.1-Pro在同一个水平,其他四家略逊一筹。

细节方面,GLM-5.1和Qwen3.6-Plus是最强的。比如雪山粒子特效、日式建筑还原、塞尔达风格参考,他俩的整体表现比其他模型都要更优一些。

DeepSeek V4 Pro,在这个case中表现一般。

我又试了一个3D魔方的老case,V4能做到还原。

提示词:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
中文:创建一个HTML文件,其中使用Three.js(通过CDN方式引入)来实现一个功能完备的3D魔方模拟程序。该魔方必须能够自动完成自己的“解谜”过程。


这个case,我也测过很多模型了。基本上,最新的模型都能one shot,一次跑通。

2)编程:Skills任务

今天,藏师傅开源了一个极其牛逼的PPT skill「guizang-ppt-skill」。


skill地址:github.com/op7418/guizang-ppt-skil

生成的是一份HTML式PPT,也就几十kb,可以发给任何人,在浏览器打开,字体、动画都不会变。

对于这个skill,藏师傅说“这是他十年审美的压缩包。”

我第一时间,就把这个skills装到我的Claude Code里。直接对着你的Claude Code说这句话就行。

帮我安装这个skill:https://github.com/op7418/guizang-ppt-skill,放在这个文件夹:C:\Users\Administrator\.claude\skills

然后,接入DeepSeek V4 Pro跑了个case,让它把我昨天的文章设计成10页PPT。


给大家看下最终的效果。

整体排版、风格、字体搭配,我都非常满意。差不多我再微调下文字(可用Trae或文本编辑器来改),这套PPT可以直接拿去演讲了。

3)编程:网站开发

需求是,让DeepSeek V4 Pro基于我给到的模特照片,做一个摄影师作品集的网站。

提示词:我是拍模特广告的摄影师,我的工作室叫「小逸摄影」,文件夹 D:\Vibe Coding\DS V4\模特图片 放了一些模特图片,给我生成一个高级审美、大师水准的摄影师作品网站,用上文件夹里的图片并配上精美的讲解。

Qwen3.6-Plus,之前已经测过,效果很惊艳。

来看下DeepSeek V4 Pro的表现。

也是深色背景+Hero全屏+网格画廊,整个水准跟Qwen3.6-Plus差距不大。

如果要论细节的话,Qwen3.6-Plus在一些logo、文字配色和交互动画上要更强一些。


Qwen3.6-Plus生成的首屏


DeepSeek V4 Pro生成的首屏

4)Agent长程任务

任务,还是我们的老case,让Claude Code做一个联网搜索+word生成+skill调用+网站开发的复杂长程任务。

提示词:联网搜索、调研张雪机车的发展轨迹,尽量从权威信源获取信息。首先,给我创建一份5000字的word调研报告。然后,调用Knowledge Site Creator Skills给这份报告创建一个知识学习网站,页面高级审美。

这个任务,DeepSeek V4 Pro跑了很久,耗时33分钟。


交付给我了2个东西,一个是word报告,一个是知识学习网站(带后端)。

先看word报告。


内容还是挺全面的。最近,我高频在用DeepSeek做信息检索,回答质量一直都比较靠谱。相比去年的DeepSeek,现在的幻觉已经大幅下降。

然后,再看它生成的知识学习网站。


直接带了后端+数据库的功能,我添加数据后,这个网站就可以真实使用了。

以上4个case,一共消耗了450万tokens,成本10元。蹲一个,DeepSeek啥时候出CodingPlan啊



5)世界知识任务

世界知识,要系统测起来,比较麻烦。

我问了一些陌生领域(关闭联网,下同)的问题,它都能答得上来。


一些次新的知识,它也训了进去。


但最新的,它不知道。


我问了下它的知识库,说是训练数据截止到2025年5月。


6)写作任务

以我经常干的事“让AI续写”来进行测试。

提示词:参考下文的风格续写,300字:现在,谁发我一张图,我的第一反应都是:“这是不是GPT生成的?”人类社会,大家能够坐下来一起讨论事情,最基本的前提是,我们活在同一个现实里,对最基础的事实认知是一致的。而今天,目光所及的一切都在崩塌。

DeepSeek V4 Pro的表现还行,但还是爱拽一些技术词,比如锚点、脚本、图灵测试等。


GPT-5的表现,明显就更像人一些,说人话。


GPT,也一直是我的常用写作模型。但自己要注意微调一下,比如让它不要老说“不是…而是”,不要一直加破折号、冒号。

Gemini-3.1-Pro的表现继续拉胯。拽那么多成语一点用都有,跟原文的风格非常割裂。


上周,我跟大家分享了写作经验,很多人都在评论区说Gemini 3.1/3.0远不如Gemini 2.5,确实如此。

Claude-Opus-4.6,这写作能力依旧顶级。



整体测下来,我觉得DeepSeek V4的表现是“一般货色”。

这其实也和他们自己的判断一致,距离全球顶尖模型(不论开源还是闭源),大概还有3-6个月的差距。

他们在官方文章中写得也很克制:「不诱于誉,不恐于诽,率道而行,端然正己。」

不是任何东西,一出来就是张雪机车,就是世界第一的叙事。

但有意思的是,今天的AI行业,已经很少有人愿意接受“一般货色”这四个字了。

你发一个模型,如果不能吊打、不能碾压、不能重构一切,那就很容易被归类为“没意思”。

可冷静想想,我觉得这种思维不正常。

技术的发展,不可能一蹴而就,也不可能一直指数前进。相反,“前进-倒退-前进-再前进-又倒退”才是常态。

有时候,真正决定行业走向的,反而是这些“差一点点”的版本:更稳一点,更可控一点,生态更完善一点。

DeepSeek V4给我的感觉也是这样。

它不惊艳,但它在补课。

  • 重写注意力机制,对Token维度进行压缩,叠加自研的DSA稀疏注意力,把上下文从128k直接推到1M,而且是标配。

  • 重改模型架构,同时适配英伟达GPU和华为昇腾NPU。

  • 重换后训练路径,从V3.2的SFT+混合RL,切到On-Policy Distillation(OPD),先练专家,再做融合。

  • 同时补齐Agent能力,对Claude Code、OpenClaw、CodeBuddy这些实际在用的Agent产品,做针对性优化。


这些事情,没有一件是能上热搜的。

但,总得有人要去做。

而这一次,是DeepSeek。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

火山詩话
2026-04-24 10:39:54
中国大学生需回炉重新学习,人社部财政部已发通知,是不是学历倒退或降级?

中国大学生需回炉重新学习,人社部财政部已发通知,是不是学历倒退或降级?

深度报
2026-04-23 22:43:47
老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

魔都姐姐杂谈
2026-04-24 11:56:08
血管堵没堵,头部不会“说谎”,出现这4个症状,要尽早检查

血管堵没堵,头部不会“说谎”,出现这4个症状,要尽早检查

芹姐说生活
2026-04-25 12:41:11
如果马寅初没提出人口论,也没有计划生育,如今我国会怎么样?

如果马寅初没提出人口论,也没有计划生育,如今我国会怎么样?

旧史新谭
2026-04-24 15:49:04
高烧4天、一天腹泻十多次,福州男子被急送ICU!“元凶”很多人家里都有……

高烧4天、一天腹泻十多次,福州男子被急送ICU!“元凶”很多人家里都有……

福建卫生报
2026-04-25 13:06:36
美国发出宣战书!美军集结到位,21国要求本国公民立即从伊朗撤离

美国发出宣战书!美军集结到位,21国要求本国公民立即从伊朗撤离

史政先锋
2026-04-25 14:47:45
王钰栋险被废!甘超飞踹染红,傅明不手软,前国脚怒批

王钰栋险被废!甘超飞踹染红,傅明不手软,前国脚怒批

奥拜尔
2026-04-25 20:58:31
上海人终于体会到了引进印度人的“快乐”!

上海人终于体会到了引进印度人的“快乐”!

步论天下事
2026-04-25 09:34:47
史上最大规模化债,已经开始!一个坚持了30年的信仰,进入倒计时

史上最大规模化债,已经开始!一个坚持了30年的信仰,进入倒计时

柏年说政经
2026-04-25 10:00:08
天天315|“0糖是商标”,东鹏特饮被骂上热搜股价下跌

天天315|“0糖是商标”,东鹏特饮被骂上热搜股价下跌

齐鲁壹点
2026-04-25 06:43:07
忘了两伊战争?如今伊朗拿霍尔木兹海峡赌国运,纯属记吃不记打!

忘了两伊战争?如今伊朗拿霍尔木兹海峡赌国运,纯属记吃不记打!

寰球经纬所
2026-04-25 16:00:55
火箭G3输球多离谱?胜率99.94%都能搞砸 耻辱比肩2024年尼克斯

火箭G3输球多离谱?胜率99.94%都能搞砸 耻辱比肩2024年尼克斯

罗说NBA
2026-04-25 17:35:25
大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

翰飞观事
2026-04-24 19:39:03
19岁女孩失控的人生:14个月在直播间豪掷1700万公款

19岁女孩失控的人生:14个月在直播间豪掷1700万公款

潇湘晨报
2026-04-24 22:36:30
蔡磊的妻子段睿深夜发布讣告:他走了,再也没有人等我回去了!

蔡磊的妻子段睿深夜发布讣告:他走了,再也没有人等我回去了!

北纬的咖啡豆
2026-04-25 09:01:01
广场舞噪音乱入!深圳一演唱会现场遭观众吐槽,官方回应

广场舞噪音乱入!深圳一演唱会现场遭观众吐槽,官方回应

南方都市报
2026-04-25 15:33:03
丁俊晖扛了19年,赵心童跪地鼓掌:这一跪,是中国斯诺克最体面的传承

丁俊晖扛了19年,赵心童跪地鼓掌:这一跪,是中国斯诺克最体面的传承

带你逛体坛
2026-04-25 15:54:08
英超-阿森纳3-0纽卡斯尔:争冠未失主动,枪手捞净胜球|前瞻

英超-阿森纳3-0纽卡斯尔:争冠未失主动,枪手捞净胜球|前瞻

体育世界
2026-04-25 15:51:42
打虎!伍浩被查

打虎!伍浩被查

新京报
2026-04-25 17:24:34
2026-04-25 21:55:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3010677文章数 6923关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

家居
本地
房产
时尚
公开课

家居要闻

自然肌理 温润美学

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

这9种特别的颜色,太适合春夏交替的五月了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版