网易首页 > 网易号 > 正文 申请入驻

DeepSeek‑V4 实测:百万字上下文、Agent、逻辑推理一次看全

0
分享至


从2025年年底,到2026年春节,再走过今年第一季度。Deepseek-V4千呼万唤始出来。


4月24日,Deepseek官网上线DeepSeek-V4预览版(以下简称“DeepSeek-V4”)并同步开源。

从DeepSeek-R1到DeepSeek-V4,一年间,AI市场竞争已经发生太多变化。

去年DeepSeek R1发布时,市场的观感是“惊艳”,因为同期产品里,像它这样性能强又成本低的并不多。

而DeepSeek-V4到来时,大模型厂商们已经上新多轮。比如在DeepSeek-V4上线当日凌晨(北京时间),OpenAI发布了新一代大模型GPT-5.5。而就在前一天(4月23日),腾讯发布了Hy3 preview模型。

关于DeepSeek-V4,DeepSeek在官方账号只是低调朴素地介绍:“DeepSeek-V4 拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。”

今天,开机实验室就准备实测Deepseek-V4,看看表现如何。

可理解超长文本

DeepSeek-V4分为Pro与Flash两个版本。

Pro版总参数1.6万亿、激活参数490亿,主打旗舰性能;Flash版总参数2840亿、激活参数130亿,主打轻量高效。

大部分C端用户使用DeepSeek是通过网页或者APP,根据官方公告,进入网页/APP端后,专家模式对应的模型是DeepSeek-V4-Pro;快速模式背后的模型则是DeepSeek-V4-Flash。

百万上下文,是DeepSeek此次更新的亮点之一,两款模型均全系标配100万Token上下文窗口,可一次处理整本著作或百万字合同等超长文本。

开机实验室尝试将近90万字的《三体》三部曲文本发送给DeepSeek解读,在快速模式下,DeepSeek可以阅读全文并给出正确的结论。



DeepSeek还表示,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

目前,能将上下文推至百万级别的模型并不算多,除了DeepSeek-V4,谷歌 Gemini 系列(1M+)、Anthropic Claude Opus 5(1M)等。

开机实验室同时也对豆包、元宝等模型进行实测,但这些模型暂时还无法阅读这么长的内容,需要搜网络资料才能给出答案。



考AI脑筋急转弯,是测试AI语境理解和逻辑推理能力的方式之一。

“我要洗车,距离洗车店50米,我开车去还是走路去?”前段时间,这个问题“难倒”了一众AI,大部分大模型给出的答案都是“走路去”。

但据开机实验室实测,在快速模式下,DeepSeek建议“走路去”,但是给出了一个算得上可行的解决方案:走到店里让店员过来开。


专家模式下,DeepSeek很轻松地发现了问题,建议“开车去”,还尝试猜测了用户提出这个问题的顾虑,并表示不用担心。


不过,DeepSeek的此次的更新不局限于此。

DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

下图为DeepSeek-V4-Pro 在某 Agent 框架下生成的PPT内页。


据DeepSeek,目前 DeepSeek-V4 已成为DeepSeek公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。

定价层面,DeepSeek-V4-Pro是输入价格为输入(未命中)12 元 / 百万 token、(命中)1 元;输出 24 元;DeepSeek-V4-Flash是输入价格为每百万输入(未命中)1 元 / 百万 token、(命中)0.2 元;输出 2 元。


从“参数竞赛”到“能力竞赛”再到“价值竞赛”

和去年DeepSeek-R1登场后拉动AI竞争不同,今年,在DeepSeek-V4 登场之前,业界就已经开卷了。

先是春节期间,腾讯、阿里、字节等大厂又是发红包,又是联动春晚,吸引用户体验;再是这段时间一个大模型“上新”小高潮。

越来越密集的产品发布印证了这样一个趋势:2026年模型大战正在从堆参数、拼速度,正式转向比落地、比成本。

DeepSeek-V4发布同日凌晨(北京时间),OpenAI发布GPT5.5,几天前,这家公司发布的GPT image 2在图像生成上表现出的以假乱真程度以及广泛的场景适用性让不少用户陷入恐慌。

而DeepSeek-V4发布一天前(4月23日),腾讯混元Hy3 preview语言模型发布并开源。

Hy3 preview是腾讯2月宣布混元重建预训练和强化学习的基础设施后训练的第一个模型,它的定位是“实用主义”。

在参数规模上,Hy3 Preview比混元2.0要小,总参数295B,激活参数21B,最大支持256K上下文。但据腾讯,其在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

同时,这个模型的应用场景范围不小。上线当日,Hy3 preview已在元宝、ima、CodeBuddy、WorkBuddy、QQ等上线,微信公众号、和平精英、腾讯新闻、微信读书等多个主线产品也在陆续上线。

“我们在提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。” 腾讯首席AI科学家姚顺雨指出。

IDC中国研究经理程荫在DeepSeek-V4发布后发文表示,DeepSeek-V4的发布,标志着中国大模型行业正式从“参数竞赛”(1.0时代)、“能力竞赛”(2.0时代)进入“价值竞赛”(3.0时代)——以高效架构、普惠成本、场景落地为核心,解决企业实际问题。

而大模型的竞争升级,也在推动AI产业链上下游发生变化。

中信证券认为,对于整个AI产业来说,模型层,DeepSeek新一代模型有望与其他国产模型携手,驱动中国AI加速走向世界,同时模型训推进一步降本,更廉价的tokens驱动全球大模型API调用量整体增加。

AI应用层,模型平权有助于缓解市场对于模型与应用矛盾叙事带来的焦虑,助力千行百业AIAgent落地,利好有壁垒的AI应用公司。

而对于AI基础设施,降本带来用量增长使AI Infra受益,国产AI Infra与国产模型相向而行。

在DeepSeek-V4的技术报告里,DeepSeek提到,DeepSeekV4在英伟达GPU与华为昇腾NPU两大硬件平台上,完成了细粒度执行分区(EP)方案的有效性验证。


DeepSeek在发布价格时还表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

中信证券指出,AI应用爆发对应的国内算力荒将会加速国产卡放量,其中对推理芯片的带动更加直接。当前国产大模型正积极适配国产算力卡,在国内算力荒背景下国产推理芯片等AI芯片迎来爆发增长机遇,预估国内AI芯片市场当前国产化率约30~40%,2030年有望提升至60~70%。

作者:冯恋阁

微信编辑:vivian

责任编辑:肖道

制图:Judy Chen

转载授权、投稿、合作请联系消道长:

消道长微信:ccrzhushou

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
猛降14℃!暴雨大暴雨、冰雹、雷暴大风马上到湖北

猛降14℃!暴雨大暴雨、冰雹、雷暴大风马上到湖北

极目新闻
2026-04-26 08:40:20
笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

夜深爱杂谈
2026-04-25 07:33:34
被活活绞了40分钟 行刑后脖子只剩一根韧带相连 24年后真相浮出水

被活活绞了40分钟 行刑后脖子只剩一根韧带相连 24年后真相浮出水

寻墨阁
2026-04-26 00:17:44
宝视达回应“镜片装反孩子近视暴涨到900度”:出厂交付时不存在镜片装反情况,愿退还配镜费用赠送1000元眼镜及感谢金

宝视达回应“镜片装反孩子近视暴涨到900度”:出厂交付时不存在镜片装反情况,愿退还配镜费用赠送1000元眼镜及感谢金

极目新闻
2026-04-26 09:13:09
尚界汽车法务部:北京国际车展现场有观众蓄意破坏展车内饰,造成车辆损伤,已做好取证

尚界汽车法务部:北京国际车展现场有观众蓄意破坏展车内饰,造成车辆损伤,已做好取证

都市快报橙柿互动
2026-04-25 12:33:09
猛人是从底层杀出来的

猛人是从底层杀出来的

汉周读书
2026-04-24 17:28:00
惨烈3-1!华兹重伤,3人伤退2人驱逐,掘金3连败,约基奇24+15

惨烈3-1!华兹重伤,3人伤退2人驱逐,掘金3连败,约基奇24+15

老侃侃球
2026-04-26 11:28:24
贵阳发布大风蓝色预警

贵阳发布大风蓝色预警

贵阳网
2026-04-26 10:44:44
真相大白丁俊晖、赵心童打得难舍难分原因曝光,墨菲打不过赵公子

真相大白丁俊晖、赵心童打得难舍难分原因曝光,墨菲打不过赵公子

曹说体育
2026-04-25 15:41:37
天助曼联:0-1,英超第4遭英超第2掀翻,维拉无缘反超曼联升至第3

天助曼联:0-1,英超第4遭英超第2掀翻,维拉无缘反超曼联升至第3

侧身凌空斩
2026-04-25 21:21:39
特斯拉将迎来重磅更新,太猛了!

特斯拉将迎来重磅更新,太猛了!

花果科技
2026-04-23 15:08:15
真敢说!Coco又曝谢贤私密事,谢婷婷被拉下水,评论区出奇一致

真敢说!Coco又曝谢贤私密事,谢婷婷被拉下水,评论区出奇一致

八斗小先生
2026-04-25 19:34:49
悲催!毕业后拼到的浙江体制工作,被妈妈毁了,孩子现去新疆发展

悲催!毕业后拼到的浙江体制工作,被妈妈毁了,孩子现去新疆发展

火山詩话
2026-04-25 09:47:37
体坛丑闻!嗜赌只是冰山一角,婚内出轨睡有妇之夫,太毁三观

体坛丑闻!嗜赌只是冰山一角,婚内出轨睡有妇之夫,太毁三观

橙星文娱
2026-04-25 11:14:17
中科曙光:严重市值倒挂,被严重低估的算力隐形龙头

中科曙光:严重市值倒挂,被严重低估的算力隐形龙头

风风顺
2026-04-26 04:10:03
独生子女家庭注意!5月集中办理窗口开启,3笔现金补助别忘申请

独生子女家庭注意!5月集中办理窗口开启,3笔现金补助别忘申请

复转这些年
2026-04-25 18:51:48
天津一景区内一名飞行员死亡,事故调查报告公布

天津一景区内一名飞行员死亡,事故调查报告公布

扬子晚报
2026-04-25 21:02:36
俄共领导人告诫普京:如果再不出手,俄罗斯将会重蹈1917年覆辙M

俄共领导人告诫普京:如果再不出手,俄罗斯将会重蹈1917年覆辙M

阿天爱旅行
2026-04-26 10:42:38
是世态的炎凉,还是道德的沦丧?女子一丝不挂取外卖,外卖哥尬了

是世态的炎凉,还是道德的沦丧?女子一丝不挂取外卖,外卖哥尬了

枫尘余往逝
2026-04-25 09:38:06
3-1,森林狼拿赛点!爱德华兹受伤+迪文岑佐重伤,约基奇输急眼

3-1,森林狼拿赛点!爱德华兹受伤+迪文岑佐重伤,约基奇输急眼

老梁体育漫谈
2026-04-26 11:29:46
2026-04-26 11:55:00
消费者报道
消费者报道
中国首批专注对比测评的媒体
7563文章数 46362关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

白宫突发枪击案 250名记者联名要求将晚宴变维权现场

头条要闻

白宫突发枪击案 250名记者联名要求将晚宴变维权现场

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

亲子
健康
数码
教育
时尚

亲子要闻

妈妈记录下宝宝的第一次拥抱,最幸福的瞬间

干细胞如何让烧烫伤皮肤"再生"?

数码要闻

华为MatePad Mini迭代版:OLED四等边、5G、NFC全来了,没短板了

教育要闻

压轴出场的题目,很多小朋友都失分了

伊姐周六热推:电视剧《方圆八百米》;电视剧《金关》......

无障碍浏览 进入关怀版