网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V4发布!迈入百万上下文时代 华为昇腾超节点全面支持

0
分享至

《科创板日报》4月24日讯(记者 黄心怡)DeepSeek-V4的预览版本今日上线并同步开源。DeepSeek-V4模型上下文处理长度由原有的128K显著扩展至1M,支持百万字超长上下文。同时,输出长度最大为384Ktokens。首次增加了KV Cache滑窗和压缩算法,减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。


华为昇腾、天数智芯、寒武纪等国产芯片厂商已经支持DeepSeek-V4新模型。华为昇腾超节点全系列产品支持DeepSeek V4系列模型,实现DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低时延推理。

DeepSeek方面称,受限于高端算力,目前V4-Pro的服务吞吐仍有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。

▍百万上下文成标配

DeepSeek-V4模型按大小分为两个版本:DeepSeek-V4-Pro(1.6T参数,49B激活)和DeepSeek-V4-Flash(284B参数,13B激活),且同时支持“非思考模式”与“思考模式”,均拥有百万字超长上下文的能力。

据介绍,V4系列采用DSA稀疏注意力机制,实现token维度压缩,让1M(一百万字)超长上下文成为标配,降低了长文本处理对计算和显存的需求,为复杂长程任务提供了支撑。

其中,DeepSeek-V4-Pro,相比前代模型,DeepSeek-V4-Pro的Agent能力有所增强。

在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的成绩。

DeepSeek-V4-Flash模型参数下降至284B,推理成本进一步降低,模型参数和激活更小

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。

在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

▍华为昇腾、天数智芯、寒武纪等国产芯片支持DeepSeek-V4

目前,华为昇腾超节点全系列产品已支持DeepSeek V4系列模型,实现DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低时延推理

据了解,昇腾950、昇腾A3超节点对DeepSeek V4系列模型全面适配。同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。

基于DeepSeekV4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode吞吐1600TPS。

基于昇腾A3 64卡超节点结合大EP模式部署,DeepSeek V4-Flash模型,8K/1K输入输出场景,基于vLLM推理引擎可实现2000+TPS的单卡Decode吞吐。针对DeepSeek V4-Pro模型,昇腾A3同步支持推理部署,性能持续优化中。

国产GPU厂商天数智芯完成了与DeepSeek-V4的Day 0级适配。据悉,天数智芯以天垓系列训练芯片与智铠系列推理芯片为核心,承接DeepSeek-V4的全场景应用。

而寒武纪基于vLLM推理框架完成了对此次285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro两个版本的Day 0适配,适配代码已开源到GitHub社区。

▍下半年昇腾950超节点将批量支持DeepSeek V4

根据DeepSeep官方文档介绍,DeepSeek V4并不是只在英伟达体系内做优化,而是将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证,这说明其推理路径已经具备跨算力平台的适配能力。但在开源层面,当前释放的仍主要是基于CUDA的MegaMoE和DeepGEMM,底层实现深度绑定英伟达工具链。

从价格看,DeepSeek V4-Pro输入(缓存命中)是1元/百万tokens,输入(缓存未命中)是12元,输出是24元;V4-Flash输入(缓存命中)是0.2元/百万tokens,输入(缓存未命中)是1元,输出是2元。

值得一提的是,官方API页面在小字中提到,受限于高端算力,目前V4-Pro的服务吞吐仍有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。这意味着,DeepSeek正尝试把模型运行时从单一硬件依赖中解耦出来。


此外,华为云首发适配了DeepSeek-V4模型。华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳一高中部分学生腹痛腹泻,官方:暂未发现食品安全问题,疾控部门正在进一步核查

深圳一高中部分学生腹痛腹泻,官方:暂未发现食品安全问题,疾控部门正在进一步核查

极目新闻
2026-04-24 17:25:22
博士再读硕士,本科回炉技校,纯属病急乱投医

博士再读硕士,本科回炉技校,纯属病急乱投医

赛格大道
2026-04-22 12:45:46
何鸿燊最后11年过得是什么样的日子?说出来可能颠覆很多人的认知

何鸿燊最后11年过得是什么样的日子?说出来可能颠覆很多人的认知

人生录
2026-04-22 19:01:34
布伦森绝杀失误登全美热搜!迷之操作遭讽 布朗:为他画绝杀战术

布伦森绝杀失误登全美热搜!迷之操作遭讽 布朗:为他画绝杀战术

颜小白的篮球梦
2026-04-24 10:53:39
大疆创始人汪滔消失十年,如今露面爆内情,大疆年赚800亿太亮眼

大疆创始人汪滔消失十年,如今露面爆内情,大疆年赚800亿太亮眼

梦录的西方史话
2026-04-24 14:27:18
上海农商银行连续6年反向追薪,累计扣回2475万绩效薪酬

上海农商银行连续6年反向追薪,累计扣回2475万绩效薪酬

湘财Plus
2026-04-24 15:58:22
西安一职校学生被同学持刀捅伤,知情人称伤者已从ICU转至普通病房,教育局和警方回应

西安一职校学生被同学持刀捅伤,知情人称伤者已从ICU转至普通病房,教育局和警方回应

极目新闻
2026-04-24 18:07:53
一场120-107让西部季后赛大乱!雷霆巨星伤退,湖人冲击决赛有望

一场120-107让西部季后赛大乱!雷霆巨星伤退,湖人冲击决赛有望

古史青云啊
2026-04-24 11:53:35
国务院任免国家工作人员

国务院任免国家工作人员

新华社
2026-04-24 13:25:03
中国拒付39万亿债务,巴西卢拉不满,联合国无能为力

中国拒付39万亿债务,巴西卢拉不满,联合国无能为力

氧气过敏者
2026-04-24 07:30:55
“硫酸泼熊”事件当事人刘某洋现状:成中科院专家,并被高度评价

“硫酸泼熊”事件当事人刘某洋现状:成中科院专家,并被高度评价

就一点
2026-04-23 17:09:48
恒大集团高管刑期预测

恒大集团高管刑期预测

地产微资讯
2026-04-24 09:36:31
“全美最受欢迎的汉堡”要来北京了!刘嘉玲、奥巴马都曾被“圈粉”!网友催开业…

“全美最受欢迎的汉堡”要来北京了!刘嘉玲、奥巴马都曾被“圈粉”!网友催开业…

北京商报
2026-04-21 21:54:51
田亮做梦也没想到,费心养大的14岁儿子,如今竟“压自己一头”

田亮做梦也没想到,费心养大的14岁儿子,如今竟“压自己一头”

以茶带书
2026-04-23 16:11:50
炸锅!美部长当众承认:中国一颗H200芯片没买

炸锅!美部长当众承认:中国一颗H200芯片没买

林子说事
2026-04-23 17:52:16
蛇吞象?生产歼-20的中国军工巨头174亿就被收购了,用意耐人寻味

蛇吞象?生产歼-20的中国军工巨头174亿就被收购了,用意耐人寻味

趣文说娱
2026-04-23 19:52:36
NBA季后赛明天4月25日赛程:湖人冲击赛点,CCTV5播马刺PK开拓者

NBA季后赛明天4月25日赛程:湖人冲击赛点,CCTV5播马刺PK开拓者

薇说体育
2026-04-24 16:20:41
特朗普回应“美特种兵提前押注马杜罗下台获利超40万美元”:这世界疯了,变成了一个赌场,跟以前完全不一样了

特朗普回应“美特种兵提前押注马杜罗下台获利超40万美元”:这世界疯了,变成了一个赌场,跟以前完全不一样了

每日经济新闻
2026-04-24 17:06:07
中国中铁工程局党委书记、董事长,总经理、党委副书记调整,均由其他单位调任!

中国中铁工程局党委书记、董事长,总经理、党委副书记调整,均由其他单位调任!

新浪财经
2026-04-24 01:08:56
太惨!被美欧抛弃,走上绝路,宣布破产!

太惨!被美欧抛弃,走上绝路,宣布破产!

李荣茂
2026-04-23 18:33:54
2026-04-24 19:04:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
712195文章数 1020399关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

31人抢的小鹏事故车被36800元拍下 车主在车祸中身亡

头条要闻

31人抢的小鹏事故车被36800元拍下 车主在车祸中身亡

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

数码
手机
亲子
房产
军事航空

数码要闻

OPPO Find X9s Pro全渠道开售 不涨价的旅拍神器

手机要闻

今年首款天玑9500+2K直屏旗舰来了!iQOO 15T五月亮相

亲子要闻

宝蓝和朋友抢一条公主群,谁也不让谁,爸爸又准备了一条公主裙

房产要闻

三亚安居房,突然官宣!

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版