网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V4千呼万唤始出来,华为超节点支持部署

0
分享至

4月24日,市场期待已久的DeepSeek-V4模型预览版正式发布。新模型支持百万token(词元)超长上下文,DeepSeek称其在智能体能力、世界知识和推理性能上均实现国内与开源领域的领先。

按参数规模不同,DeepSeek-V4系列分为DeepSeek-V4-Pro和DeepSeek-V4-Flash两个版本。前者的总参数量达1.6万亿、激活参数为490亿;后者的总参数量为2840亿,激活参数为130亿。

尽管轻量版DeepSeek-V4-Flash的参数量更小,但推理能力接近DeepSeek-V4-Pro,在运行智能体简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务中仍有差距。官方称DeepSeek-V4-Flash主打性价比,能够提供更加快捷和经济的API服务。

技术报告指出,DeepSeek-V4系列在长上下文场景中具有极高的效率。和上一代DeepSeek-V3.2模型相比,DeepSeek-V4-Pro大幅降低了对计算和显存的需求。在100万上下文设置下,DeepSeek-V4-Pro的单token推理计算量仅为DeepSeek-V3.2的27%,KV缓存(一种加速模型推理生成的机制)仅为其10%。DeepSeek称这得益于一种全新的注意力机制设计。

“这使我们能够在实际应用中稳定支持百万级上下文,从而使长时序任务更加可行。”技术报告写道。


DeepSeek-V4-Pro-Max的测试性能。

具体性能表现上,技术报告显示,DeepSeek-V4-Pro-Max(即DeepSeek-V4-Pro的最大推理强度模式)的智能体能力与月之暗面Kimi-K2.6和智谱GLM-5.1等领先的开源模型表现相当,但略逊于顶级闭源模型。在内部评估中,DeepSeek-V4-Pro-Max超越Anthropic的Claude Sonnet 4.5,并接近其2025年11月推出的Opus 4.5的水平。

知识能力方面,DeepSeek-V4-Pro-Max在多个测试基准上显著优于领先的开源模型,仍落后于谷歌旗下的顶尖闭源模型Gemini-3.1-Pro,不过差距已显著缩小。

推理性能上,DeepSeek-V4-Pro-Max展现出优于GPT-5.2和Gemini-3.0-Pro的表现,但仍略低于GPT-5.4和Gemini-3.1-Pro。技术报告称这表明其发展水平大约落后当前最先进前沿模型约3至6个月。

DeepSeek未在技术报告中指出新模型预训练所使用的具体芯片型号和规模。而在DeepSeek-V3的技术报告中,曾披露该模型训练仅使用了2048块英伟达H800 GPU。

不过,华为方面在DeepSeek-V4模型发布后表示,华为昇腾芯片一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。华为称,昇腾950超节点能实现高吞吐、低时延的DeepSeek-V4模型推理部署。

DeepSeek-V4模型的发布,正值DeepSeek公司被曝首次对外融资之际。据科技媒体The Information报道,腾讯和阿里巴巴正在洽谈投资DeepSeek,估值超过200亿美元。腾讯和阿里对此未公开回应。

采写:南都N视频记者 杨柳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一医院原院长:我就像一个吸血鬼

一医院原院长:我就像一个吸血鬼

南方都市报
2026-04-26 23:49:54
英媒:前米兰球员博列洛因私处药膏遭禁赛,曾称一天亲热37次

英媒:前米兰球员博列洛因私处药膏遭禁赛,曾称一天亲热37次

懂球帝
2026-04-26 18:37:16
10年麻将馆老板囗述:凡是爱打麻将的,没有一个人日子是过得好的

10年麻将馆老板囗述:凡是爱打麻将的,没有一个人日子是过得好的

小噎论事
2026-04-24 17:15:21
中国强烈反对欧盟制裁,要求移除被列入俄制裁名单企业

中国强烈反对欧盟制裁,要求移除被列入俄制裁名单企业

桂系007
2026-04-26 23:47:03
中组部人社部规定:公职人员违纪后待遇一文讲清

中组部人社部规定:公职人员违纪后待遇一文讲清

笑熬浆糊111
2026-04-23 00:05:18
3年朝鲜战争,美军究竟伤亡了多少人?是时候告诉大家真相了!

3年朝鲜战争,美军究竟伤亡了多少人?是时候告诉大家真相了!

文史道
2025-04-05 06:45:06
医生发现:老人若长时间不吃甜食,用不了多长时间身体有5大改善

医生发现:老人若长时间不吃甜食,用不了多长时间身体有5大改善

芹姐说生活
2026-04-23 15:04:44
华为余承东首次回应享界S9麋鹿测试黑幕,称轮胎被放气、拧松

华为余承东首次回应享界S9麋鹿测试黑幕,称轮胎被放气、拧松

鲁中晨报
2026-04-27 10:52:12
30元成本,KTV卖到1900元,暴利63倍!成都公安破大案

30元成本,KTV卖到1900元,暴利63倍!成都公安破大案

笔墨V
2026-04-27 04:55:21
有关特朗普遇袭,特朗普夫人和高市早苗谁反应迅速?

有关特朗普遇袭,特朗普夫人和高市早苗谁反应迅速?

新民周刊
2026-04-27 11:05:55
不可错过!4月27日晚上19:35比赛!中央5套CCTV5、CCTV5+直播表

不可错过!4月27日晚上19:35比赛!中央5套CCTV5、CCTV5+直播表

海阔山遥YAO
2026-04-27 15:19:47
隆多有望出任鹈鹕主帅!已接受该岗位面试 将与哈姆博雷戈等竞争

隆多有望出任鹈鹕主帅!已接受该岗位面试 将与哈姆博雷戈等竞争

罗说NBA
2026-04-27 05:27:11
47岁周杰伦2.5亿买百年庄园!登记在岳父名下,推倒重建轰动当地

47岁周杰伦2.5亿买百年庄园!登记在岳父名下,推倒重建轰动当地

嫹笔牂牂
2026-04-27 07:48:31
西方承认,经过中东这一仗才发现,中国手里3张王牌,别人玩不来

西方承认,经过中东这一仗才发现,中国手里3张王牌,别人玩不来

混沌录
2026-04-22 19:19:05
刘晓庆助理古柯直播爆料细节,称对方曾承诺离婚,王晓玉始终陪伴

刘晓庆助理古柯直播爆料细节,称对方曾承诺离婚,王晓玉始终陪伴

一盅情怀
2026-04-26 15:34:49
“我让他住手,可他不听”:中国民科狂发500篇预印本,女儿被迫收获100+署名

“我让他住手,可他不听”:中国民科狂发500篇预印本,女儿被迫收获100+署名

化学人生
2026-04-26 20:10:10
足球报:英博伤情严重,五六名球员已到了难以坚持比赛的程度

足球报:英博伤情严重,五六名球员已到了难以坚持比赛的程度

懂球帝
2026-04-27 15:18:03
上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

离离言几许
2026-04-26 21:10:25
石破茂:我当过首相所以我最清楚,没有中国,日本根本不可能存在

石破茂:我当过首相所以我最清楚,没有中国,日本根本不可能存在

黑翼天使
2026-04-27 00:25:04
8次失误!8次失误!41岁詹姆斯真打不动了,但东契奇复出仍无定期

8次失误!8次失误!41岁詹姆斯真打不动了,但东契奇复出仍无定期

麦子的篮球故事
2026-04-27 15:22:47
2026-04-27 15:55:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
608486文章数 3588264关注度
往期回顾 全部

科技要闻

DeepSeek V4上线三天,第一批实测出来了

头条要闻

美国白宫记协晚宴突发枪击事件 外交部回应

头条要闻

美国白宫记协晚宴突发枪击事件 外交部回应

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

黄杨钿甜为“耳环风波”出镜道歉:谣言已澄清

财经要闻

DeepSeek融资、字节加码 AI开始真烧钱了

汽车要闻

在不确定中寻找确定性:大众汽车的中国解法

态度原创

本地
教育
亲子
艺术
房产

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

教育要闻

连爆猛料!这所区域领军校,新增两个“唯一”!

亲子要闻

韩国女星40岁官宣怀孕,12次试管失败终靠中医圆梦

艺术要闻

你绝对想不到,摄影能让她成为女神!

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

无障碍浏览 进入关怀版