网易首页 > 网易号 > 正文 申请入驻

DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

0
分享至

IT之家 3 月 25 日消息,DeepSeek-V3 模型昨日进行了小版本更新,今晚官方发布了该更新的详情。

IT之家附全文内容如下:

DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。V3-0324 模型权重下载请参考:

Model Scope:

Huggingface:

与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
普京接班人去世,差点当上俄罗斯总统,直接打乱了俄罗斯国运

普京接班人去世,差点当上俄罗斯总统,直接打乱了俄罗斯国运

古史青云啊
2026-06-28 11:31:02
内娱完了?短剧演员杀进综艺,全员素颜上阵,直接把明星脸打肿!

内娱完了?短剧演员杀进综艺,全员素颜上阵,直接把明星脸打肿!

可乐谈情感
2026-06-28 14:28:57
英国准首相与特朗普积怨十年,美英两国关系或迎来最冷时刻

英国准首相与特朗普积怨十年,美英两国关系或迎来最冷时刻

策前论
2026-06-28 23:21:54
一段关系结束了,女人会忘记爱过的男人吗?3个女人说了实话

一段关系结束了,女人会忘记爱过的男人吗?3个女人说了实话

叶飞飞情感屋
2026-06-28 19:29:16
大闹航班女子社会性死亡!女子正脸流出,知情人曝更多,评论炸了

大闹航班女子社会性死亡!女子正脸流出,知情人曝更多,评论炸了

轩逸阿II
2026-06-27 23:07:17
PCB真正的主线排出来了 第一梯队才是最缺货的

PCB真正的主线排出来了 第一梯队才是最缺货的

风风顺
2026-06-22 02:20:07
女演员千万别整容,看42岁王佳佳和40岁江疏影同框,就知道了

女演员千万别整容,看42岁王佳佳和40岁江疏影同框,就知道了

芬霏剧时光
2026-06-26 11:31:34
高市政府失算了!日本高端光刻胶全面断供,却不想中国早就料到了

高市政府失算了!日本高端光刻胶全面断供,却不想中国早就料到了

青桅
2026-06-28 18:19:11
连爆三部韩剧,Netflix又赢麻了

连爆三部韩剧,Netflix又赢麻了

来看美剧
2026-06-28 19:44:56
网传大疆全系涨价3%-8% ,官方回应:消息不实,无调价计划

网传大疆全系涨价3%-8% ,官方回应:消息不实,无调价计划

蓝鲸新闻
2026-06-28 19:22:04
申花今年耗损有点多!联赛没打前就有伤病

申花今年耗损有点多!联赛没打前就有伤病

80后体育大蜀黍
2026-06-28 22:39:52
关灯后女人没差别?事实全然相反,每位女性都有着独有的特质

关灯后女人没差别?事实全然相反,每位女性都有着独有的特质

千秋文化
2026-06-23 20:12:39
最无解的顶级人格:城府极深,却极度坦诚

最无解的顶级人格:城府极深,却极度坦诚

书窗小记
2026-06-19 15:15:13
一年赚一万亿人民币!他,赌出亚洲最疯狂的科技公司

一年赚一万亿人民币!他,赌出亚洲最疯狂的科技公司

华商韬略
2026-05-20 10:21:40
内马尔也没想到,被全足坛都往死里针对的他,如今对手却不敢铲?

内马尔也没想到,被全足坛都往死里针对的他,如今对手却不敢铲?

小莜读史
2026-06-26 18:46:05
昔日当红女星盖丽丽,早年的复古造型写真

昔日当红女星盖丽丽,早年的复古造型写真

娱你同欢
2026-06-24 20:40:59
阿根廷世界杯头号卧底!整场隐身拖垮全队,真的不能再上他了!

阿根廷世界杯头号卧底!整场隐身拖垮全队,真的不能再上他了!

奶盖熊本熊
2026-06-28 12:22:17
周星驰御用婆婆被曝晚年凄惨,被骗积蓄房产住养老院,一生未婚育

周星驰御用婆婆被曝晚年凄惨,被骗积蓄房产住养老院,一生未婚育

知法而形
2026-06-18 14:29:20
内存大涨价,玩家用DDR1平台成功运行Win11系统

内存大涨价,玩家用DDR1平台成功运行Win11系统

IT之家
2026-06-28 12:25:11
CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

牛锅巴小钒
2026-06-28 15:36:45
2026-06-29 03:07:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
352049文章数 607316关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

家居
旅游
亲子
公开课
军事航空

家居要闻

绿意盎然 自然之境

旅游要闻

不用出昆明,滇池边这片水上森林,藏着昆明最治愈的四季风光!

亲子要闻

肠道真菌菌群紊乱增加儿童过敏风险

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普又发文威胁:伊朗将不复存在

无障碍浏览 进入关怀版