网易首页 > 网易号 > 正文 申请入驻

DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

0
分享至

IT之家 3 月 25 日消息,DeepSeek-V3 模型昨日进行了小版本更新,今晚官方发布了该更新的详情。

IT之家附全文内容如下:

DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。V3-0324 模型权重下载请参考:

Model Scope:

Huggingface:

与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视火速曝光:全是假货!别再往家里搬了,很多人天天在用!

央视火速曝光:全是假货!别再往家里搬了,很多人天天在用!

云舟史策
2026-03-05 17:54:39
伊朗官员:美国媒体在撒谎!伊朗没有向美国发送任何信息

伊朗官员:美国媒体在撒谎!伊朗没有向美国发送任何信息

西游日记
2026-03-05 14:03:18
46岁殷桃一张网球照,狠狠扇内娱畸形审美一巴掌!白瘦幼该醒醒了

46岁殷桃一张网球照,狠狠扇内娱畸形审美一巴掌!白瘦幼该醒醒了

喜欢历史的阿繁
2026-03-06 00:57:53
贝尔再谈C罗:他只想进球超越梅西!我不传球他就会挥动双臂不满

贝尔再谈C罗:他只想进球超越梅西!我不传球他就会挥动双臂不满

奥拜尔
2026-03-05 18:22:07
观点 | 谁也没想到,伊朗局势让这个南亚小国先受伤

观点 | 谁也没想到,伊朗局势让这个南亚小国先受伤

南亚研究通讯
2026-03-05 23:10:45
伊朗外长:记住我的话,美国将为开创先例“后悔”;伊斯兰革命卫队:报复将会更加猛烈和广泛

伊朗外长:记住我的话,美国将为开创先例“后悔”;伊斯兰革命卫队:报复将会更加猛烈和广泛

极目新闻
2026-03-05 17:43:06
79比98狂输19分!女篮争冠热门惨遭爆冷:没张子宇冲冠悬了?

79比98狂输19分!女篮争冠热门惨遭爆冷:没张子宇冲冠悬了?

篮球快餐车
2026-03-06 01:58:58
成都“活力28”将开新厂:一度濒临倒闭,“三个老头”直播救厂出圈,靠真诚留流量

成都“活力28”将开新厂:一度濒临倒闭,“三个老头”直播救厂出圈,靠真诚留流量

红星新闻
2026-03-05 20:54:22
杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

犀利强哥
2026-03-04 21:40:54
何洁深夜直播哭诉,累到失眠,一人养4娃快要被压垮,睁眼就是干

何洁深夜直播哭诉,累到失眠,一人养4娃快要被压垮,睁眼就是干

木子爱娱乐大号
2026-03-05 15:42:39
美国人也很纳闷:伊朗导弹怎么还没炸光?美媒给答案:朝鲜出手了

美国人也很纳闷:伊朗导弹怎么还没炸光?美媒给答案:朝鲜出手了

阿钊是个小小评论员
2026-03-06 01:39:04
“寿司郎吃出金枪鱼寄生虫卵”,北京门头沟区市监局通报

“寿司郎吃出金枪鱼寄生虫卵”,北京门头沟区市监局通报

观察者网
2026-03-05 08:25:16
湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

极目新闻
2026-03-04 09:59:45
让党的创新理论入脑入心入魂

让党的创新理论入脑入心入魂

中国教育新闻网
2026-03-04 08:46:12
被爆换武僧心脏、喝小孩血! 李连杰笑喷:怎么不说我换「华为心、小米肾」?

被爆换武僧心脏、喝小孩血! 李连杰笑喷:怎么不说我换「华为心、小米肾」?

ETtoday星光云
2026-03-04 16:42:06
有些地方机关事业单位退休人员退休金因为绩效奖金均摊到月而增加

有些地方机关事业单位退休人员退休金因为绩效奖金均摊到月而增加

郭爱华追问教育
2026-03-05 06:29:26
苹果发最强 Macbook Pro,17999 起;ChatGPT 卸载激增 295%;韩国棋手李世石 10 年后再战 AI | 极客早知道

苹果发最强 Macbook Pro,17999 起;ChatGPT 卸载激增 295%;韩国棋手李世石 10 年后再战 AI | 极客早知道

极客公园
2026-03-04 08:17:53
伊朗发射携带1吨重弹头的导弹打击以色列

伊朗发射携带1吨重弹头的导弹打击以色列

新华社
2026-03-05 19:08:15
北京某顶级建工集团崩了,全面停工,全员待岗!

北京某顶级建工集团崩了,全面停工,全员待岗!

黯泉
2026-03-04 21:50:39
我预计到了三大运营商今年会很难,但没预料到开局就这么难!

我预计到了三大运营商今年会很难,但没预料到开局就这么难!

悲了伤的白犀牛
2026-03-04 08:00:53
2026-03-06 04:40:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
332546文章数 607043关注度
往期回顾 全部

科技要闻

独家|林俊旸辞职 我们和认识他的人聊了聊

头条要闻

伊朗:已作好准备应对美国地面行动

头条要闻

伊朗:已作好准备应对美国地面行动

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

本地
游戏
手机
数码
公开课

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

今天是《生化危机5》发售17周年

手机要闻

不到200g的小屏旗舰塞进7500mAh电池!一加15T手感稳了

数码要闻

从光学玻璃到几何波导:肖特发布全系列AR光学方案

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版