网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型

0
分享至


作者 | summer
邮箱 | huangxiaoyi@pingwest.com

在R2和V4到来之前,DeepSeek先让我们看到了“V3 Plus”。

3月24日,DeepSeek一声不响的在Huggingface上发布了V3的“小版本”迭代“DeepSeek-V3-0324”。开发者社区再次一片尝鲜与夸赞。

之后3月25日晚,官方发布了该版本的官方报告。在DeepSeek的报告里,给出了四个官方亮点指引,分别是推理能力、前端开发能力、中文写作能力、中文搜索能力的强化。

乍看起来,这些能力提升都聚焦在用户常见任务场景之上。 这也的确是一次非常注重实用性的升级,虽名为“小版本”,V3-0324却在多个关键能力上实现了显著突破,尤其是代码生成能力的提升令人印象深刻。用户只需关闭深度思考模式,就能体验这一新版本,而API接口和使用方式保持不变。

而仔细观察这几个提升的领域,会发现一个有意思的点:DeepSeek给V3做的提升,全都落在R1的优势能力范围内了啊。

据报告显示,推理能力的提升主要体现在新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提高,特别是在数学、代码类相关评测集上取得了超过 GPT-4.5、Claude-Sonnet-3.7的得分成绩。


过去,在DeepSeek的两个模型中,R1是推理模型,而V3则更适合日常对话。如今V3系列也有了推理能力的强力升级,用户可以更好地根据任务难度选择合适的模型:复杂问题用R1,日常对话用新版V3。这种差异化策略让算力资源与任务需求更匹配,避免了不必要的计算浪费。

在推理能力之上,几项任务场景中,最引人注目的是模型的代码稳定性和准确性。继Claude-Sonnet-3.7在前端开发能力上火爆出圈之后,大模型在这一场景的实用性被额外关注。在V3新版本技术报告出现之前,不少网友们就迫不及待地测出了V3-0324在前端开发场景下的能力飞跃。

有开发者报告生成800行代码,字符蹦到“冒火星”,竟然无一错误。对开发者而言,这种体验在遍地都是爱报错的AI编程工具之下,显得尤为突出。


还有用户进一步测试表明,尽管还有差距,但DeepSeek-V3-0324在前端视觉设计上已经接近了Claude这样的顶级模型。

用户只需提供简单提示,就能生成时尚的数字营销页面,布局合理,视觉效果精美。这种实用性的提升对网页设计师和前端开发者尤为重要,大大缩短了从创意到实现的时间。

与社区测试相呼应,DeepSeek官方在技术报告中也展示了模型的前端代码能力。报告中展示了一个p5.js小球物理运动程序,包含可调整的物理参数和赛博朋克风格界面,不仅功能完整,还具有高度的美观性和交互性。


更重要的是,这个不比Claude差的新版本,可以免费使用,据网友测算,付费API的价格更是便宜了15倍。


除了代码能力,DeepSeek R1的写作能力也一直被津津乐道。其细腻的文风虽然有时会陷入极繁主义的浮夸,但情节连贯性和特定风格下的表达能力很强,有短剧和小说从业者都曾对硅星人提到,已经开始应用DeepSeek创作。

此次,新版本V3在中文能力也有明显增强,特别是中长篇文本创作上质量更高,结构更完整,逻辑更严密,实用性也大大增强。


另外,在联网搜索场景下,报告生成能力也有显著提升。模型能够从网络信息中提取关键内容,生成详实准确的报告,并以清晰美观的排版呈现。

在开源方面,DeepSeek也继续保持了其一贯的透明度和友好性。作为小版本更新,私有化部署只需要更新checkpoint和tokenizer_config.json等少量文件。这意味着现有用户升级成本极低,几乎可以无缝迁移。据报告显示,该模型参数约660B,略低于原先V3的671B,开源版本上下文长度为128K(网页端、App和API提供64K上下文),依然采用MIT许可证,这使得开发者可以在各种场景下自由使用。

这些能力提升其实幅度不小,但DeepSeek没有把它称为V3.5、V3.7,而只是将它定义为一次V3小版本更新。

在行业版本迭代泛滥、概念炒作盛行的当下,通过低调务实的姿态赢得了更多开发者社区的尊重。虽然能力有显著提升,但由于没有大的技术路线突破,仍将其定位为小版本迭代,那么当DeepSeek真正发布R2时,那将是一次名副其实的重大升级,而非行业常见的“通货膨胀式”命名。


这种对技术命名的诚实态度,也是外界格外期待R2的重要理由。

而这次更新最重要的地方还在于,DeepSeek的V3和R1出现后,如Anthropic等对手在尝试用新方法超车,核心在于把推理模型和大语言模型融合,无论是产品上通过AI的自动调配来融合到一起,还是从模型层面就“合二为一”。

现在看来,DeepSeek此次更新也很直白的展示了自己接下来的路线,也是把V系列和R系列融合成一个新模型。

官方报告中明确指出,此次更新与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法,并借鉴了DeepSeek-R1模型训练过程中的强化学习技术。

这是纯RL路线的再一次的验证和公示,在对手们继续闭源并使用“唯一混合模型”这样的概念来吸引人的时候,它继续通过开源为行业提供公开的高效迭代思路。DeepSeek这开源的仗还会继续打下去,好戏还在后面。


点个“爱心”,再走吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太离谱!中国游客出国,当街上演“活春宫”,还全程录像!

太离谱!中国游客出国,当街上演“活春宫”,还全程录像!

小江网评
2025-04-27 21:50:03
河南省南阳市委原书记朱是西被“双开”

河南省南阳市委原书记朱是西被“双开”

界面新闻
2025-04-27 10:06:49
网传成都一企业招聘某岗位,要求空乘模特类专业!还要“硬关系”

网传成都一企业招聘某岗位,要求空乘模特类专业!还要“硬关系”

火山诗话
2025-04-27 08:56:26
大一女生哭诉:生活费1500元啥都不舍得买,什么都算计好崩溃…

大一女生哭诉:生活费1500元啥都不舍得买,什么都算计好崩溃…

晓风说
2025-04-27 15:28:56
十年噩梦后,乌克兰人开始怀念亚努科维奇时代

十年噩梦后,乌克兰人开始怀念亚努科维奇时代

远方风林
2025-03-31 07:55:06
美国简直就是另一个东北

美国简直就是另一个东北

穷游网
2025-03-17 15:32:02
现场见证利物浦夺冠,斯图里奇晒与萨拉赫、阿诺德合照

现场见证利物浦夺冠,斯图里奇晒与萨拉赫、阿诺德合照

懂球帝
2025-04-28 04:10:20
致命反击!巴铁一剑封喉,印度的噩梦来了!

致命反击!巴铁一剑封喉,印度的噩梦来了!

大嘴说天下
2025-04-27 18:50:06
特斯拉杀疯了!5000元不到的两轮电动车,雅迪、小牛、九号都得抖三抖,小电动车市场天“塌”了!

特斯拉杀疯了!5000元不到的两轮电动车,雅迪、小牛、九号都得抖三抖,小电动车市场天“塌”了!

汽车指南针
2025-04-27 08:05:17
微软放弃“一锤子买卖”,前员工揭秘Windows 10免费升级背后的真相!

微软放弃“一锤子买卖”,前员工揭秘Windows 10免费升级背后的真相!

CSDN
2025-04-27 17:01:34
机场突发!一旅客被警方击毙

机场突发!一旅客被警方击毙

澳洲红领巾
2025-04-27 15:15:56
中美贸易战进入关键阶段?4月28日,凌晨的三大重要消息持续发酵

中美贸易战进入关键阶段?4月28日,凌晨的三大重要消息持续发酵

风口招财猪
2025-04-28 00:48:30
俄罗斯已经吞下了一枚毒诱饵

俄罗斯已经吞下了一枚毒诱饵

魔幻故事
2025-04-26 15:58:56
这才是清朝妃子被临幸的全过程,别再被电视剧骗了,真相更残酷

这才是清朝妃子被临幸的全过程,别再被电视剧骗了,真相更残酷

赢梯
2025-04-16 19:13:14
美人在骨不在皮 !北京这一夜,32岁的杨紫,输给了42岁的孙俪

美人在骨不在皮 !北京这一夜,32岁的杨紫,输给了42岁的孙俪

小娱乐悠悠
2025-04-26 10:21:08
男子现场问欠的360借条能不能不还,周鸿祎:这不是我的公司

男子现场问欠的360借条能不能不还,周鸿祎:这不是我的公司

映射生活的身影
2025-04-27 15:17:34
三河市“牌匾禁用红蓝黑底色”,竟然真的是市里的文件规定的

三河市“牌匾禁用红蓝黑底色”,竟然真的是市里的文件规定的

法律学堂
2025-04-28 00:07:37
5月1日开始运势回升,诸事顺利的生肖,财星眷顾,逆风翻盘

5月1日开始运势回升,诸事顺利的生肖,财星眷顾,逆风翻盘

萨勒芬妮i
2025-04-28 01:15:18
谌容离世才一年,再看嫁给英达28年的梁欢,还真应了冯小刚那番话

谌容离世才一年,再看嫁给英达28年的梁欢,还真应了冯小刚那番话

简读视觉
2025-04-27 16:20:03
汪峰试探问:你跟几个男人回过家?章子怡一句话,让他瞬间红了脸

汪峰试探问:你跟几个男人回过家?章子怡一句话,让他瞬间红了脸

火之文
2025-02-04 13:22:59
2025-04-28 04:36:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2144文章数 10334关注度
往期回顾 全部

科技要闻

充1秒跑2.5公里,宁德时代比亚迪华为激战

头条要闻

用马斯克理念改造生产线 95后女生创业1年销售额上亿

头条要闻

用马斯克理念改造生产线 95后女生创业1年销售额上亿

体育要闻

我们来自北极圈,我们有全球最恐怖的主场!

娱乐要闻

华表奖获奖名单!张译二影帝惠英红勇影后

财经要闻

2千亿!核电开闸 国常会核准10台新机组

汽车要闻

蔚来李斌的"十年磨一剑" 从看得见 到看不见

态度原创

数码
本地
时尚
房产
艺术

数码要闻

AMD新一代笔记本GPU阵容曝光 共6款型号 剑指英伟达?  

本地新闻

云游湖北 | 汉川文旅新体验:千年陶艺邂逅湖光

5条适合春天的裙子、裤子!温柔显瘦美到爆炸!

房产要闻

首开2小时热销超 200 套!天河芯红盘凭什么交出楼市满分答卷?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

无障碍浏览 进入关怀版