网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布V3.2系列模型,强化Agent能力,推理能力追平GPT-5

0
分享至

DeepSeek今天(12月1日)同步推出两款正式版本AI模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,前者主打日常应用场景,后者在多项国际竞赛中获得金牌。这标志着开源模型与闭源商业模型的性能差距进一步缩小。

该公司表示,DeepSeek-V3.2在公开推理测试中达到GPT-5水平,仅略低于Gemini-3.0-Pro。相比同类产品Kimi-K2-Thinking,新模型输出长度大幅降低,显著减少了计算开销与用户等待时间。官方网页、APP和API服务已全面更新至V3.2版本。


增强版V3.2-Speciale在IMO 2025、CMO 2025等四项国际顶级竞赛中斩获金牌,其中在ICPC与IOI成绩分别达到人类选手第二名与第十名水平。该版本结合了DeepSeek-Math-V2的定理证明能力,专注于将开源模型推理能力推向极致。

两款模型均已在HuggingFace和ModelScope平台开源。V3.2-Speciale目前仅以临时API形式开放至12月15日,供社区评测与研究使用。

推理性能对标顶尖闭源模型

DeepSeek-V3.2定位为平衡推理能力与输出长度的日常使用模型,适合问答场景和通用Agent任务。在主流推理基准测试中,该模型表现接近Gemini-3.0-Pro水平。

DeepSeek-V3.2-Speciale作为长思考增强版本,具备严谨的数学证明与逻辑验证能力,在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025四项国际竞赛中均获金牌。这是开源模型首次在如此广泛的顶级竞赛中取得突破性成绩。

但该公司提示,Speciale版本在处理高度复杂任务时消耗的Tokens显著更多、成本更高,目前仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务优化。

首次实现思考模式与工具调用融合

DeepSeek-V3.2是该公司首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。该公司提出了一种大规模Agent训练数据合成方法,构造了1800多个环境、85000多条复杂指令的强化学习任务。

根据技术报告,V3.2在智能体评测中达到当前开源模型最高水平,大幅缩小了开源模型与闭源模型在工具调用能力上的差距。该公司表示,模型并未针对测试集工具进行特殊训练,预计在真实应用场景中能展现较强泛化性。

在思考模式下,模型能够经过多轮思考加工具调用后给出更详尽准确的回答。该功能已增加对Claude Code的支持,但暂未充分适配Cline、RooCode等使用非标准工具调用的组件。

DSA稀疏注意力机制获验证

该公司两个月前发布的实验性DeepSeek-V3.2-Exp收到众多用户对比测试反馈。目前未发现该版本在任何特定场景中显著差于V3.1-Terminus,验证了DSA稀疏注意力机制的有效性。

官方网页端、APP和API均已更新为正式版DeepSeek-V3.2。V3.2-Speciale的临时API服务可通过特定base_url访问,该模型API价格不变,最大输出长度默认为128K,服务截止至北京时间12月15日。

两款模型已在HuggingFace和ModelScope平台开源,技术报告同步发布。该公司表示用户的积极反馈为其持续创新注入了更多信心与动力。

Deepseek官方新闻稿全文如下:

两个月前,我们发布了实验性的 DeepSeek-V3.2-Exp,并收到了众多热心用户反馈的对比测试结果。目前未发现 V3.2-Exp 在任何特定场景中显著差于 V3.1-Terminus,这验证了 DSA 稀疏注意力机制的有效性。也感谢广大用户一直以来的积极反馈与支持,为我们的持续创新注入了更多信心与动力。
今天,我们同时发布两个正式版模型:

DeepSeek-V3.2DeepSeek-V3.2-Speciale。
官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,欢迎使用。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。
新模型技术报告已同步发布:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf
推理能力全球领先
  • DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。
  • DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro(见表1)。更令人瞩目的是,V3.2-Speciale 模型成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。
Tips:在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。
表1:DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数)
思考融入工具调用
  • 不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是我们推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。我们提出了一种大规模 Agent 训练数据合成方法,构造了大量「难解答,易验证」的强化学习任务(1800+ 环境,85,000+ 复杂指令),大幅提高了模型的泛化能力。
表2:DeepSeek-V3.2 与其他模型在各类智能体工具调用评测集上的得分
  • 如表 2 所示,DeepSeek-V3.2 模型在智能体评测中达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。值得说明的是,V3.2 并没有针对这些测试集的工具进行特殊训练,所以我们相信,V3.2 在真实应用场景中能够展现出较强的泛化性。
示例为通过 LobeChat 使用 DeepSeek-V3.2 的深度思考+工具调用能力得到更加详细准确的回复
开源
  • DeepSeek-V3.2
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
  • DeepSeek-V3.2-Speciale
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
网页端、APP 与 API 更新DeepSeek-V3.2 是我们当前正式提供服务的模型,官网网页、APP、API 模型均已由 DeepSeek-V3.2-Exp 升级为正式版 DeepSeek-V3.2,使用方式不变。
同时,为了方便社区评测与研究,我们非正式部署了 DeepSeek-V3.2-Speciale 的 API 服务,API 用户可以通过设置
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
访问该模型。该模型 API 价格不变,只支持思考模式下的对话功能,不支持工具调用等功能,最大输出长度默认为 128K,支持时间截止至北京时间 2025-12-15 23:59。
思考模式下的工具调用本次 API 更新支持了 DeepSeek-V3.2 思考模式下的工具调用能力。当前在思考模式下,模型能够经过多轮的思考 + 工具调用,最终给出更详尽准确的回答。下图为思考模式下进行工具调用的 API 请求示意图:
  • 在回答问题 1 过程中(请求 1.1 - 1.3),模型进行了多次思考 + 工具调用后给出答案。在这个过程中,用户需回传思维链内容(reasoning_content)给 API,以让模型继续思考。
  • 在下一个用户问题开始时(请求 2.1),需删除之前的思维链,并保留其它内容发送给 API。
  • 更详细的使用方法请参考 API 文档:
    https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
DeepSeek-V3.2 的思考模式也增加了对 Claude Code 的支持,用户可以通过将模型名改为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键开启思考模式进行使用。但需要注意的是,思考模式未充分适配 Cline、RooCode 等使用非标准工具调用的组件,我们建议用户在使用此类组件时继续使用非思考模式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
每秒飞1光年也没用!残酷的事实证明,人类永远也飞不出宇宙

每秒飞1光年也没用!残酷的事实证明,人类永远也飞不出宇宙

观察宇宙
2026-04-06 11:31:01
18.98万起!广汽官宣:新车正式上市

18.98万起!广汽官宣:新车正式上市

高科技爱好者
2026-04-08 23:24:09
毛主席从不批评刘伯承和徐向前,一个是不忍批评,另一个无需批评

毛主席从不批评刘伯承和徐向前,一个是不忍批评,另一个无需批评

鹤羽说个事
2026-04-08 22:21:11
不跑不跳!一个被严重低估的“长寿动作”藏着6大好处,医生都在推荐

不跑不跳!一个被严重低估的“长寿动作”藏着6大好处,医生都在推荐

黄河新闻网吕梁
2026-04-06 09:33:08
万斯在布达佩斯发表重磅演讲,国际关系将发生苏联解体以来最大变化

万斯在布达佩斯发表重磅演讲,国际关系将发生苏联解体以来最大变化

码头青年
2026-04-08 15:06:20
又有两队想抢字母哥!雄鹿超巨下家赔率更新:热火领跑火箭第四

又有两队想抢字母哥!雄鹿超巨下家赔率更新:热火领跑火箭第四

罗说NBA
2026-04-09 05:17:52
广东珠海一女神好漂亮, 身高179cm,体重50kg 美的让人移不开眼

广东珠海一女神好漂亮, 身高179cm,体重50kg 美的让人移不开眼

小鹿姐姐情感说
2026-04-09 04:17:27
泰山紧急换帅,三大潜在人选,一人呼声最高,另一人最具冲冠潜力

泰山紧急换帅,三大潜在人选,一人呼声最高,另一人最具冲冠潜力

体坛风之子
2026-04-08 07:00:08
大陆在南京宴请访陆团,11道菜充满江南味,郑丽文一个动作很罕见

大陆在南京宴请访陆团,11道菜充满江南味,郑丽文一个动作很罕见

李健政观察
2026-04-08 12:15:51
樊振东不回归原因曝光!波尔一句话说透内幕,真因比阴谋论更残酷

樊振东不回归原因曝光!波尔一句话说透内幕,真因比阴谋论更残酷

郝小小看体育
2026-04-08 01:40:01
杨幂新剧造型不仅颜值下滑很显老还弯腰驼背体态畏缩毫无古人之姿

杨幂新剧造型不仅颜值下滑很显老还弯腰驼背体态畏缩毫无古人之姿

小椰的奶奶
2026-04-09 02:19:02
0射正三连败卫冕冠军惨遭巴黎血洗利物浦快把英超7队欧冠梦踢没了

0射正三连败卫冕冠军惨遭巴黎血洗利物浦快把英超7队欧冠梦踢没了

阿晞体育
2026-04-09 07:01:32
华为AI眼镜将至,何刚首曝新机拍摄样张

华为AI眼镜将至,何刚首曝新机拍摄样张

IT之家
2026-04-08 18:36:06
订单排到2028年!光通信这波不是炒概念,是真金白银的产业爆发

订单排到2028年!光通信这波不是炒概念,是真金白银的产业爆发

Thurman在昆明
2026-04-08 08:36:14
大暴雨来了:狂风暴雨将袭江南多省,华南桑拿酷热又要加强

大暴雨来了:狂风暴雨将袭江南多省,华南桑拿酷热又要加强

中国气象爱好者
2026-04-08 23:17:18
伊朗停火声明公布,言辞令人泪目,穆杰塔巴给了全体民众一个交代

伊朗停火声明公布,言辞令人泪目,穆杰塔巴给了全体民众一个交代

小莜读史
2026-04-09 04:36:41
71岁辽足功勋离世!妻子是女篮名帅,女儿六冠王,一门三杰太传奇

71岁辽足功勋离世!妻子是女篮名帅,女儿六冠王,一门三杰太传奇

洲洲影视娱评
2026-04-08 20:14:24
自欧冠首秀以来,小蜘蛛是直接任意球破门次数并列最多的球员

自欧冠首秀以来,小蜘蛛是直接任意球破门次数并列最多的球员

懂球帝
2026-04-09 04:58:23
大反转!李家鼎悲痛反击长子!自爆前妻施明遭其恐吓,被阻止出席细仔婚礼

大反转!李家鼎悲痛反击长子!自爆前妻施明遭其恐吓,被阻止出席细仔婚礼

TVB剧评社
2026-04-08 20:05:47
迟重瑞与陈丽华结婚付出了3大牺牲!他的姐姐和弟弟人生现状如何

迟重瑞与陈丽华结婚付出了3大牺牲!他的姐姐和弟弟人生现状如何

TVB的四小花
2026-04-09 03:12:00
2026-04-09 07:36:50
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
144249文章数 2653165关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

特朗普认为北约未通过“考验” 将考虑“退群”

头条要闻

特朗普认为北约未通过“考验” 将考虑“退群”

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

健康
教育
数码
手机
家居

干细胞抗衰4大误区,90%的人都中招

教育要闻

“新型啃老”席卷全国:孩子不工作也不伸手要钱,家长害怕毁一生

数码要闻

最轻ThinkPad来了!ThinkPad X13 Gen 7发布

手机要闻

苹果“三年计划”曝光,iPhone要大变样了?

家居要闻

自在恣意 侘寂风别墅

无障碍浏览 进入关怀版