网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.2正式发布:推理达GPT-5水平,智能体评测中开源模型最高水平

0
分享至


国产大模型风向标DeepSeek再发重磅新模型:重点强化智能体能力,并且融入思考和推理过程。

12月1日,DeepSeek同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新为正式版 DeepSeek-V3.2,Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

DeepSeek-V3.2表示,其目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent(智能体)任务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2达到GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少计算开销与用户等待时间。


据DeepSeek方面介绍,DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,V3.2-Speciale是DeepSeek-V3.2长思考增强版,同时结合DeepSeek-Math-V2定理证明能力。

DeepSeek-V3.2具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2是首个将思考融入工具使用的模型。同时支持思考模式与非思考模式的工具调用,目前提出一种大规模Agent训练数据合成方法,DeepSeek-V3.2 模型在智能体评测中达到当前开源模型的最高水平,大幅缩小开源模型与闭源模型的差距。

值得说明的是,V3.2并没有针对这些测试集的工具进行特殊训练,所以V3.2在真实应用场景中能够展现出较强的泛化性。

在评测和成绩方面,DeepSeek-V3.2-Speciale模型获得IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到人类选手第二名与第十名的水平。

值得注意的是,DeepSeek指出,在高度复杂任务上,Speciale模型大幅优于标准版本,但消耗的Tokens也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。


DeepSeek是当之无愧的大模型风向标,一举一动都受到行业整体关注。最近网易有道词典发布2025年度词汇——“deepseek”以 8672940次年度搜索量成功当选。据有道词典负责人介绍,“deepseek”在词典内部的搜索曲线呈现明显的爆发式特征,从年初因“低成本”突破算力封锁起,几乎每个重要进展都会带动搜索量上涨。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为进组做准备,颖儿直播打热玛吉,疼到捏扁解压球,太敬业了

为进组做准备,颖儿直播打热玛吉,疼到捏扁解压球,太敬业了

TVB的四小花
2026-03-26 13:38:07
带娃出国的中产后悔了:想回来,但回国失败

带娃出国的中产后悔了:想回来,但回国失败

视觉志
2026-03-24 10:36:13
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

黑鹰观军事
2026-03-25 13:49:59
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
中国选美冠军白欣禾,胸前的美人痣真好看,仙气飘飘像刘奕菲

中国选美冠军白欣禾,胸前的美人痣真好看,仙气飘飘像刘奕菲

可乐谈情感
2026-03-24 18:06:38
Anthropic冲塔ASI自进化,要做全球操作系统!Claude OS一刀砍向6.4万亿帝国

Anthropic冲塔ASI自进化,要做全球操作系统!Claude OS一刀砍向6.4万亿帝国

新智元
2026-03-25 19:40:39
千万粉丝挖机小何塌房了,挖机被厂家回收,厂家出面爆出真相

千万粉丝挖机小何塌房了,挖机被厂家回收,厂家出面爆出真相

新游戏大妹子
2026-03-26 13:10:14
克拉拉擦边香艳床戏包贝尔再演坏淫!这部网大爽得太肤浅

克拉拉擦边香艳床戏包贝尔再演坏淫!这部网大爽得太肤浅

释凡电影
2026-03-24 04:57:40
好消息!湖北多地将放“春假”!

好消息!湖北多地将放“春假”!

越乔
2026-03-26 15:04:49
登顶Top.1,女神新作又爆了

登顶Top.1,女神新作又爆了

来看美剧
2026-03-24 19:35:04
有一种“算计”叫郭晋安欧倩怡,离婚一年后才看懂郭晋安有多精明

有一种“算计”叫郭晋安欧倩怡,离婚一年后才看懂郭晋安有多精明

小椰的奶奶
2026-03-27 00:02:26
老友鼓励加图索晋级世界杯,但意大利锋线却只能依赖20岁的他

老友鼓励加图索晋级世界杯,但意大利锋线却只能依赖20岁的他

里芃芃体育
2026-03-27 00:10:08
杜锋下课警钟敲响,球迷贴脸输出,赛后点名陈家政争议发言遭声讨

杜锋下课警钟敲响,球迷贴脸输出,赛后点名陈家政争议发言遭声讨

晚雾空青
2026-03-26 14:00:12
为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

复转这些年
2026-03-14 23:48:05
成龙昔日兰博基尼,705万被山东小伙买走,全球就这1辆,车牌很讲究

成龙昔日兰博基尼,705万被山东小伙买走,全球就这1辆,车牌很讲究

西莫的艺术宫殿
2026-03-23 20:15:44
复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

雪狼侃体育
2026-03-26 23:13:58
出大事了,美以陷入孤立,特朗普连夜反水,德总统公开嘲讽美国

出大事了,美以陷入孤立,特朗普连夜反水,德总统公开嘲讽美国

无人倾听无人倾听
2026-03-26 23:16:56
丫蛋有三个孩子,大儿子王天琦是她与前夫王金龙所生,2011年出生

丫蛋有三个孩子,大儿子王天琦是她与前夫王金龙所生,2011年出生

南权先生
2026-03-23 15:17:49
乌干达高层放话支持以色列:历史恩怨正在反转

乌干达高层放话支持以色列:历史恩怨正在反转

桂系007
2026-03-26 23:58:56
穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

夜深爱杂谈
2026-03-01 21:28:54
2026-03-27 01:00:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
885217文章数 5089156关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
房产
时尚
公开课
军事航空

转头就晕的耳石症,能开车上班吗?

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

400万人爱过的女孩,被黄谣网暴180天后

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版