网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.2发布:推理比肩GPT-5

0
分享至

2025年12月2日,DeepSeek正式发布了新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。该系列模型在多项推理与智能体基准测试中取得了开源模型的最佳性能,标志着开源模型在追赶闭源模型的道路上取得了重要进展。

一、核心性能表现

根据官方信息及权威评测平台Artificial Analysis的数据,DeepSeek-V3.2在公开的推理基准测试中表现卓越。标准版V3.2已达到GPT-5水平,略低于Gemini-3.0-Pro。与当前另一高性能开源模型Kimi-K2-Thinking相比,V3.2在相同测试设置下均实现领先,且其输出长度更短,计算开销和用户等待时间显著减少。


长思考增强版V3.2-Speciale则专注于深度推理,它结合了DeepSeek-Math-V2的定理证明能力,在主流推理基准上的性能表现媲美Gemini-3.0-Pro。该模型在国际数学奥林匹克(IMO 2025)、国际大学生程序设计竞赛(ICPC 2025)等赛事中均达到金牌水平,其ICPC成绩相当于人类选手第二名。Speciale版本专为复杂任务设计,Tokens消耗大、成本高,目前仅供研究使用。


二、关键技术突破:DSA架构与高效后训练

DeepSeek团队认为,此前开源模型与闭源模型的差距主要源于三方面:传统注意力机制处理长序列效率低下、训练后阶段算力投入不足、智能体应用场景中的泛化与指令遵循能力较弱。为了解决这些关键限制,DeepSeek首先引入高效的DSA稀疏注意力机制,显著降低计算复杂度并维持长上下文场景下的模型性能;其次开发了可扩展的强化学习协议,投入超过预训练成本10%的算力用于训练后扩展,以解锁模型高级能力;第三,提出创新的流程来促进工具使用场景中的泛化推理,通过合成超过1800个环境和85000个提示的大规模智能体任务数据驱动强化学习,从而显著提升模型在智能体场景中的泛化与指令遵循能力。

三、模型特点与未来方向

DeepSeek-V3.2是Deepseek推出的首个将思考过程融入工具使用的模型,同时支持思考与非思考两种工具调用模式,且在真实应用场景中能够展现出较强的泛化性。目前,标准版V3.2已在官方网页端、App和API全面上线,两个模型均已开源。

DeepSeek也指出了当前模型的不足与未来改进方向:由于总体训练计算量(FLOPs)相对较少,模型的世界知识广度仍落后于领先的专有模型;在达到与Gemini-3.0-Pro同等输出质量时,Token效率(即需要生成长度)仍有提升空间;解决极端复杂任务的能力与前沿模型相比尚有差距。团队计划通过扩大预训练规模、优化推理链的“智能密度”以及完善后训练方案来持续迭代。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
倒计时一天!王俊杰加盟山西?尘埃落定,曝签字费不菲,规则曝光

倒计时一天!王俊杰加盟山西?尘埃落定,曝签字费不菲,规则曝光

萌兰聊个球
2026-04-02 10:02:12
陈赓当选候补委员,问毛主席:候谁的补?旁人回答让大家捧腹大笑

陈赓当选候补委员,问毛主席:候谁的补?旁人回答让大家捧腹大笑

兴趣知识
2026-04-02 17:05:35
17.99万!大众官宣:新车正式上市

17.99万!大众官宣:新车正式上市

高科技爱好者
2026-04-01 23:02:18
突发!王正行官宣退役!

突发!王正行官宣退役!

佑铭羽球
2026-04-02 13:06:11
68岁陈忠和近况:四口之家很幸福,女儿系前妻生,赵蕊蕊常去探望

68岁陈忠和近况:四口之家很幸福,女儿系前妻生,赵蕊蕊常去探望

白面书誏
2026-03-21 16:13:21
伊朗大胜仗!200名指挥官刚进会议室:导弹就破门而入

伊朗大胜仗!200名指挥官刚进会议室:导弹就破门而入

大国观察眼
2026-04-01 06:05:03
贾永婕发文要曝小S“猛料”,小S霸气回应:不要说,怕你承受不了

贾永婕发文要曝小S“猛料”,小S霸气回应:不要说,怕你承受不了

陈意小可爱
2026-04-02 19:15:13
终于!伊朗,斩首之战打响

终于!伊朗,斩首之战打响

新浪财经
2026-04-01 18:43:58
鏖战!孙颖莎五六局保持强势进攻,4-2蒯曼晋级八强!

鏖战!孙颖莎五六局保持强势进攻,4-2蒯曼晋级八强!

篮球资讯达人
2026-04-02 19:20:24
拉不出屎,正在成为中学生的集体秘密

拉不出屎,正在成为中学生的集体秘密

二胎妈妈圈
2026-03-30 22:00:21
英国首相回应特朗普退出北约言论

英国首相回应特朗普退出北约言论

新华社
2026-04-01 17:49:30
伊朗对美以发动第89波攻势,自杀式无人机突进北印度洋,逼退“林肯”号航母

伊朗对美以发动第89波攻势,自杀式无人机突进北印度洋,逼退“林肯”号航母

上观新闻
2026-04-02 04:24:13
法国女足输不起!1-2输中国女足后,几乎全队拒绝握手,现场视角还原

法国女足输不起!1-2输中国女足后,几乎全队拒绝握手,现场视角还原

侧身凌空斩
2026-04-02 04:23:20
健身后欲望很大是怎么回事?

健身后欲望很大是怎么回事?

性学研究僧
2026-04-02 20:11:16
杨瀚森的首场季后赛赢了!

杨瀚森的首场季后赛赢了!

五星体育
2026-04-02 13:42:58
劝告邱毅:不要在错误的道路越走越远

劝告邱毅:不要在错误的道路越走越远

论事的老枢
2026-03-31 14:45:09
西班牙宣布与以色列断绝外交关系。

西班牙宣布与以色列断绝外交关系。

阿七说史
2026-04-01 15:51:46
黄磊评价陈飞宇长相:真像你爸爸,但你比他好看,你的好看像妈妈

黄磊评价陈飞宇长相:真像你爸爸,但你比他好看,你的好看像妈妈

观鱼听雨
2026-04-01 18:39:06
美国特种兵不堪回首!进入伊朗还没交火就死了一堆,结果仓皇而逃

美国特种兵不堪回首!进入伊朗还没交火就死了一堆,结果仓皇而逃

健身狂人
2026-04-02 15:19:37
通胀爆表、半数人贫困!阿根廷人均肉食仍115公斤,真相太意外

通胀爆表、半数人贫困!阿根廷人均肉食仍115公斤,真相太意外

老马拉车莫少装
2026-02-22 00:01:41
2026-04-02 21:20:49
蓝鲨财经社 incentive-icons
蓝鲨财经社
蓝鲨财经社是一家追求最新的AI技术与财经商业领域结合的自媒体。
733文章数 9关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

张雪妻子:近两年才还清所有私人欠款 我不是好命的人

头条要闻

张雪妻子:近两年才还清所有私人欠款 我不是好命的人

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

宋宁峰带女儿出轨,张婉婷找董璇哭诉

财经要闻

市场被特朗普一句话打醒 滞胀交易回归

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

房产
旅游
教育
本地
军事航空

房产要闻

巨无霸来了!海口城更,突然又爆大动作!

旅游要闻

贵州百里杜鹃进入盛花期

教育要闻

昆明市西山区碧鸡徐霞客中心学校碧水校区丨筑牢校园安全防线 守护孩子成长之路

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

军事要闻

伊朗自杀无人机突进 逼退林肯号航母

无障碍浏览 进入关怀版