网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

OpenAI危！DeepSeek放大招：追平谷歌最强，手撕GPT-5 High

2025-12-01 23:21:59　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：艾伦 KingHZ

【新智元导读】「开源之神」DeepSeek重磅发布V3.2正式版，性能全面超越GPT-5 High，与谷歌Gemini-3.0 Pro平分秋色。新模型不仅斩获4项国际奥赛金牌级成绩，更凭借独创的DSA稀疏注意力架构，打破「速度、成本、智能」的不可能三角。

OpenAI这次真的要慌了！

就在刚刚，「源神」DeepSeek开源了DeepSeek-V3.2正式版——

在数学编程等多项推理基准上，全面超越GPT-5 High，优于Claude 4.5 Sonet；

与刷屏的Gemini 3.0 Pro相比，则难分伯仲，不相上下！

表1：DeepSeek-V3.2与其他模型在各类数学、代码与通用领域评测集上的得分（括号内为消耗Tokens估计总量）

在今年，DeepSeek此前已发布7款模型——「开源之神」，当之无愧：

DeepSeek‑R1、DeepSeek‑R1‑Zero

DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp

DeepSeek‑OCR、DeepSeek‑Math-V2

出手即王炸

开源4项奥赛金牌级AI

全新模型DeepSeek-V3.2，出手即王炸。

DeepSeek正式发布DeepSeek-V3.2与DeepSeek-V3.2-Speciale——专为智能体打造的推理优先模型！

DeepSeek-V3.2：V3.2-Exp的官方迭代版本，现已登陆App、网页端及API；
DeepSeek-V3.2-Speciale：突破推理能力边界，目前仅通过API提供服务。

两款模型均达到世界级推理性能：

V3.2：推理能力与文本长度兼顾，拥有GPT-5级别性能，适合日常驱动；
V3.2-Speciale：极致推理能力，取得了4项金牌级成绩；目前仅提供API版本（不支持工具调用），以支持社区评估与研究。

在主流推理基准测试上，DeepSeek-V3.2-Speciale的性能表现媲美Gemini-3.0-Pro（见表1）。

更令人瞩目的是，V3.2-Speciale 模型成功斩获多项金牌：

IMO 2025（国际数学奥林匹克）
CMO 2025（中国数学奥林匹克）
ICPC World Finals 2025（国际大学生程序设计竞赛全球总决赛）
IOI 2025（国际信息学奥林匹克）

其中，ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

而DeepSeek-V3.2是首个将思考直接整合到工具使用中的模型，同时支持在思考和非思考模式下使用工具。

目前，两款模型均已开源：

· DeepSeek-V3.2

HuggingFace：https://huggingface.co/deepseek-ai/

DeepSeek-V3.2

ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

· DeepSeek-V3.2-Speciale

HuggingFace：https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

从「引擎验证」到「全能车手」

DeepSeek V3.2的进化论

如果说两个月前发布的DeepSeek-V3.2-Exp是一台在赛道上呼啸而过的「概念车」，用来向世界证明「稀疏注意力」引擎的动力潜力；

那么今天正式转正的DeepSeek V3.2，则是一辆完成了内饰精修、装配了顶级导航系统、可以随时上路解决复杂问题的「量产超跑」。

这就是DeepSeek V3.2相比于Exp版（实验版）最大的进化逻辑：核心引擎不变，但驾驶技巧（Agent能力）发生了质变。

V3.2正式版 vs. Exp

学会了「边干边想」

在架构层面，V3.2沿用了Exp版本验证成功的DSA架构，但在「软实力」上，DeepSeek解决了一个困扰AI界的顽疾——思考与行动的断裂

在V3.2-Exp时期（以及其他大多数推理模型），模型像是一个记性不好的老学究：它会先花很长时间思考，决定调用一个工具（比如搜索天气）。

但当工具把「今天是雨天」的结果扔回来时，它往往会「断片儿」，忘了刚才思考到哪一步了，不得不重新规划。

V3.2正式版引入了「思维上下文管理」。

这就像给模型装了一个「工作记忆暂存区」。

现在的V3.2像一位经验丰富的外科医生，在伸手要手术刀（调用工具）的间隙，脑子里的手术方案依然清晰连贯，拿到刀后能无缝衔接下一步操作。

为了练就这项绝活，DeepSeek甚至为V3.2搭建了一个「虚拟演练场」。

他们合成了1800多个虚拟的操作系统、代码库和浏览器环境，生成了8.5万条极其刁钻的指令，逼着V3.2在虚拟世界里反复练习「修Bug」、「查资料」、「做报表」。

正是这种高强度的特训，让V3.2正式版从一个只会做题的「做题家」，进化成了能熟练使用工具解决现实难题的「实干家」。

最大技术亮点

给注意力装上「闪电索引器」

V3.2能够同时兼顾「聪明」和「便宜」，其最大的功臣依然是那个名为稀疏注意力（DSA）的底层黑科技。

DeepSeek-V3.2的注意力架构

要理解它的牛逼之处，我们得先看看传统模型有多「笨」。

传统模型在处理长文档时，就像一个强迫症晚期的图书管理员：

为了回答你一个简单的问题，它强迫自己必须把图书馆里每一本书的每一页、每一行字都读一遍，并计算它们之间的关联。

这导致计算量随着书的厚度呈指数级爆炸（O(L^2)）。

DSA则给这位管理员配备了一套「闪电索引器」。

当问题来临时，DSA先用极低的成本扫描一遍「索引」，瞬间判断出哪几页书可能包含答案，把无关的99%的废话直接扔掉。

然后，它只对这筛选出的1%的关键内容进行精细的深度阅读。

这种「查目录」而非「死磕全书」的策略，将计算复杂度从可怕的指数级直接拉低到了近乎线性（O(L)）。

带来的显著提升

打破「不可能三角」

DSA技术的成功落地，直接击穿了AI领域的「速度、成本、智能」不可能三角。

其一，成本腰斩，长文无忧。

对于用户来说，丢给模型一本几十万字的小说或代码库，不再是「烧钱」的奢侈行为，处理速度也从「泡杯咖啡」变成了「眨眼之间」。

其二，算力盈余带来的「智力涌现」，这是最精彩的一点。

正因为DSA节省了大量算力，DeepSeek才有底气推出那个恐怖的Speciale版本。

既然读得快，那就让它想得久一点！

Speciale版本利用节省下来的资源，进行更深度的「长思考」和逻辑推演。

结果是震撼的：DeepSeek-V3.2-Speciale在数学（IMO金牌）、编程（IOI金牌）等硬核指标上，不仅超越了GPT-5 High，更是与谷歌最强的Gemini 3.0 Pro战成平手。

从验证DSA引擎潜力的V3.2-Exp，到将Agent能力、思维上下文管理、虚拟演练场训练全部装车的V3.2正式版，DeepSeek展示的是另一条通往强智能的路线：在算力紧箍咒下，用更聪明的架构、更精细的训练和更开放的生态，撬动推理极限。

DeepSeek-V3.2的横空出世，正是DeepSeek开源AI的魅力时刻：拒绝无脑烧钱Scaling，靠更聪明的算法，在算力的缝隙中开辟出通往顶峰的捷径。

参考资料：

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

超越OpenAI，中国00后团队攻破「记忆」难题！打造下一个AI互联网时刻

新智元 2026-07-15 13:59:09
33 跟贴 33
AI战争（美国篇）

虎嗅APP 2026-07-20 06:04:06
2 跟贴 2

亮相WAIC｜灵汐科技LynAInfra（灵琍）类脑超节点重磅登场，重构大模型推理新格局

智东西 2026-07-19 22:22:19
0 跟贴 0

【数智周报】孙正义：任何关于AI领域正在形成泡沫的说法都是荒谬的；苹果智能集成阿里、百度AI能力；DeepSeek估值超3500亿元

钛媒体APP 2026-07-19 14:36:28
10 跟贴 10
Groq创始人深度洞察：推理越快=模型越聪明？

机器之心Pro 2026-07-19 19:36:47
0 跟贴 0

WAIC大模型观察：不再拼参数大小，AI加速走向物理世界

雷科技 2026-07-20 01:06:33
0 跟贴 0

3步推理生成加速20+倍！CoLT教会多模态大模型用「潜思维链」思考

机器之心Pro 2026-07-15 10:08:27
0 跟贴 0
年度AI人物 | 对话曾国洋：要在虚拟与现实的边界造模型

华商韬略 2026-07-20 10:30:15
0 跟贴 0

100多万人围观！没头没腿，神似充电宝的机器人全网走红？

机器之心Pro 2026-06-17 18:52:08
0 跟贴 0
WAIC五位首席科学家交锋：多模态是LLM的“外挂”，还是下一代智能的“灵魂”？

智东西 2026-07-19 00:17:51
11 跟贴 11
人机互动的进化，Soul如何重新定义实时多模态交互丨WAIC2026

钛媒体APP 2026-07-20 13:08:08
0 跟贴 0
1.5B开源通用VLA模型，冲进具身智能第一梯队

量子位 2026-07-20 11:32:00
0 跟贴 0
2026世界人工智能大会这些硬核成果实力亮眼

极目新闻 2026-07-20 07:29:52
18 跟贴 18
宸境科技亮相WAIC：从导航到数采，补齐具身智能落地关键链路

36氪 2026-07-20 13:09:12
0 跟贴 0
此芯科技Danny Zhang：全球首款智能体专用CPU，是怎样炼成的？

智东西 2026-07-20 12:07:12
0 跟贴 0
Agent终于长出了身体：Jiuwen Symbiosis背后的思考与实践

量子位 2026-06-13 16:08:07
18 跟贴 18
视频生成模型会「推理」吗？303道题全面揭示世界模型的推理短板

机器之心Pro 2026-06-28 18:29:07
0 跟贴 0
刚刚，机器人顶会RSS三项最佳论文出炉！708篇送审，仅8篇杀入决赛

量子位 2026-07-20 12:55:54
0 跟贴 0
围观WAIC模型「读心术」！现场火火火火火

量子位 2026-07-19 19:58:29
0 跟贴 0
具身智能还在“前GPT时代”

钛媒体APP 2026-07-20 11:02:11
0 跟贴 0
让VLA更懂接触，优理奇UniTac让机器人拥有“触觉想象力”

量子位 2026-07-20 12:45:28
0 跟贴 0
一个周末，AI黑掉了AI！这剧情太科幻了

新智元 2026-07-20 12:43:35
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
王晓野：Working Agent将是下一个爆发点

量子位 2026-05-21 08:05:51
0 跟贴 0
邱锡鹏：未来我们一定会进入泛情境智能时代

量子位 2026-05-21 08:04:26
0 跟贴 0
Anthropic的AI读心术，让人类读懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0
切开Claude大脑，Anthropic称发现了一个类似人类意识的内部空间

DeepTech深科技 2026-07-07 10:20:48
0 跟贴 0
ChatGPT终于能「搜自己」！攒了近4年的对话，一键翻出

新智元 2026-07-18 18:31:39
1 跟贴 1
索尼用大量人机号鼓吹数字版游戏？知名爆料人指控

游民星空 2026-07-19 22:03:18
2 跟贴 2
美军越野车涉水测试，引擎完全淹没照样行驶

装甲铲史官 2026-04-29 11:51:27
0 跟贴 0
时代的叙事逻辑变了

朴素知道 2026-07-16 07:50:32
161 跟贴 161
早报｜曝月之暗面最快半年内上市/荣耀Robot Phone开启预约/IDC:2030年全球活跃智能体将超22亿个

爱范儿 2026-07-20 08:22:29
0 跟贴 0
趣味课堂小游戏，小朋友死记数字逻辑，呆萌回答逗乐老师

破风者手写字 2026-07-19 00:44:18
0 跟贴 0
Kimi逼得两大巨头改变定价！奥特曼罕见认错，Claude额度重置

新智元 2026-07-18 10:46:32
10 跟贴 10
西班牙夺冠之路:连克葡比法决赛胜阿根廷

人民日报 2026-07-20 07:21:54
6609 跟贴 6609
ICML 2026 | 从“事实错误”到“世界模型失配”：来自CMU、斯坦福等研究者提出大模型幻觉统一定义

机器之心Pro 2026-07-19 20:03:58
0 跟贴 0

地质学家可能发现世界上最伟大的宝藏，但有人说挖掘它太危险了

地质学家可能发现世界上最伟大的宝藏，但有人说挖掘它太危险了

三农老历

2026-07-20 00:56:12

84岁高明现状：痛失独子后，在北京定居生活，儿媳一举动让人泪目

84岁高明现状：痛失独子后，在北京定居生活，儿媳一举动让人泪目

白面书誏

2026-07-14 19:13:29

不输《斯巴达克斯》，这部史诗级美剧太生猛了

不输《斯巴达克斯》，这部史诗级美剧太生猛了

i书与房

2026-07-20 09:52:39

外媒：特朗普在伊朗“迅速找到出路希望渺茫”

外媒：特朗普在伊朗“迅速找到出路希望渺茫”

参考消息

2026-07-19 20:44:30

美军凌晨发起绝杀打击，伊朗地下导弹基地彻底瘫痪

美军凌晨发起绝杀打击，伊朗地下导弹基地彻底瘫痪

老马拉车莫少装

2026-07-17 22:26:30

“这么小就有阴德纹，不简单！”小女孩意外走红，面相学果然权威

“这么小就有阴德纹，不简单！”小女孩意外走红，面相学果然权威

妍妍教育日记

2026-07-16 12:15:15

1978年，邱清泉之子邱国渭，以蚂蚁搬家方式将全家送往美国

1978年，邱清泉之子邱国渭，以蚂蚁搬家方式将全家送往美国

老谢谈史

2026-03-20 10:24:19

外媒：特朗普公开扬言要扩大袭击目标范围，这表明他越来越沮丧，特朗普难在伊朗迅速找到出路，伊朗可能会以牙还牙

外媒：特朗普公开扬言要扩大袭击目标范围，这表明他越来越沮丧，特朗普难在伊朗迅速找到出路，伊朗可能会以牙还牙

极目新闻

2026-07-19 21:50:34

夜市当众“活春宫”！夫妻双双获刑25天，公共场合真不是你家卧室

夜市当众“活春宫”！夫妻双双获刑25天，公共场合真不是你家卧室

川渝视觉

2026-07-03 09:50:57

“蔡依林演唱会报酬”上热搜，长沙站两场总票务销售金额超7400万，蔡依林税后报酬或不足90万；举办方疑因转让演出活动经营权被处罚7万元

“蔡依林演唱会报酬”上热搜，长沙站两场总票务销售金额超7400万，蔡依林税后报酬或不足90万；举办方疑因转让演出活动经营权被处罚7万元

大风新闻

2026-07-19 15:05:14

《堡垒之夜》泳装太色被限制！玩家调侃堪比《剑星》

《堡垒之夜》泳装太色被限制！玩家调侃堪比《剑星》

3DM游戏

2026-07-20 10:36:04

追完《九个弹孔》大结局，我气得把遥控器砸了……

追完《九个弹孔》大结局，我气得把遥控器砸了……

东方不败然多多

2026-07-20 10:01:06

蒋介石临终前告诉蒋经国：我这一生只敬佩一人，畏惧两人！

蒋介石临终前告诉蒋经国：我这一生只敬佩一人，畏惧两人！

浩渺青史

2026-07-15 17:49:44

柬埔寨签约采购20架中国C909飞机

柬埔寨签约采购20架中国C909飞机

俄罗斯卫星通讯社

2026-07-19 16:20:28

周星驰新电影刷屏全网，那个曾和他十指紧扣的女人，后悔了吗？

周星驰新电影刷屏全网，那个曾和他十指紧扣的女人，后悔了吗？

晓銊就是我

2026-07-19 23:58:42

票房被偷！周星驰风波升级，向太、王晶接连下场，到底动了谁蛋糕

票房被偷！周星驰风波升级，向太、王晶接连下场，到底动了谁蛋糕

潇湘烟雨水

2026-07-20 13:11:30

婆婆一家吃饭，不留菜给儿媳：7点才下班，好吃懒做，甭想我伺候

婆婆一家吃饭，不留菜给儿媳：7点才下班，好吃懒做，甭想我伺候

清水家庭故事

2026-07-19 11:46:36

南海风波再起！菲律宾防长要求中国道歉，中方回应太解气

南海风波再起！菲律宾防长要求中国道歉，中方回应太解气

栀璃鸢年少

2026-07-20 12:41:16

4-6后，姆巴佩官宣恋情：晒26岁西班牙演员女友照片两人酒店同居

4-6后，姆巴佩官宣恋情：晒26岁西班牙演员女友照片两人酒店同居

念洲

2026-07-19 13:08:26

终于知道体制内下乡驻村和值夜班为什么很少安排女同志了，不是照顾女性，而是有风险和不方便！

终于知道体制内下乡驻村和值夜班为什么很少安排女同志了，不是照顾女性，而是有风险和不方便！

黯泉

2026-07-16 14:08:52

AI产业主平台领航智能+时代

15737文章数 66962关注度

往期回顾全部

科技要闻

中兴阶跃荣耀齐出手，AI手机争夺系统入口

头条要闻

媒体：赖清德最怕的三件事正同时发生台当局夜不能寐

头条要闻

媒体：赖清德最怕的三件事正同时发生台当局夜不能寐

体育要闻

65岁肌肉男，世界杯最年长冠军主帅

娱乐要闻

邹市明拜访丈母娘片段，卑微像长工

财经要闻

“国家队”护盘，稳市机制持续护航A股

汽车要闻

广汽本田合作延至2038年，维持对等股比

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

本地

时尚

艺术

数码

房产要闻

重磅！2026海口中小学招生计划，划片出炉！

本地新闻

十年了，为什么鬼怪CP还能让人美美嗑上？

看来看去夏天还是穿T恤最合适，不用买太贵，舒适百搭又经典

艺术要闻

砸70亿！OPPO全球总部正在“穿衣”，比效果图更震撼！

数码要闻

纯白搭配二次元！技嘉B850 AORUS ELITE-P ICE雕妹主板装机体验

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版