网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek的小更新，暴打了OpenAI，追上了Gemini。

2025-12-03 00:05:01　来源: 差评XPIN

浙江举报

0

分享至

坏消息，开源模型和闭源模型的差距越来越大了。

好消息，DeepSeek 又出手了。

12 月 1 日，DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。

前者和 GPT-5 能打的有来有回，后面的高性能版更是直接把 GPT 爆了，开始和闭源模型天花板 —— Gemini 打了个五五开。

还在IMO 2025（国际数学奥林匹克）、CMO 2025（中国数学奥林匹克）等一系列比赛中拿下金牌。

这是这家公司今年第九次发布模型，虽然大家期待的 R2 还没有来。

所以，DeepSeek 是怎么用更小的数据，更少的显卡，做出能和国际巨头来抗衡的模型？

我们翻开了他们的论文，想把这件事给大家讲清楚。

为了做到这个目标，DeepSeek 又整了不少新招：

先是把咱们的老朋友 DSA —— 稀疏注意力给转正了。

这东西在之前的 V3.2-EXP 版本里出现过，当时只是测了一下 DSA 会不会影响模型的性能，现在是真的把这玩意给放到了主力模型上。

大家平时和大模型聊天的时候会发现，你在一个对话框里聊的越多，模型就越容易胡言乱语。

甚至聊的太多了，还会直接不让你聊了。

这是因为大模型原生的注意力机制导致的问题，在这套老逻辑的影响下，每个 token 出来，都要和前面的每一个 token 互相算在一起做一次计算。

这就导致了句子增长一倍，模型的计算量就得增加到原来的四倍，如果边长到原来的三倍，计算量就变成了原来的九倍，非常麻烦。

DeepSeek 想这样不行啊，于是就给大模型里加了固定页数的目录（稀疏注意力），相当于帮模型划重点了。

而在有了目录之后，以后每次只需要计算这个 token 和这些目录的关系就行了，相当于就是看书先读目录，看完目录，对哪一章感兴趣，再去仔细看这章的内容就好。

这样一来，就能让大模型读长文的能力变的更强。

在下面这张图里可以看到，随着句子越来越长，传统的 V3.1 的推理成本是越来越高。

但是用上了稀疏注意力的 3.2 则没什么变化。。。

属于是超级省钱冠军了。

另一方面，DeepSeek 开始重视起了开源模型的后训练工作。

大模型这一套从预训练开始，到考试打分的过程，其实有点像是我们人类从小学开始，一路读书读到高考的过程。

前面的大规模预训练，相当于从小学到高二，把所有课本、练习册、卷子全过一遍，这一步大家都差不多，不管是闭源模型，还是开源模型，都在老老实实的念书。

但到了高考冲刺阶段就不一样了，在模型的后训练阶段，闭源模型一般都会请名师，猛刷题，开始搞起各种强化学习，最后让模型来考一个不错的成果。

但开源模型在这块花的心思就比较少了，按照 DeepSeek 的说法，过去的开源模型在训练后阶段计算投入普遍偏低。

这就导致这些模型可能基础能力是已经到位的了，但就是难题刷少了，结果导致考出来的成绩不太好。

于是，DeepSeek 决定这次自己也要上名师辅导班，设计了一套新的强化学习协议，在预训练结束后，花了超过总训练算力的 10% 来给模型开小灶，把之前缺的这块给补上。

同时还推出了个能思考超长时间的特殊版本 ——DeepSeek V3.2 Speciale。

这玩意的思路是这样的：

过去的大模型因为上下文长度有限制，所以在训练的时候都会做一些标注惩罚的工作，如果模型深度思考的内容太长了，那就会扣分。

而到了 DeepSeek V3.2 Speciale 这儿，所以 DeepSeek 干脆取消掉了这个扣分项，反而鼓励模型想思考多久就思考多久，想怎么思考就怎么思考。

最终，让这个全新的 DeepSeek V3.2 Speciale 成功的和前几天爆火的 Gemini 3 打的有来有回。

此外DeepSeek 还很重视模型在智能体方面能力。

一方面，为了提高模型的基础能力，DeepSeek 构建了一个虚拟环境，合成了成千上万条数据来辅助训练。

DeepSeek-V3.2 用 24667 个真实代码环境任务、50275 个真实搜索任务、4417 个合成通用 agent 场景、5908 个真实的代码解释任务做后训练。

另一方面，DeepSeek 还优化了模型使用各种工具的流程。

以前几代 DeepSeek 的一个典型毛病是：会把思考和用工具给分开。

模型一旦去调用外部工具，前面那段思考基本就算写完收工了，等工具查完结果再回来，它往往又要重新铺一遍思路。

这就导致一种很蠢的体验——哪怕只是去查一下“今天几月几号” 这种小事，模型也会从头开始重建整套推理链，非常浪费时间。。。

在 V3.2 这里，DeepSeek 忍不了了，直接把这套逻辑推翻重做。

现在的规则变成：在一整串工具调用的过程中，模型的“思考过程”会一直保留下来，只有当用户发来一条新的提问时，才会重置这一轮推理；而工具的调用记录和结果，会像聊天记录一样一直留在上下文里。

通过这修改模型架构，重视后训练，强化 Agent 能力的三板斧，DeepSeek 才终于让自己的新模型，有了能和世界顶尖开源模型再次一战的能力。

当然，即使做了这么多改进，DeepSeek 的表现也算不上完美。

但托尼最喜欢 DeepSeek 的一点，就是他们愿意承认自己的不足。

而且还会直接在论文里写出来。

比如这次论文就提到了，这次的 DeepSeek V3.2 Speciale 虽然能和谷歌的 Gemini 3 Pro 来打的五五开。

但是要回答相同的问题，DeepSeek 需要花费更多的 token。

我自己也测试了一下，从“人类的最终考试” 的题库里随便抽了道题目，同时丢给 Gemini 3 Pro 和 DeepSeek V3.2 Speciale 这两个模型。

题目是：蜂鸟类在足形目中独特地拥有双侧成对的椭圆形骨，这是一种嵌入在膨胀的十字翼腱膜的尾状骨中，嵌入压低多粒骨的尾状骨。这块籽骨支撑着多少对对腱？请用数字回答。

结果发现 Gemini 只要 4972 个 Tokens 就能把问题给答出来。

而到了 DeepSeek 这边，则用了 8077 个 Tokens 才把问题给搞明白。

光看用量的话，DeepSeek 的的 Tokens 消耗量高了快六成，确实是有不小的差距。

但是话又说回来了。

DeepSeek 虽然消耗的 token 多，但是人家价格便宜啊。。。

还是刚才那个问题，我回头仔细看了眼账单。

DeepSeek 8000 多个 tokens，花了我 0.0032 美元。

但谷歌这边，5000 个 tokens 不到，给我干掉了 0.06 刀？这块要比 DeepSeek 高了有 20 倍了。

从这个角度上来看，怎么感觉还是 DeepSeek 更香一些。。。

最后，让我们回到论文的开头。

正如 DeepSeek 所言，最近半年来，开源模型和闭源模型的差距正在不断加大。

但他们还是用自己的方式，在不断追赶这份差距。

而 DeepSeek 的各种节省算力，节约数据的操作，其实让我想到了上个月，一场关于 Ilya Sutskever 的访谈。

这位 OpenAI 曾经的灵魂人物认为，只靠一味的给模型堆参数，是没有未来的。

AlexNet只用了两块GPU。Transformer刚出现时的实验规模，大多在8～64块GPU范围内。按今天的标准看，那甚至相当于几块GPU的规模，ResNet也一样。没有哪篇论文靠庞大的集群才能完成。

比起算力的堆砌，对算法的研究也一样重要。

这正是 DeepSeek 在做的事情。

从 V2 的 MoE，到 V3 的多头潜在注意力（MLA），再到如今 DeepSeek Math V2 的自验证机制，V3.2 的稀疏注意力（DSA）。

DeepSeek 展现给我们进步，从来都不是单一的，依靠堆砌参数规模所带来的提升。

而是在想办法，如何用有限的数据，来堆积出更多的智能。

巧妇狂作无米之炊

所以，R2 什么时候来呢？

撰文：早起

编辑：江江 & 面线

美编：焕妍

图片、资料来源：DeepSeek 官网、论文

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

活久见，时代少年团给大模型上了一课

机器之心Pro 2026-05-09 12:48:20
1 跟贴 1
银河通用机器人“表演”变“上岗”，端到端大模型银河星脑有多强

量子位 2026-02-18 10:56:58
2 跟贴 2

Anthropic 5月15日拟处决Sonnet4.5！AI临终告白:我不想消失

新智元 2026-05-10 12:53:05
46 跟贴 46

具身智能来时路：谷歌RT1、2，SayCan作者Ted Xiao复盘机器人学习

机器之心Pro 2026-05-11 09:52:22
0 跟贴 0
13年不写代码，5天花200美元重建400万美元产品——YC掌门人是怎么做到的？

华尔街见闻官方 2026-05-11 10:52:07
0 跟贴 0

别卷推理了！当前大模型 STEM 短板在视觉感知，代码才是破局关键

机器之心Pro 2026-05-11 11:53:59
0 跟贴 0

别再把长文切碎了，HiLight让AI直接在原文里划重点

机器之心Pro 2026-05-11 10:39:41
0 跟贴 0
Agent的苦涩觉醒：智能正从语言走向经验

华尔街见闻官方 2026-03-02 09:43:30
8 跟贴 8

别只盯着电了，AI真正的瓶颈在这里

DeepTech深科技 2026-05-10 13:27:55
0 跟贴 0
不更新参数就能强化学习！翁家翌新范式：决策只需AI写个.py文件

量子位 2026-05-09 16:05:57
1 跟贴 1
刷屏的机器人，还困在「数据流水线」里

36氪 2026-02-11 12:00:06
0 跟贴 0
「思考用时100秒」成历史？AI推理太耗时，伯克利整了个大活儿

雷科技 2026-05-10 16:59:53
0 跟贴 0
波士顿动力发布量产版Atlas机器人新demo，展示体操级灵巧度

量子位 2026-05-08 14:48:49
0 跟贴 0
Claude Code之父：我们公司已没真人写代码了

智东西 2026-05-09 20:46:17
92 跟贴 92
亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0
大模型的魅力在于突发涌现的能力

量子位 2025-12-11 03:38:02
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
博士生如何用龙虾做知识管理？欢迎围观！

量子位 2026-03-26 23:23:30
0 跟贴 0
如何点亮小龙虾的牛马技能包?

量子位 2026-03-18 12:51:26
0 跟贴 0
陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
宝通科技拿下AniShort海外独家代理权 AIGC工具与Token出海双线突破

财联社 2026-05-11 10:48:04
0 跟贴 0
百度沈抖自曝：老忘吃药，用AI做了个小程序

量子位 2026-03-27 11:25:23
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
安心养虾！从OpenClaw 看云上AI安全落地路径

量子位 2026-04-18 19:55:39
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

量子位 2026-04-13 20:54:19
0 跟贴 0
MIT研究生用NotebookLM两天学完一学期课程

量子位 2026-03-22 10:50:49
0 跟贴 0
美图RoboNeo全新升级：首创影像创作Agent Teams

量子位 2026-05-09 17:20:20
1 跟贴 1
2500亿美元的xAI死了，但SpaceXAI的算力游戏才刚开始

钛媒体APP 2026-05-11 11:15:26
0 跟贴 0
女子指挥男子用斜坡把行李箱滑下去，没想到男子把自己也一起滑下去了

南阳日报 2026-05-10 18:54:56
215 跟贴 215
这样问DeepSeek，能「偷」到数据？

机器之心Pro 2026-05-11 11:40:03
0 跟贴 0
不用一个字，MIT团队让细胞自动机教会了大模型推理

DeepTech深科技 2026-03-23 18:28:08
0 跟贴 0
中国造"麒麟"级潜艇首艇交付巴方专家：不针对第三方

环球网资讯 2026-05-10 13:18:11
4328 跟贴 4328
大模型工程师的必修课清单

我是一个养虾人 2026-05-11 11:29:41
0 跟贴 0
游戏AI如何下棋：从Minimax到Alpha-Beta剪枝

硬核玩家2哈 2026-05-11 11:52:47
0 跟贴 0
DeepSeek和阿里谈崩了？市场人士回应；阶跃星辰将完成近25亿美元融资｜一周未来商业

每日经济新闻 2026-05-10 22:00:08
1 跟贴 1
Gemini上车：谷歌要把汽车变成移动办公室

野生运营 2026-05-10 04:41:57
0 跟贴 0

俄加强对普京的保护措施，欧洲情报机构猜测，可能与绍伊古有关

俄加强对普京的保护措施，欧洲情报机构猜测，可能与绍伊古有关

阿甘天天传

2026-05-10 23:20:20

《权游》纪录将被打破？HBO新剧要播15季

《权游》纪录将被打破？HBO新剧要播15季

娱圈观察员

2026-05-11 02:38:29

29岁中国工程师背叛马斯克，套现700万，偷走核心代码投奔死对头

29岁中国工程师背叛马斯克，套现700万，偷走核心代码投奔死对头

阿器谈史

2026-05-10 04:03:40

国务卿鲁比奥被中国拒之门外，北京宁绕弯传话也不给他开门！

国务卿鲁比奥被中国拒之门外，北京宁绕弯传话也不给他开门！

故事终将光明磊落

2026-05-10 15:02:43

认死理的商家，炸出了一个「仅退款」大省！

认死理的商家，炸出了一个「仅退款」大省！

家传编辑部

2026-05-10 20:27:14

我要被武汉大学笑死了

林中木白

2026-05-10 20:13:05

毛主席83岁给华国锋的珍贵书法，练字真的有意义吗？

毛主席83岁给华国锋的珍贵书法，练字真的有意义吗？

书画相约

2026-05-11 10:09:02

吴君如很早就说过了，陈妍希私下就是这样穿

吴君如很早就说过了，陈妍希私下就是这样穿

八卦王者

2026-05-10 13:24:46

赛前叫嚣要和国乒清算！遭横扫后22岁张本智和蔫了：离冠军仍遥远

赛前叫嚣要和国乒清算！遭横扫后22岁张本智和蔫了：离冠军仍遥远

我爱英超

2026-05-11 08:12:48

宣示与民进党强力竞争！郑丽文重话警告“台独”，吁美弃“第一岛链”

宣示与民进党强力竞争！郑丽文重话警告“台独”，吁美弃“第一岛链”

海峡导报社

2026-05-11 10:44:05

中国首款定制癌症疫苗落地！11大癌种可申请，晚期患者绝处逢生

中国首款定制癌症疫苗落地！11大癌种可申请，晚期患者绝处逢生

新时代的两性情感

2026-05-10 09:40:15

麻省理工发现：唤醒孩子自律最快的方法，竟是飞轮效应！

麻省理工发现：唤醒孩子自律最快的方法，竟是飞轮效应！

户外阿毽

2026-05-10 19:24:43

马光远：AI泡沫一定会破灭，而且一定会以非常惨烈的方式破灭！

马光远：AI泡沫一定会破灭，而且一定会以非常惨烈的方式破灭！

混沌录

2026-05-10 19:32:20

人大代表建议机关事业单位双休制调整为“大周休3天，小周休2天”

人大代表建议机关事业单位双休制调整为“大周休3天，小周休2天”

细说职场

2026-05-10 10:34:41

香港拿下世界杯转播仅1天，炸出一堆牛鬼蛇神，李嘉诚恐进退两难

香港拿下世界杯转播仅1天，炸出一堆牛鬼蛇神，李嘉诚恐进退两难

混沌录

2026-05-10 19:42:39

实锤了！俄媒公布俄军真实伤亡数字，比利时向乌克兰提供53架F16

实锤了！俄媒公布俄军真实伤亡数字，比利时向乌克兰提供53架F16

史政先锋

2026-05-10 21:05:57

摩洛哥姑娘嫁江苏农村小伙，婚礼全程开心大笑，摄影师感慨：拍了七年婚礼没见过这样的

摩洛哥姑娘嫁江苏农村小伙，婚礼全程开心大笑，摄影师感慨：拍了七年婚礼没见过这样的

可达鸭面面观

2026-05-10 13:46:52

这一次，被韩媒愤怒批评的张本智和，终究是为父母的荒唐买了单

这一次，被韩媒愤怒批评的张本智和，终究是为父母的荒唐买了单

圆梦的小老头

2026-04-23 12:00:21

是谁在偷换了世界杯转播权之争的逻辑？

是谁在偷换了世界杯转播权之争的逻辑？

鲁先生的笔

2026-05-10 21:12:47

张本智和：输球责任在我！林诗栋站球台庆祝，陈玘直言完了不能站

张本智和：输球责任在我！林诗栋站球台庆祝，陈玘直言完了不能站

排球黄金眼

2026-05-11 06:12:53

用知识和观点Debug the world！

10735文章数 489634关注度

往期回顾全部

科技要闻

黄仁勋：你们赶上了一代人一次的大机会

头条要闻

姑娘海底捞吃完饭遭多名男子殴打两颗门牙被一拳打断

头条要闻

姑娘海底捞吃完饭遭多名男子殴打两颗门牙被一拳打断

体育要闻

那个曾让詹姆斯抱头的兄弟，40岁从大学毕业了

娱乐要闻

谢霆锋没想到，王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手，谁是出海最强"水手"?

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

手机

本地

健康

公开课

教育要闻

奔赴一场英法教育之旅，遇见更好的未来

手机要闻

荣耀600系列开启全渠道预约幸运星设计实锤了

本地新闻

用苏绣的方式，打开江西婺源

干细胞能让人“返老还童”吗

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版