网易首页 > 网易号 > 正文 申请入驻

重磅!DeepSeek V3.2 特别版发布:性能超越GPT-5,硬刚Gemini 3.0「IOI/IMO金牌」

0
分享至


↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新

DeepSeek-V3.2系列模型正式上线

作为“为Agent构建的推理优先模型”,DeepSeek-V3.2包含两个版本:

DeepSeek-V3.2:V3.2-Exp的官方继任者,平衡了推理能力与生成长度,性能对标GPT-5,现已上线App、Web端及API

DeepSeek-V3.2-Speciale:专攻深度推理能力的极限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前仅通过API提供


技术报告显示,DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)、ICPC世界总决赛及CMO中均取得了金牌级成绩


官方已公开上述竞赛的最终提交结果,社区可通过assets/olympiad_cases进行二次验证


技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf


以下是详细信息

核心能力与技术突破

DeepSeek-V3.2基于三大技术突破,实现了高计算效率与卓越推理、Agent性能的统一:

1.DeepSeek Sparse Attention (DSA):引入高效注意力机制,大幅降低计算复杂度,并针对长上下文场景进行了优化

2.可扩展强化学习框架:通过稳健的RL协议与后训练(post-training)算力扩展,实现了高性能表现

3.大规模Agent任务合成管线:涵盖1800+环境及8.5万+复杂指令

这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力,更让DeepSeek-V3.2将“思考”直接整合进工具使用(Tool-Use)的模型,同时支持在思考和非思考模式下使用工具


API更新与Speciale版限制

DeepSeek-V3.2

API使用模式与V3.2-Exp保持一致,作为日常主力模型(Daily Driver),提供GPT-5级别的性能

DeepSeek-V3.2-Speciale

该版本专为解决复杂任务设计,消耗更多Token,目前仅作为API提供,具体限制如下:

临时端点:需使用

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

服务期限:该端点服务至2025年12月15日 15:59 (UTC) 截止

功能限制:不支持工具调用(Tool Calls),仅用于支持社区评估与研究。

定价:与DeepSeek-V3.2保持一致

聊天模板重大调整

DeepSeek-V3.2不再提供Jinja格式模板,并引入了“带工具思考”及新角色设定。

Python脚本编码:官方提供了encoding文件夹,包含Python脚本(encoding_dsv32.py),用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出

Developer角色:模板新增developer角色,专门用于搜索Agent场景,官方API不接受分配给该角色的消息

输出解析注意:提供的解析函数仅处理格式良好的字符串,生产环境需自行增加稳健的错误处理机制。

代码示例如下:

                                                                    import transformers
from encoding_dsv32 import encode_messages


tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
# 思考模式配置
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
本地部署建议

模型结构与DeepSeek-V3.2-Exp相同。

采样参数:建议设置 temperature = 1.0,top_p = 0.95。

Speciale版提示:本地部署Speciale版本时,同样不支持工具调用功能

开源与协议

仓库及模型权重均采用 MIT License 授权。

--end--

最后记得⭐️我,这对我非常重要,每天都在更新:

欢迎点赞转发推荐评论,别忘了关注我

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国工商银行内部审计局天津分局副局长陈兵接受审查调查

中国工商银行内部审计局天津分局副局长陈兵接受审查调查

界面新闻
2026-03-20 17:06:16
山姆"断货王"冲上热搜!不少人吃错了!网友:我刚吃完......

山姆"断货王"冲上热搜!不少人吃错了!网友:我刚吃完......

沈阳生活圈i
2026-03-18 13:17:53
郑则仕辟谣“跑步9个月减重70斤”:四五年的时间慢慢减下来的

郑则仕辟谣“跑步9个月减重70斤”:四五年的时间慢慢减下来的

韩小娱
2026-03-20 10:44:39
看到这个文件,在职的你怕不怕?

看到这个文件,在职的你怕不怕?

中国民航人
2026-03-19 20:52:46
你威胁开战,我就以战争相回应!你想毁灭中国,中国就先毁灭你!

你威胁开战,我就以战争相回应!你想毁灭中国,中国就先毁灭你!

安安说
2026-03-20 11:13:04
男性长期禁欲,精子只产不排,最后会怎样?医生:或有4大后果

男性长期禁欲,精子只产不排,最后会怎样?医生:或有4大后果

健康之光
2026-03-06 13:11:59
美记者怒怼北约秘书长:中国40年没动一枪,你们却炸烂半个地球

美记者怒怼北约秘书长:中国40年没动一枪,你们却炸烂半个地球

安安说
2026-03-20 11:01:01
馒头又立功!主治医师:馒头冷冻再加热,抗性淀粉增加减肥又健康

馒头又立功!主治医师:馒头冷冻再加热,抗性淀粉增加减肥又健康

健康之光
2026-03-18 08:55:31
六国发表联合声明:准备采取措施保障霍尔木兹海峡安全

六国发表联合声明:准备采取措施保障霍尔木兹海峡安全

新京报
2026-03-20 07:22:13
已明确!2026年养老金确定上涨,涨幅控制在3.2%——3.8%,看看有你吗?

已明确!2026年养老金确定上涨,涨幅控制在3.2%——3.8%,看看有你吗?

CG说科技
2026-03-20 12:28:24
金价暴跌一夜:有人爆仓消失,大妈淡定买金,谁才是真赢家

金价暴跌一夜:有人爆仓消失,大妈淡定买金,谁才是真赢家

时尚的弄潮
2026-03-20 18:37:09
埃尔多安发现不对劲,一旦伊朗完了,土耳其就是下一个伊朗?

埃尔多安发现不对劲,一旦伊朗完了,土耳其就是下一个伊朗?

轩逸阿II
2026-03-18 09:09:29
省公安厅刑事侦查总队政委,被纪委带走

省公安厅刑事侦查总队政委,被纪委带走

法律读品
2026-03-20 15:53:32
以色列致命死穴曝光!一旦这里被摧毁,便可覆灭以色列全境

以色列致命死穴曝光!一旦这里被摧毁,便可覆灭以色列全境

纪中百大事
2026-03-19 09:59:24
全球最惨男子,眼睁睁看着自己“融化”

全球最惨男子,眼睁睁看着自己“融化”

郁郁乎文
2025-08-28 20:39:07
背靠背100分,独行侠追悔莫及!盘点NBA历史上那些自废武功大交易

背靠背100分,独行侠追悔莫及!盘点NBA历史上那些自废武功大交易

月下小生2018
2026-03-20 18:52:08
书法对决!王洪文江青的字竟比颜真卿差那么多?

书法对决!王洪文江青的字竟比颜真卿差那么多?

书画相约
2026-03-17 08:44:28
中国外交部:日本首相高市早苗涉台谬论公然干涉中国内政

中国外交部:日本首相高市早苗涉台谬论公然干涉中国内政

俄罗斯卫星通讯社
2026-03-20 15:08:59
伊朗伊斯兰革命卫队:军队正处于高度戒备状态,渴望在实战中给予美军舰沉重一击,美声称已摧毁伊朗海军是撒谎

伊朗伊斯兰革命卫队:军队正处于高度戒备状态,渴望在实战中给予美军舰沉重一击,美声称已摧毁伊朗海军是撒谎

大象新闻
2026-03-20 16:36:06
人过七十,无论关系有多好,这4种人都别来往了,代价太大

人过七十,无论关系有多好,这4种人都别来往了,代价太大

温暖心语
2026-03-19 17:10:03
2026-03-20 19:52:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

新SU7只涨4千!雷军:真怕交车慢挨骂

头条要闻

美财长称美方可能对在途伊朗石油解除制裁 外交部回应

头条要闻

美财长称美方可能对在途伊朗石油解除制裁 外交部回应

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

金融法草案向社会公开征求意见

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

手机
数码
亲子
艺术
家居

手机要闻

用iPhone 17 Pro Max拍摄竖屏武侠功夫短片,苹果CEO库克探班

数码要闻

一加 15T 「松弛抹茶」随手拍

亲子要闻

萌娃昨晚梦到什么了?听完她的讲述,妈妈笑崩了

艺术要闻

吴昌硕『圆扇花卉』清新俊逸

家居要闻

时空交织 空间绮梦

无障碍浏览 进入关怀版