网易首页 > 网易号 > 正文 申请入驻

OpenAI危!DeepSeek放大招:追平谷歌最强,手撕GPT-5 High

0
分享至


新智元报道

编辑:艾伦 KingHZ

【新智元导读】「开源之神」DeepSeek重磅发布V3.2正式版,性能全面超越GPT-5 High,与谷歌Gemini-3.0 Pro平分秋色。新模型不仅斩获4项国际奥赛金牌级成绩,更凭借独创的DSA稀疏注意力架构,打破「速度、成本、智能」的不可能三角。

OpenAI这次真的要慌了!

就在刚刚,「源神」DeepSeek开源了DeepSeek-V3.2正式版——

在数学编程等多项推理基准上,全面超越GPT-5 High,优于Claude 4.5 Sonet;

与刷屏的Gemini 3.0 Pro相比,则难分伯仲,不相上下!


表1:DeepSeek-V3.2与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗Tokens估计总量)

在今年,DeepSeek此前已发布7款模型——「开源之神」,当之无愧:

DeepSeek‑R1、DeepSeek‑R1‑Zero

DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp

DeepSeek‑OCR、DeepSeek‑Math-V2

出手即王炸

开源4项奥赛金牌级AI

全新模型DeepSeek-V3.2,出手即王炸。

DeepSeek正式发布DeepSeek-V3.2与DeepSeek-V3.2-Speciale——专为智能体打造的推理优先模型!

  • DeepSeek-V3.2:V3.2-Exp的官方迭代版本,现已登陆App、网页端及API;

  • DeepSeek-V3.2-Speciale:突破推理能力边界,目前仅通过API提供服务。


两款模型均达到世界级推理性能 :

  • V3.2:推理能力与文本长度兼顾,拥有GPT-5级别性能,适合日常驱动;

  • V3.2-Speciale:极致推理能力,取得了4项金牌级成绩;目前仅提供API版本(不支持工具调用),以支持社区评估与研究。

在主流推理基准测试上,DeepSeek-V3.2-Speciale的性能表现媲美Gemini-3.0-Pro(见表1)。

更令人瞩目的是,V3.2-Speciale 模型成功斩获多项金牌:

  • IMO 2025(国际数学奥林匹克)

  • CMO 2025(中国数学奥林匹克)

  • ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)

  • IOI 2025(国际信息学奥林匹克)

其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

而DeepSeek-V3.2是首个将思考直接整合到工具使用中的模型,同时支持在思考和非思考模式下使用工具。

目前,两款模型均已开源:

· DeepSeek-V3.2

HuggingFace:https://huggingface.co/deepseek-ai/

DeepSeek-V3.2

ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

· DeepSeek-V3.2-Speciale

HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

从「引擎验证」到「全能车手」

DeepSeek V3.2的进化论

如果说两个月前发布的DeepSeek-V3.2-Exp是一台在赛道上呼啸而过的「概念车」,用来向世界证明「稀疏注意力」引擎的动力潜力;

那么今天正式转正的DeepSeek V3.2,则是一辆完成了内饰精修、装配了顶级导航系统、可以随时上路解决复杂问题的「量产超跑」。

这就是DeepSeek V3.2相比于Exp版(实验版)最大的进化逻辑:核心引擎不变,但驾驶技巧(Agent能力)发生了质变。


V3.2正式版 vs. Exp

学会了「边干边想」

在架构层面,V3.2沿用了Exp版本验证成功的DSA架构,但在「软实力」上,DeepSeek解决了一个困扰AI界的顽疾——思考与行动的断裂

在V3.2-Exp时期(以及其他大多数推理模型),模型像是一个记性不好的老学究:它会先花很长时间思考,决定调用一个工具(比如搜索天气)。

但当工具把「今天是雨天」的结果扔回来时,它往往会「断片儿」,忘了刚才思考到哪一步了,不得不重新规划。

V3.2正式版引入了「思维上下文管理」。


这就像给模型装了一个「工作记忆暂存区」。

现在的V3.2像一位经验丰富的外科医生,在伸手要手术刀(调用工具)的间隙,脑子里的手术方案依然清晰连贯,拿到刀后能无缝衔接下一步操作。

为了练就这项绝活,DeepSeek甚至为V3.2搭建了一个「虚拟演练场」。

他们合成了1800多个虚拟的操作系统、代码库和浏览器环境,生成了8.5万条极其刁钻的指令,逼着V3.2在虚拟世界里反复练习「修Bug」、「查资料」、「做报表」。

正是这种高强度的特训,让V3.2正式版从一个只会做题的「做题家」,进化成了能熟练使用工具解决现实难题的「实干家」。

最大技术亮点

给注意力装上「闪电索引器」

V3.2能够同时兼顾「聪明」和「便宜」,其最大的功臣依然是那个名为稀疏注意力(DSA)的底层黑科技。


DeepSeek-V3.2的注意力架构

要理解它的牛逼之处,我们得先看看传统模型有多「笨」。

传统模型在处理长文档时,就像一个强迫症晚期的图书管理员:

为了回答你一个简单的问题,它强迫自己必须把图书馆里每一本书的每一页、每一行字都读一遍,并计算它们之间的关联。

这导致计算量随着书的厚度呈指数级爆炸(O(L^2))。

DSA则给这位管理员配备了一套「闪电索引器」。

当问题来临时,DSA先用极低的成本扫描一遍「索引」,瞬间判断出哪几页书可能包含答案,把无关的99%的废话直接扔掉。

然后,它只对这筛选出的1%的关键内容进行精细的深度阅读。

这种「查目录」而非「死磕全书」的策略,将计算复杂度从可怕的指数级直接拉低到了近乎线性(O(L))。

带来的显著提升

打破「不可能三角」

DSA技术的成功落地,直接击穿了AI领域的「速度、成本、智能」不可能三角。


其一,成本腰斩,长文无忧。

对于用户来说,丢给模型一本几十万字的小说或代码库,不再是「烧钱」的奢侈行为,处理速度也从「泡杯咖啡」变成了「眨眼之间」。

其二,算力盈余带来的「智力涌现」,这是最精彩的一点。

正因为DSA节省了大量算力,DeepSeek才有底气推出那个恐怖的Speciale版本。

既然读得快,那就让它想得久一点!

Speciale版本利用节省下来的资源,进行更深度的「长思考」和逻辑推演。

结果是震撼的:DeepSeek-V3.2-Speciale在数学(IMO金牌)、编程(IOI金牌)等硬核指标上,不仅超越了GPT-5 High,更是与谷歌最强的Gemini 3.0 Pro战成平手。


从验证DSA引擎潜力的V3.2-Exp,到将Agent能力、思维上下文管理、虚拟演练场训练全部装车的V3.2正式版,DeepSeek展示的是另一条通往强智能的路线:在算力紧箍咒下,用更聪明的架构、更精细的训练和更开放的生态,撬动推理极限。

DeepSeek-V3.2的横空出世,正是DeepSeek开源AI的魅力时刻:拒绝无脑烧钱Scaling,靠更聪明的算法,在算力的缝隙中开辟出通往顶峰的捷径。

参考资料:

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男单4强出炉!国乒2人晋级9人被淘汰,非主力迎战2位世界冠军

男单4强出炉!国乒2人晋级9人被淘汰,非主力迎战2位世界冠军

全言作品
2026-01-18 01:08:14
索尼正准备 “革命性” 发布,或震撼行业?

索尼正准备 “革命性” 发布,或震撼行业?

相机Beta
2026-01-16 20:29:13
原创 |加总理访华,干了3件让特朗普心痛的大事!

原创 |加总理访华,干了3件让特朗普心痛的大事!

占豪
2026-01-17 23:42:53
报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

皮蛋儿电影
2026-01-16 22:51:50
中国4-2乌兹别克斯坦,安东尼奥赛后发言指不公平

中国4-2乌兹别克斯坦,安东尼奥赛后发言指不公平

赵或是个热血青年
2026-01-18 01:59:08
江西一狱警被蒙面男子当街捅死,凶手:你知道这6年我怎么过的吗

江西一狱警被蒙面男子当街捅死,凶手:你知道这6年我怎么过的吗

万年历史老号
2026-01-15 01:55:52
“西贝人心声”账号内容已不可见,该账号发帖1小时后,账号涨粉近8000

“西贝人心声”账号内容已不可见,该账号发帖1小时后,账号涨粉近8000

潇湘晨报
2026-01-17 08:57:14
0-17落后,单杆69分逆转!吴宜泽被罚4分仍赢球,2-2追平世界第2

0-17落后,单杆69分逆转!吴宜泽被罚4分仍赢球,2-2追平世界第2

刘姚尧的文字城堡
2026-01-18 04:57:30
美女白色露脐T恤配蓝色瑜伽裤,性感值拉满,简直是行走的 荷尔蒙

美女白色露脐T恤配蓝色瑜伽裤,性感值拉满,简直是行走的 荷尔蒙

小乔古装汉服
2025-09-24 07:20:03
新疆31岁舞蹈老师万小艳去世,从确诊到离世仅2个月,丈夫为救治妻子,毅然卖房卖车,倾尽所有仍未留住爱人,坦言不后悔

新疆31岁舞蹈老师万小艳去世,从确诊到离世仅2个月,丈夫为救治妻子,毅然卖房卖车,倾尽所有仍未留住爱人,坦言不后悔

扬子晚报
2026-01-17 20:54:20
秋瓷炫:我这辈子最正确的决定,就是39岁高龄为中国籍小丈夫生子

秋瓷炫:我这辈子最正确的决定,就是39岁高龄为中国籍小丈夫生子

八斗小先生
2026-01-15 09:59:08
郭晶晶换发型后判若两人?卡地亚晚宴上,宋佳那英同台献唱

郭晶晶换发型后判若两人?卡地亚晚宴上,宋佳那英同台献唱

青橘罐头
2026-01-17 19:36:32
不出所料!委代总统通告了全球:邀美国共治,我们都被耍了?

不出所料!委代总统通告了全球:邀美国共治,我们都被耍了?

近史博览
2026-01-18 01:28:31
正式退赛,周琦医院就诊,冲突曝光,情绪激动想打人,名帅回应

正式退赛,周琦医院就诊,冲突曝光,情绪激动想打人,名帅回应

乐聊球
2026-01-17 09:29:08
这一夜,全程笑脸、穿泡泡衫的孙俪,让所有人见识了她的江湖地位

这一夜,全程笑脸、穿泡泡衫的孙俪,让所有人见识了她的江湖地位

白宸侃片
2026-01-17 03:10:54
女子连续五天发视频向“出轨丈夫”道歉,粉丝已超40万,当地相关部门工作人员最新回应:已有工作组在调查核实

女子连续五天发视频向“出轨丈夫”道歉,粉丝已超40万,当地相关部门工作人员最新回应:已有工作组在调查核实

极目新闻
2026-01-16 23:19:02
“油耗子”越南付出代价,盗挖中国石油数十年,最终付出惨痛代价

“油耗子”越南付出代价,盗挖中国石油数十年,最终付出惨痛代价

阿坹武器装备科普
2026-01-17 14:31:40
梅派后人也没想到,李玉刚竟在贺娇龙去世后,因一个举动口碑逆转

梅派后人也没想到,李玉刚竟在贺娇龙去世后,因一个举动口碑逆转

阿纂看事
2026-01-16 18:26:33
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

阿纂看事
2026-01-09 09:48:35
戴奇谈手球:如果这也要判点球,那干脆就取消足球比赛算了

戴奇谈手球:如果这也要判点球,那干脆就取消足球比赛算了

懂球帝
2026-01-18 04:25:07
2026-01-18 05:40:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14352文章数 66509关注度
往期回顾 全部

科技要闻

两枚火箭发射失利,具体原因正排查

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

时尚
亲子
教育
游戏
公开课

“这个风格”今年冬天又火了!谁穿谁高级

亲子要闻

欢迎小小的新人类-卜卜

教育要闻

医院招考重考的背后

这下好了,英伦侦探风也给老钟玩懂了"/> 主站 商城 论坛 自运营 登录 注册 这下好了,英伦侦探风也给老钟玩懂了 廉颇 2026-01-17 返回专栏...

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版