网易首页 > 网易号 > 正文 申请入驻

DeepSeek又上新!模型硬刚谷歌,承认开源与闭源差距拉大

0
分享至

12月1日晚,DeepSeek又上新了两款新模型,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球领先。


两款模型有着不同的定位。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。9月底DeepSeek发布了实验版V3.2-Exp,此次是正式版更新。在公开推理测试中,V3.2达到了GPT-5的水平,仅略低于谷歌的Gemini3 Pro。

DeepSeek-V3.2-Speciale则是此次的重头戏,其目标是“将开源模型的推理能力推向极致,探索模型能力的边界”。据介绍,Speciale是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力,该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力。

据DeepSeek公布的数据,Speciale在多个推理基准测试中超越谷歌最先进的Gemini3 Pro。具体来看,在美国数学邀请赛、哈佛MIT数学竞赛、国际奥林匹克数学竞赛等测试中,V3.2-Speciale都超过了Gemini3 Pro,但在编程、理工科博士生测试中略逊于谷歌。


同时,Speciale模型斩获了IMO(国际数学奥林匹克)、ICPC World Finals(国际大学生程序设计竞赛全球总决赛)及IOI(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

尽管取得了这些成就,但在技术报告中,DeepSeek承认,与Gemini3 Pro等前沿闭源模型相比,自家模型仍存在一定的局限性。首先,V3.2的世界知识广度仍落后于领先的专有模型,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能达到像Gemini3 Pro这样的模型输出质量。在解决复杂任务方面也不如前沿模型。

DeepSeek称,团队计划在未来通过增加预训练计算量来填补知识空白,并专注于优化模型推理链的智能密度以提高效率,进一步改进基础模型和训练后方案。

值得一提的是,在技术报告中,DeepSeek还谈到当前开源与闭源模型的差距在拉大。

DeepSeek表示,推理模型的发布是大模型发展的关键转折点,推动了整体性能的大幅跃升。自这一里程碑事件以来,大模型能力在快速发展。然而,过去几个月中出现了明显的分化:尽管开源圈持续取得进步,但闭源专有模型如海外谷歌、OpenAI、Anthropic的性能增长速度却显著更快。

“闭源模型与开源模型之间的性能差距并未缩小,反而日益扩大,专有系统在复杂任务中展现出越来越强的优势。”DeepSeek认为,其中有三个关键的缺陷。

一方面,在架构层面,对标准注意力机制的过度依赖严重制约了长序列处理的效率;其次,在资源分配方面,开源模型在后训练阶段的计算投入不足,限制了模型在高难度任务上的表现;最后,在AI智能体领域,开源模型在泛化能力和指令遵循能力上与专业模型相比存在明显差距,影响实际部署效果。

为了突破这些限制,DeepSeek在9月底发布实验版V3.2-Exp时,提出了稀疏注意力机制(DSA),希望大幅降低计算复杂度。在经过两个月的实验后,DeepSeek确认了稀疏注意力机制的有效性,并表示,在不牺牲长上下文性能的前提下,团队解决了关键的计算复杂性问题。

此次发布的两款模型均引入了这一机制。据DeepSeek,除了在多个推理基准测试中,V3.2的性能大幅提升外,在智能体场景中,V3.2也成为一种具有成本效益的替代方案,不仅缩小了开源模型与前沿专有模型之间的性能差距,成本也显著降低。

目前,DeepSeek的官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,但增强的Speciale版本目前仅以临时API服务形式开放,供社区评测与研究。

在海外社媒上,有网友认为,DeepSeek 此次发布是了不起的成就,“匹配 GPT-5和Gemini3 Pro的开源模型出现了,差距正式消除。”DeepSeek不断证明,严谨的工程设计可以超越单纯的参数规模。但如同DeepSeek所述的那样,我们仍需正视开源与闭源在整体性能上的差距,不断突破开源的边界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
和特斯拉硬刚?小米YU7全系推出7年低息购车:首付4.99万元起,月供2593元起

和特斯拉硬刚?小米YU7全系推出7年低息购车:首付4.99万元起,月供2593元起

每日经济新闻
2026-01-15 21:04:07
闫学晶风波后首现身!手插兜满脸不屑,老公叉腰很无奈,噩耗连连

闫学晶风波后首现身!手插兜满脸不屑,老公叉腰很无奈,噩耗连连

李健政观察
2026-01-16 10:26:16
中国向全世界曝光:美国4400颗卫星,围堵中国空间站,这是要干啥

中国向全世界曝光:美国4400颗卫星,围堵中国空间站,这是要干啥

阿纂看事
2026-01-15 20:18:36
68票赞成32票反对!美投票结果公布,特朗普开始下令,英法德出兵

68票赞成32票反对!美投票结果公布,特朗普开始下令,英法德出兵

蛙斯基娱乐中
2026-01-16 15:32:10
罗永浩回应西贝闭店!内容犀利无比,评论区清一色的力挺

罗永浩回应西贝闭店!内容犀利无比,评论区清一色的力挺

谈史论天地
2026-01-16 15:46:39
永不失业的3个行业,一定要尽早告诉孩子,少走弯路

永不失业的3个行业,一定要尽早告诉孩子,少走弯路

李舟
2026-01-15 18:39:03
乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

博览历史
2025-12-29 19:26:45
好友见证贺娇龙从苦孩子成长为“推介官”,多人已赶赴昭苏送她最后一程,有摄影师缺席她最后一次拍摄遗憾自责

好友见证贺娇龙从苦孩子成长为“推介官”,多人已赶赴昭苏送她最后一程,有摄影师缺席她最后一次拍摄遗憾自责

极目新闻
2026-01-15 17:46:12
浙大美女张燕飞去德国学汉学,回中国当博导……

浙大美女张燕飞去德国学汉学,回中国当博导……

吃瓜体
2026-01-13 17:05:24
雷军直播再谈“反小字营销”!新一代小米SU7更多细节披露!YU7“效仿”特斯拉推“7年低息”购车政策

雷军直播再谈“反小字营销”!新一代小米SU7更多细节披露!YU7“效仿”特斯拉推“7年低息”购车政策

每日经济新闻
2026-01-16 00:05:20
36万亿美债压顶,中国拒不接盘!特朗普决定“弄死”大债主!

36万亿美债压顶,中国拒不接盘!特朗普决定“弄死”大债主!

毒sir财经
2025-10-12 20:07:17
秦基伟对毛主席说道,美军具备三个长处,也有着三个不足

秦基伟对毛主席说道,美军具备三个长处,也有着三个不足

史海孤雁
2026-01-15 21:40:13
去了趟“穷地方”苏北,我反被自己「穷笑了」

去了趟“穷地方”苏北,我反被自己「穷笑了」

风味人间
2026-01-15 14:09:31
湖人117-135黄蜂4坏消息!防守资源+雷迪克布置拉胯,替补没能力

湖人117-135黄蜂4坏消息!防守资源+雷迪克布置拉胯,替补没能力

篮球资讯达人
2026-01-16 14:31:21
又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

议纪史
2026-01-14 10:40:09
医生提醒:高血压患者出门时,口袋一定要装3样东西,关键能救命

医生提醒:高血压患者出门时,口袋一定要装3样东西,关键能救命

王二哥老搞笑
2026-01-14 09:32:42
我在坐月子,我妈竟打电话叫我老公回去,出3万给未来弟媳买三金

我在坐月子,我妈竟打电话叫我老公回去,出3万给未来弟媳买三金

我是三月鱼H
2026-01-14 17:17:27
执掌皇马23年!78岁佛爷或被迫离任:纵容熊皇胡闹 20年旧事重演

执掌皇马23年!78岁佛爷或被迫离任:纵容熊皇胡闹 20年旧事重演

风过乡
2026-01-16 07:43:33
国羽最新战报!王祉怡2-1逆转,NO.1险翻车,陈雨菲德比战轰21-8

国羽最新战报!王祉怡2-1逆转,NO.1险翻车,陈雨菲德比战轰21-8

刘姚尧的文字城堡
2026-01-16 15:13:31
金立群卸任亚投行行长

金立群卸任亚投行行长

三湘都市报
2026-01-16 00:35:37
2026-01-16 17:08:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
241585文章数 621212关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

教育
亲子
房产
本地
公开课

教育要闻

期末辅导就用夸夸辅导法,辅导作业不再鸡飞狗跳

亲子要闻

Is he a magician or just a genius dad?

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版