网易首页 > 网易号 > 正文 申请入驻

DeepSeek又上新!模型硬刚谷歌,承认开源与闭源差距拉大

0
分享至

12月1日晚,DeepSeek又上新了两款新模型,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球领先。


两款模型有着不同的定位。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。9月底DeepSeek发布了实验版V3.2-Exp,此次是正式版更新。在公开推理测试中,V3.2达到了GPT-5的水平,仅略低于谷歌的Gemini3 Pro。

DeepSeek-V3.2-Speciale则是此次的重头戏,其目标是“将开源模型的推理能力推向极致,探索模型能力的边界”。据介绍,Speciale是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力,该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力。

据DeepSeek公布的数据,Speciale在多个推理基准测试中超越谷歌最先进的Gemini3 Pro。具体来看,在美国数学邀请赛、哈佛MIT数学竞赛、国际奥林匹克数学竞赛等测试中,V3.2-Speciale都超过了Gemini3 Pro,但在编程、理工科博士生测试中略逊于谷歌。


同时,Speciale模型斩获了IMO(国际数学奥林匹克)、ICPC World Finals(国际大学生程序设计竞赛全球总决赛)及IOI(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

尽管取得了这些成就,但在技术报告中,DeepSeek承认,与Gemini3 Pro等前沿闭源模型相比,自家模型仍存在一定的局限性。首先,V3.2的世界知识广度仍落后于领先的专有模型,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能达到像Gemini3 Pro这样的模型输出质量。在解决复杂任务方面也不如前沿模型。

DeepSeek称,团队计划在未来通过增加预训练计算量来填补知识空白,并专注于优化模型推理链的智能密度以提高效率,进一步改进基础模型和训练后方案。

值得一提的是,在技术报告中,DeepSeek还谈到当前开源与闭源模型的差距在拉大。

DeepSeek表示,推理模型的发布是大模型发展的关键转折点,推动了整体性能的大幅跃升。自这一里程碑事件以来,大模型能力在快速发展。然而,过去几个月中出现了明显的分化:尽管开源圈持续取得进步,但闭源专有模型如海外谷歌、OpenAI、Anthropic的性能增长速度却显著更快。

“闭源模型与开源模型之间的性能差距并未缩小,反而日益扩大,专有系统在复杂任务中展现出越来越强的优势。”DeepSeek认为,其中有三个关键的缺陷。

一方面,在架构层面,对标准注意力机制的过度依赖严重制约了长序列处理的效率;其次,在资源分配方面,开源模型在后训练阶段的计算投入不足,限制了模型在高难度任务上的表现;最后,在AI智能体领域,开源模型在泛化能力和指令遵循能力上与专业模型相比存在明显差距,影响实际部署效果。

为了突破这些限制,DeepSeek在9月底发布实验版V3.2-Exp时,提出了稀疏注意力机制(DSA),希望大幅降低计算复杂度。在经过两个月的实验后,DeepSeek确认了稀疏注意力机制的有效性,并表示,在不牺牲长上下文性能的前提下,团队解决了关键的计算复杂性问题。

此次发布的两款模型均引入了这一机制。据DeepSeek,除了在多个推理基准测试中,V3.2的性能大幅提升外,在智能体场景中,V3.2也成为一种具有成本效益的替代方案,不仅缩小了开源模型与前沿专有模型之间的性能差距,成本也显著降低。

目前,DeepSeek的官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,但增强的Speciale版本目前仅以临时API服务形式开放,供社区评测与研究。

在海外社媒上,有网友认为,DeepSeek 此次发布是了不起的成就,“匹配 GPT-5和Gemini3 Pro的开源模型出现了,差距正式消除。”DeepSeek不断证明,严谨的工程设计可以超越单纯的参数规模。但如同DeepSeek所述的那样,我们仍需正视开源与闭源在整体性能上的差距,不断突破开源的边界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

历史龙元阁
2026-03-07 13:35:10
郑丽文刚换上中山装,不到72小时,洪秀柱直奔北京,两岸共谋统一

郑丽文刚换上中山装,不到72小时,洪秀柱直奔北京,两岸共谋统一

叹知
2026-04-19 23:26:36
欧洲人在性方面有多开放?德国再创历史!女厕所、女浴室随便进了

欧洲人在性方面有多开放?德国再创历史!女厕所、女浴室随便进了

西楼知趣杂谈
2026-03-24 14:38:30
伊朗:霍尔木兹海峡无条件过境通行,已成历史

伊朗:霍尔木兹海峡无条件过境通行,已成历史

南方都市报
2026-04-19 10:34:25
活该,设计院降薪降得领导都指挥不动员工了!

活该,设计院降薪降得领导都指挥不动员工了!

黯泉
2026-04-17 20:59:06
减肥其实很简单!每天只做这3个动作,身材会暴瘦一圈!

减肥其实很简单!每天只做这3个动作,身材会暴瘦一圈!

增肌减脂
2026-04-08 17:45:11
毛主席虽活了83岁,保健医生却说:其实毛主席不具备长寿条件

毛主席虽活了83岁,保健医生却说:其实毛主席不具备长寿条件

冰语历史
2026-03-07 00:46:39
36岁时的郑丽文与兰宣、尹乃菁合影。

36岁时的郑丽文与兰宣、尹乃菁合影。

草莓解说体育
2026-04-12 08:02:43
张曼玉现身北京参加活动!脸僵肿到不敢认,网友:怪不得不上浪姐

张曼玉现身北京参加活动!脸僵肿到不敢认,网友:怪不得不上浪姐

漫婷侃娱乐
2026-04-17 23:39:54
湖北地质系统:省城市地质工程院院长王劲松涉嫌严重违纪违法被查

湖北地质系统:省城市地质工程院院长王劲松涉嫌严重违纪违法被查

飞鹤传媒
2026-04-19 12:01:00
“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

大果小果妈妈
2026-04-02 13:16:39
美设备后门实锤,伊朗通信崩溃,华为中兴全球份额41%反超

美设备后门实锤,伊朗通信崩溃,华为中兴全球份额41%反超

圆梦的小老头
2026-04-19 16:06:02
云南鸵鸟肉案凶手被判死刑,当地曾多人购买,这些人后来怎样了

云南鸵鸟肉案凶手被判死刑,当地曾多人购买,这些人后来怎样了

林林故事揭秘
2025-01-03 17:30:21
李春平死了

李春平死了

霹雳炮
2025-11-05 22:34:23
湖人击败火箭,赛后还有5个好消息,因祸得福,东里安心休养

湖人击败火箭,赛后还有5个好消息,因祸得福,东里安心休养

领悟看世界
2026-04-20 00:47:22
中俄史上头一回:签完条约,俩国家都觉得自己亏大了!

中俄史上头一回:签完条约,俩国家都觉得自己亏大了!

乐趣纪史
2026-03-08 15:56:30
41岁仍拍三级片追求刺激?从亿万富豪再到烂片女王,她在追求什么

41岁仍拍三级片追求刺激?从亿万富豪再到烂片女王,她在追求什么

林雁飞
2026-03-13 12:53:50
去男友家他妈让我做饭:你高攀了,我:行,别回公司了另谋高就吧

去男友家他妈让我做饭:你高攀了,我:行,别回公司了另谋高就吧

今夜故事集
2024-07-10 15:54:26
家里有这7样东西,赶紧往外扔!不是迷信,是有人真出过事

家里有这7样东西,赶紧往外扔!不是迷信,是有人真出过事

Home范
2026-04-16 11:24:11
一天曝5大瓜!被抓进去、深夜泡酒吧、全身整容,赵丽颖最意外

一天曝5大瓜!被抓进去、深夜泡酒吧、全身整容,赵丽颖最意外

科学发掘
2026-04-14 17:37:31
2026-04-20 03:08:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
250769文章数 622083关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

手机
房产
健康
教育
时尚

手机要闻

8.8英寸小钢炮!REDMI K Pad 2核心配置揭晓

房产要闻

官宣签约最强城更!海口楼市,突然杀入神秘房企!

干细胞抗衰4大误区,90%的人都中招

教育要闻

655家单位、1.29万个岗位,湖南用心帮大学生找工作

装修“精神角落”,就是这么上瘾

无障碍浏览 进入关怀版