网易首页 > 网易号 > 正文 申请入驻

三周年炸场:DeepSeek双模型反差感强,无需特殊训练

0
分享至



哈喽,大家好,今天小墨就带大家分析国产大模型的硬核逆袭 ,DeepSeek-V3.2 系列开源直接对标 Gemini-3.0-Pro,拿满国际竞赛金牌还把推理成本砍半。

ChatGPT 发布三周年之际,全球 AI 赛道迎来关键转折点。当闭源模型还在算力军备竞赛中比拼参数规模时,中国团队 DeepSeek 突然抛出两颗 “重磅炸弹”。





双模型精准卡位,竞赛成绩刷新开源天花板

DeepSeek 此次发布的两款模型形成明确分工。

标准版 V3.2 聚焦 “平衡实用”,在日常问答、通用 Agent 任务和工具调用场景中表现亮眼,其推理能力达到 GPT-5 级别,仅小幅落后于 Gemini-3.0-Pro,且输出长度较同类模型大幅缩短,显著降低用户等待时间与计算开销。



更值得关注的是,该模型在未针对测试集特殊训练的情况下,拿下当前开源模型 Agent 评测的最高分数,在 SWE-Verified 代码任务中实现 73.1% 的解决率,Terminal Bench 2.0 准确率达 46.4%,大幅超越现有开源模型。

增强版 Speciale 则剑指 “极致推理”,融合 DeepSeek-Math-V2 的定理证明能力后,一举斩获 IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025 四项国际顶级竞赛金牌,其中 ICPC 成绩跻身人类选手第二名,IOI 排名第十,成为首个在编程与数学竞赛中比肩顶尖人类选手的开源模型。



不过官方特别提醒,该版本专注科研场景,未优化日常对话,且 Token 消耗与使用成本显著高于标准版,目前仅开放临时 API 供研究使用。



成本效率实现颠覆性突破

支撑此次性能飞跃的核心,是 DeepSeek 独创的 DSA(DeepSeek Sparse Attention)稀疏注意力机制。

传统注意力机制处理长序列时计算复杂度为 O (L²),严重制约部署效率,而 DSA 通过 “闪电索引器” 与 “细粒度 token 选择” 双组件。



将复杂度降至 O (L・k)(k 远小于 L),在 128k 长序列任务中,推理成本较上一代 V3.1-Terminus 大幅降低 ,H800 集群测试显示,预填充阶段每百万 token 成本从 0.7 美元降至 0.2 美元,解码阶段从 2.4 美元降至 0.8 美元。

更关键的是,该技术实现了 “降本不降价”,支持 FP8 精度与 MLA 架构,适配昇腾 Atlas 800 A2 等国产芯片,通过结构化剪枝与混合量化策略,可在精度损失小于 1% 的前提下将参数量压缩 40%,算力利用率提升 200%。

这种架构创新让 DeepSeek 走出了一条区别于 “算力堆料” 的技术路线,其训练成本仅为 Meta Llama-3 的 1/11,却实现了相当的性能表现。





破解开源模型泛化难题

DeepSeek 在强化学习(RL)领域的投入同样打破行业常规 ,将训练后阶段的计算预算提升至预训练成本的 10%,这在开源模型中极为罕见。

团队基于 GRPO 算法优化出无偏 KL 估计、离线序列掩码等技术,解决了大规模 RL 训练的稳定性问题,同时通过 “专家蒸馏” 策略,让模型吸收数学、编程、Agent 任务等 6 大领域的专项能力。



为提升 Agent 泛化能力,DeepSeek 构建了全球领先的自动环境合成管线,生成 1827 个任务导向环境与 85000 个复杂提示,涵盖旅行规划、软件开发等真实场景,其中代码 Agent 从 GitHub 挖掘数百万 issue-PR 对,搭建了多语言可执行测试环境,搜索 Agent 则通过多智能体协作生成高质量长尾数据。

这种 “难解易验” 的训练模式,让 V3.2 在未见过的 Agent 场景中仍能保持高性能,大幅缩小了开源与闭源模型的差距。



开源社区认可度持续攀升

目前 DeepSeek-V3.2 已全面登陆官方 App、Web 端与小程序,API 调用成本降低 50% 以上,而 Speciale 版本开放临时 API 供科研使用。



作为首个登上 Nature 封面的中国大模型,DeepSeek 的开源生态已形成规模效应,GitHub 星数超越同类模型,R1 版本曾创下 7 天用户破 1 亿的纪录,较 ChatGPT 达成同等规模快 53 天。

更重要的是,其推出的大模型一体机已覆盖 1.5B 至 671B 全尺寸模型,从边缘端到云端实现国产化算力解决方案落地。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昔日割据称王,今日跪求祖国!真主党穷途末路,是自己埋下的死局

昔日割据称王,今日跪求祖国!真主党穷途末路,是自己埋下的死局

民间胡扯老哥
2026-04-16 07:13:02
男子办婚礼未领证,后发现女方疑与他人暧昧,起诉退彩礼购房款才知她有婚史,法院调解退39万元,当事人:将追责女方骗婚

男子办婚礼未领证,后发现女方疑与他人暧昧,起诉退彩礼购房款才知她有婚史,法院调解退39万元,当事人:将追责女方骗婚

极目新闻
2026-04-16 21:58:30
散步半个小时错了?医生提醒:过了60岁,散步要尽量做到这6点!

散步半个小时错了?医生提醒:过了60岁,散步要尽量做到这6点!

医学科普汇
2026-04-16 21:25:05
你何曾见过如此精致的女人,太干净了

你何曾见过如此精致的女人,太干净了

可乐谈情感
2026-04-17 01:16:02
当执法者将国家法律摔在地上,请先别讨论摩托能否上高速和张雪了

当执法者将国家法律摔在地上,请先别讨论摩托能否上高速和张雪了

阿陆
2026-04-16 14:52:08
许家印认罪不到24小时,过往被扒,倒霉的有3个女人

许家印认罪不到24小时,过往被扒,倒霉的有3个女人

君笙的拂兮
2026-04-16 05:12:16
不可思议!蒙古国三百万人去年生了8万,内蒙两千多万人才生了10万

不可思议!蒙古国三百万人去年生了8万,内蒙两千多万人才生了10万

西游日记
2026-04-16 20:53:41
5月1日起全国严查!以前的“小事”现在可能坐牢,抓紧了解一下!

5月1日起全国严查!以前的“小事”现在可能坐牢,抓紧了解一下!

老特有话说
2026-04-16 14:59:37
网盘禁止传播海外影视资源引热议 大量链接失效

网盘禁止传播海外影视资源引热议 大量链接失效

3DM游戏
2026-04-16 18:24:04
豆包最实用的10个AI功能,强烈建议收藏!

豆包最实用的10个AI功能,强烈建议收藏!

秋叶PPT
2026-04-15 18:58:59
巴基斯坦代表抵达,伊朗“压箱底”战机升空迎接!穆尼尔穿梭斡旋背负双重使命

巴基斯坦代表抵达,伊朗“压箱底”战机升空迎接!穆尼尔穿梭斡旋背负双重使命

红星新闻
2026-04-16 16:00:17
女教师群聊“八卦”被拘,起诉公安局再被驳回

女教师群聊“八卦”被拘,起诉公安局再被驳回

中国新闻周刊
2026-04-16 09:02:37
开拓者约谈杨瀚森,引发震动!老板勃然大怒,全员整顿!

开拓者约谈杨瀚森,引发震动!老板勃然大怒,全员整顿!

刘哥谈体育
2026-04-16 11:30:39
这跟不穿有啥区别?张萌开叉到胃,文咏珊副乳松弛,张天爱大又挺

这跟不穿有啥区别?张萌开叉到胃,文咏珊副乳松弛,张天爱大又挺

嫹笔牂牂
2026-04-16 07:31:11
爱泼斯坦文件曝光!证人实锤了:爱泼斯坦把梅拉尼娅介绍给特朗普

爱泼斯坦文件曝光!证人实锤了:爱泼斯坦把梅拉尼娅介绍给特朗普

吃货的分享
2026-04-16 17:13:11
投诉公交提前发车,竟丢了工作?松原男子称个人信息遭泄露,单位被施压后将其解雇

投诉公交提前发车,竟丢了工作?松原男子称个人信息遭泄露,单位被施压后将其解雇

大风新闻
2026-04-16 16:07:03
匈牙利新总理马扎尔将取消国营媒体!称其为“谎言工厂”

匈牙利新总理马扎尔将取消国营媒体!称其为“谎言工厂”

项鹏飞
2026-04-16 19:28:44
港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

骄阳之夏明
2026-04-15 16:44:42
王健林,被逼到崩溃边缘...

王健林,被逼到崩溃边缘...

鸣金网
2026-04-16 19:42:33
Shams:爱德华兹的申诉被驳回,将无缘本赛季个人奖项评选

Shams:爱德华兹的申诉被驳回,将无缘本赛季个人奖项评选

懂球帝
2026-04-17 00:19:02
2026-04-17 07:03:00
王楔晓
王楔晓
一个逗比演员的生活日常
1238文章数 52关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:伊朗已同意几乎所有要求

头条要闻

特朗普:伊朗已同意几乎所有要求

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

本地
游戏
旅游
时尚
公开课

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

可爱又凶狠!卡牌新游《小熊牌屋》中文上线特惠开启

旅游要闻

社评:读懂“China Travel”持续圈粉的逻辑

爆火的前额叶梗,让多少年轻人主动确诊「脑残」?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版