![]()
哈喽,大家好,今天小墨就带大家分析国产大模型的硬核逆袭 ,DeepSeek-V3.2 系列开源直接对标 Gemini-3.0-Pro,拿满国际竞赛金牌还把推理成本砍半。
ChatGPT 发布三周年之际,全球 AI 赛道迎来关键转折点。当闭源模型还在算力军备竞赛中比拼参数规模时,中国团队 DeepSeek 突然抛出两颗 “重磅炸弹”。
![]()
![]()
双模型精准卡位,竞赛成绩刷新开源天花板
DeepSeek 此次发布的两款模型形成明确分工。
标准版 V3.2 聚焦 “平衡实用”,在日常问答、通用 Agent 任务和工具调用场景中表现亮眼,其推理能力达到 GPT-5 级别,仅小幅落后于 Gemini-3.0-Pro,且输出长度较同类模型大幅缩短,显著降低用户等待时间与计算开销。
![]()
更值得关注的是,该模型在未针对测试集特殊训练的情况下,拿下当前开源模型 Agent 评测的最高分数,在 SWE-Verified 代码任务中实现 73.1% 的解决率,Terminal Bench 2.0 准确率达 46.4%,大幅超越现有开源模型。
增强版 Speciale 则剑指 “极致推理”,融合 DeepSeek-Math-V2 的定理证明能力后,一举斩获 IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025 四项国际顶级竞赛金牌,其中 ICPC 成绩跻身人类选手第二名,IOI 排名第十,成为首个在编程与数学竞赛中比肩顶尖人类选手的开源模型。
![]()
不过官方特别提醒,该版本专注科研场景,未优化日常对话,且 Token 消耗与使用成本显著高于标准版,目前仅开放临时 API 供研究使用。
![]()
成本效率实现颠覆性突破
支撑此次性能飞跃的核心,是 DeepSeek 独创的 DSA(DeepSeek Sparse Attention)稀疏注意力机制。
传统注意力机制处理长序列时计算复杂度为 O (L²),严重制约部署效率,而 DSA 通过 “闪电索引器” 与 “细粒度 token 选择” 双组件。
![]()
将复杂度降至 O (L・k)(k 远小于 L),在 128k 长序列任务中,推理成本较上一代 V3.1-Terminus 大幅降低 ,H800 集群测试显示,预填充阶段每百万 token 成本从 0.7 美元降至 0.2 美元,解码阶段从 2.4 美元降至 0.8 美元。
更关键的是,该技术实现了 “降本不降价”,支持 FP8 精度与 MLA 架构,适配昇腾 Atlas 800 A2 等国产芯片,通过结构化剪枝与混合量化策略,可在精度损失小于 1% 的前提下将参数量压缩 40%,算力利用率提升 200%。
这种架构创新让 DeepSeek 走出了一条区别于 “算力堆料” 的技术路线,其训练成本仅为 Meta Llama-3 的 1/11,却实现了相当的性能表现。
![]()
![]()
破解开源模型泛化难题
DeepSeek 在强化学习(RL)领域的投入同样打破行业常规 ,将训练后阶段的计算预算提升至预训练成本的 10%,这在开源模型中极为罕见。
团队基于 GRPO 算法优化出无偏 KL 估计、离线序列掩码等技术,解决了大规模 RL 训练的稳定性问题,同时通过 “专家蒸馏” 策略,让模型吸收数学、编程、Agent 任务等 6 大领域的专项能力。
![]()
为提升 Agent 泛化能力,DeepSeek 构建了全球领先的自动环境合成管线,生成 1827 个任务导向环境与 85000 个复杂提示,涵盖旅行规划、软件开发等真实场景,其中代码 Agent 从 GitHub 挖掘数百万 issue-PR 对,搭建了多语言可执行测试环境,搜索 Agent 则通过多智能体协作生成高质量长尾数据。
这种 “难解易验” 的训练模式,让 V3.2 在未见过的 Agent 场景中仍能保持高性能,大幅缩小了开源与闭源模型的差距。
![]()
开源社区认可度持续攀升
目前 DeepSeek-V3.2 已全面登陆官方 App、Web 端与小程序,API 调用成本降低 50% 以上,而 Speciale 版本开放临时 API 供科研使用。
![]()
作为首个登上 Nature 封面的中国大模型,DeepSeek 的开源生态已形成规模效应,GitHub 星数超越同类模型,R1 版本曾创下 7 天用户破 1 亿的纪录,较 ChatGPT 达成同等规模快 53 天。
更重要的是,其推出的大模型一体机已覆盖 1.5B 至 671B 全尺寸模型,从边缘端到云端实现国产化算力解决方案落地。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.