网易首页 > 网易号 > 正文 申请入驻

热点丨DeepSeek V3.2重磅更新,从模型层向系统层跃迁

0
分享至


·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言

近日,DeepSeek的一场突发更新,这个以代码生成和硬核推理著称的[极客首选],一口气抛出两款正式版模型DeepSeek-V3.2与DeepSeek-V3.2-Speciale。

不仅在推理能力上对标GPT-5、硬刚Gemini 3.0 Pro,更以完全开源的姿态,直接打破了[开源模型永远落后闭源8个月]的行业魔咒,2026年AI Agent元年的硝烟已提前点燃。

作者| 方文三

图片来源 |网 络


技术炸场,三大突破重构AI能力边界

DeepSeek此次发布的两款模型,如同精准打击不同战场的[双子星],背后是一套经过实战验证的硬核技术体系。

V3.2聚焦[平衡实用],适用于日常问答、通用Agent任务与工具调用,推理能力比肩GPT-5。

Speciale版本则剑指[极致推理],融合DeepSeek-Math-V2的定理证明能力,在主流推理基准测试中媲美Gemini 3.0 Pro,成为复杂数学推理、编程竞赛与学术研究的[金牌收割机]。

长期以来,传统大模型的注意力机制在处理长序列时面临计算复杂度指数级增长的死结,O(L²)的算法逻辑让128K上下文推理成为[高成本奢侈品]。

DeepSeek团队创新性提出的DSA(DeepSeek Sparse Attention)稀疏注意力机制,彻底颠覆了这一现状。

DSA通过[闪电索引器]与[细粒度token选择]两大核心组件,将计算复杂度从O(L²)骤降至O(L·k)(k远小于L)。

简单来说,传统模型处理长文本如同逐字阅读整本百科全书,而DSA更像智能搜索引擎,先快速扫描建立索引,再精准定位关键信息。

在H800集群测试中,128K序列的预填充阶段每百万token成本从0.7美元降至0.2美元,解码阶段从2.4美元降至0.8美元,推理速度提升3.5倍,内存占用减少70%,且无明显性能损失。

这种效率革命的意义深远,当长文本推理成本低到可忽略不计,AI处理整本书籍、完整项目代码的场景将全面普及,为后续复杂Agent任务落地扫清了最大障碍。

开源模型与闭源模型的差距,往往藏在[后训练]的资源投入里。

DeepSeek团队发现,此前开源模型在复杂任务中乏力,核心原因之一是后训练阶段计算资源不足。

为此,他们打破行业常规,将强化学习(RL)的计算预算提升至预训练成本的10%以上,这在开源模型中极为罕见。


为了让大规模RL训练稳定落地,团队在GRPO算法基础上进行三重优化,通过无偏KL估计修正系统性误差,用离线序列掩码策略过滤偏离过大的负样本,为MoE模型设计Keep Routing操作确保参数优化一致性。

更关键的是,他们采用[专家蒸馏]策略,先为数学、编程、通用推理等6个领域训练专用模型,再用这些专家模型生成高质量数据训练最终模型,让V3.2在硬核任务中实现质的飞跃。

实测数据印证了这套策略的有效性,在SWE-Verified代码修复基准中,V3.2解决率达73.1%,与GPT-5 High的74.9%几乎持平。

在Terminal Bench 2.0复杂编码任务中,46.4%的准确率显著超越GPT-5 High的35.2%。

而Speciale版本更是在AIME 2025数学竞赛中以96.0%的通过率,超越GPT-5 High的94.6%和Gemini 3.0 Pro的95.0%,展现出开源模型的极致潜力。

如果说DSA解决了[效率问题],那么[思考融入工具调用]的机制则解决了AI Agent状态漂移(State Drift)的[核心痛点]。

传统智能体在多轮工具调用中容易[忘记初衷],比如规划带老人的旅行时,后期突然推荐高强度徒步,本质是推理过程与工具执行的断裂。

DeepSeek V3.2创新性地引入[思考保留]模式,成为首个在[思考模式]下支持工具调用的开源模型。

其核心逻辑是,只有引入新的用户消息时才丢弃历史推理内容,若仅添加工具相关消息,推理过程会持续保留。

这种设计如同给AI装上[海马体],让模型在调用工具时能记住[为什么这么做],基于历史执行结果持续优化决策,无需重启推理流程。

为了锤炼这种能力,DeepSeek构建了大规模Agent任务合成管线,生成1827个任务导向环境和85000个复杂指令。


告别技术炫技,进入应用争夺阶段

过去两年,ChatBot模式让用户体验了AI的新奇,但[只能说不能做]的局限逐渐显现。

用户疲于在不同窗口复制粘贴,企业抱怨AI无法闭环解决问题,这种边际效应递减的模式,注定了商业价值的天花板。

DeepSeek显然看透了这一点,V3.2版本特意强调[通用Agent任务场景],本质上是宣告其战略转向。

这场AI转型背后,是中美两国在技术赛道上的深层博弈。

过去三年,美国试图通过高端芯片禁令锁死中国AI的进化上限,寄希望于物理层面的封锁让中国AI永远停留在二流水平。

但DeepSeek V3及国内头部模型的迭代,已然证明这种封锁的阶段性失效。

中国厂商走出了一条[应用驱动底层]的特色道路,买不到顶级单卡,就通过算法优化弥补;算力集群互联受限,就用MoE架构创新提升参数利用率;硬件有短板,就通过软硬协同极致压榨效率。


在这样的苛刻条件下,中国AI不仅训练出对标GPT-4.5乃至GPT-5级别的模型,更在应用落地层面形成独特优势。

而博弈的焦点,正从硬件封锁转向生态壁垒。

硅谷巨头的打法极具侵略性,OpenAI用Sora扼住短视频内容生产咽喉,Google试图建立由其定义的[全球AI操作系统],一旦成功,所有依附于APP生态的企业都将面临降维打击。

中国厂商则抱团构建本土生态,从阿里千问、蚂蚁灵光到字节豆包、DeepSeek,虽路径不同,但目标一致。

在系统级Agent赛道建立中国标准,让AI从[显性对话者]变成[隐性掌控者],渗透到购物、支付、物流、社交等全场景。

DeepSeek V3.2的发布,正是高性能模型成本下探与实用性飙升的缩影,当推理成本低到可忽略不计,当模型上下文能容纳整本书籍,量变终于引发质变。

Agent与ChatBot的本质区别,在于对物理世界的重构能力。

在软件层面,AI将彻底颠覆现有工作流。过去我们购买CRM系统自己录入客户信息,未来将雇佣[销售Agent]自动完成全流程。

过去依赖SaaS软件处理事务,未来将进入[Service as a Software]时代,服务本身就是软件。

DeepSeek V3.2的平衡推理能力,正是为这种长链条复杂决策量身打造。


打破垄断,AI进入[免费顶配]时代

DeepSeek V3.2最具颠覆性的举动,并非技术参数的突破,而是选择完全开源。

模型权重、聊天模板、本地运行指南在Hugging Face全面开放,让中小企业乃至个人开发者都能零成本使用对标GPT-5的能力。

这种[顶级性能+免费开源]的组合,正在重塑全球AI的权力结构。

长期以来,闭源模型凭借海量算力投入和数据优势,在复杂任务中占据绝对主导地位。但DeepSeek V3.2的发布,终结了[开源永远落后]的神话。

在推理基准测试中,V3.2与GPT-5各有胜负,仅略逊于Gemini 3.0 Pro。

在Agent评测中,其得分高于同为开源的Kimi-K2-Thinking和MiniMax M2;

而Speciale版本更是在国际竞赛中超越部分闭源模型,证明开源模型完全有能力跻身第一梯队。

这种突破的核心逻辑,在于DeepSeek找到了[后训练的正确打开方式]。

后训练的瓶颈,是靠优化方法和数据而不是靠等待一个更强的基础模型来解决的。

通过DSA架构创新、超配的强化学习资源、大规模Agent任务合成,开源模型终于摆脱了对[暴力算力]的依赖,走出了一条效率更高、成本更低的进化路径。

DSA机制带来的成本下降远比想象中影响深远,这种成本优势将加速[AI工具取代传统软件]的趋势。

当AI能以极低成本帮普通人规划行程、处理工作、解决专业问题,AI将真正渗透到操作系统层级,成为像水电一样的基础服务。


结尾:

当Google Gemini 3.0 Pro横扫多模态评测,当OpenAI Sora下载量持续攀升,当中美科技巨头集体押注Agent,一个确定性的趋势已然形成。

当开源模型打破闭源垄断,当Agent技术重构物理世界,当中美厂商在系统层展开深度博弈,2026年的AI战场注定精彩纷呈。

部分资料参考:节点财经:《Deepseek重磅更新背后:AI大战一触即发,再不行动就晚了》,量子位:《DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro》,雷科技:《又强大又便宜!DeepSeek V3.2又要让谷歌和OpenAI慌了》,网易科技:《硬刚Gemini 3.0 Pro!DeepSeek V3.2实测性能确实猛,但这三个[硬伤[不得不防》,机器之心:《从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

请务必注明:

「姓名 + 公司 + 合作需求」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
房价暴跌、职场内卷、人口下滑:所有乱象,皆为同一根源

房价暴跌、职场内卷、人口下滑:所有乱象,皆为同一根源

维纳斯的眼泪
2026-03-05 18:27:10
全球顶级龙头,股息率高达12%,社保基金重仓的36股票名单

全球顶级龙头,股息率高达12%,社保基金重仓的36股票名单

鹏哥投研
2026-03-06 15:15:11
民用北斗被干扰了?中国船员称所有系统全都失效,只能用传统手段

民用北斗被干扰了?中国船员称所有系统全都失效,只能用传统手段

南权先生
2026-03-05 15:22:09
伊朗玫瑰宫遭炸!圆明园之痛重现?英美“文明”面具下的文物之殇

伊朗玫瑰宫遭炸!圆明园之痛重现?英美“文明”面具下的文物之殇

眼界看视野
2026-03-05 09:07:21
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

FM93浙江交通之声
2025-10-28 00:01:43
著名相声演员离世

著名相声演员离世

豆哥记录
2026-01-07 11:15:43
美媒发现不对劲,难怪伊朗导弹这么准,有人用卫星,提供美军定位

美媒发现不对劲,难怪伊朗导弹这么准,有人用卫星,提供美军定位

健身狂人
2026-03-07 00:14:06
西贝大规模关店后 员工工资延迟发放 内部通知被疑催促员工主动离职

西贝大规模关店后 员工工资延迟发放 内部通知被疑催促员工主动离职

快科技
2026-03-06 13:30:06
暴跌88.6%!收割中产的万元手表卖不动了?网友:不如华为

暴跌88.6%!收割中产的万元手表卖不动了?网友:不如华为

有范又有料
2026-03-04 17:39:10
F1澳洲站首日5大焦点:阿斯顿马丁陷入危机、法拉利未能延续优势

F1澳洲站首日5大焦点:阿斯顿马丁陷入危机、法拉利未能延续优势

体育妞世界
2026-03-07 00:50:03
战争升级:一吨弹头砸向特拉维夫,白宫电话打爆,日本蠢蠢欲动

战争升级:一吨弹头砸向特拉维夫,白宫电话打爆,日本蠢蠢欲动

井普椿的独白
2026-03-06 14:31:46
菜比肉贵,摊比人多!南宁最贵菜市惨遭「抛弃」

菜比肉贵,摊比人多!南宁最贵菜市惨遭「抛弃」

童童聊娱乐啊
2026-03-06 20:23:51
全国人大代表刘莉莉:让家长打印电子作业违背“双减”初衷,建议学校减少频繁向家长布置任务

全国人大代表刘莉莉:让家长打印电子作业违背“双减”初衷,建议学校减少频繁向家长布置任务

极目新闻
2026-03-06 20:23:26
澳洲华男持刀随机伤人,被警方当场击毙!曾是精英华裔,沦为“毒男”

澳洲华男持刀随机伤人,被警方当场击毙!曾是精英华裔,沦为“毒男”

澳洲红领巾
2026-03-06 12:58:32
有色金属行业资金流出榜:紫金矿业、洛阳钼业等净流出资金居前

有色金属行业资金流出榜:紫金矿业、洛阳钼业等净流出资金居前

证券时报
2026-03-06 17:55:33
全新一代雷克萨斯ES美国售价揭晓:48795美元起,下月登陆国内

全新一代雷克萨斯ES美国售价揭晓:48795美元起,下月登陆国内

IT之家
2026-03-06 18:19:38
一觉醒来,比亚迪五款新车亮相,4款公布了价格

一觉醒来,比亚迪五款新车亮相,4款公布了价格

阿芒娱乐说
2026-03-06 14:05:12
1965年,毛主席听到特大矿产地名后,说:不好听,我看叫攀枝花吧

1965年,毛主席听到特大矿产地名后,说:不好听,我看叫攀枝花吧

墨道荣
2026-03-06 14:55:40
慎入!韦林顿-席尔瓦伤口特写:上嘴唇裂开一道深口子

慎入!韦林顿-席尔瓦伤口特写:上嘴唇裂开一道深口子

懂球帝
2026-03-06 23:12:40
61岁雪梨自曝被TVB高层性侵,满脸惊恐:不能说名字,会死人的!

61岁雪梨自曝被TVB高层性侵,满脸惊恐:不能说名字,会死人的!

潮鹿逐梦
2026-03-05 22:34:12
2026-03-07 01:47:00
AI芯天下
AI芯天下
从芯出发,用心服务
6594文章数 169关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

伊朗:决不投降 要伊朗屈服于他们绝对不可能

头条要闻

伊朗:决不投降 要伊朗屈服于他们绝对不可能

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

房产
亲子
时尚
数码
旅游

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

亲子要闻

宝宝在海底捞看到别人过生日扭得比服务员小姐姐还起劲

这些才是适合普通人的穿搭!搭配腰带、多穿牛仔裤,简单舒适

数码要闻

苹果“HomePad”智能家居中枢推迟至2026年秋季发布

旅游要闻

避开人潮!三八节赴万宁溪边村,赏限定三角花海

无障碍浏览 进入关怀版