网易首页 > 网易号 > 正文 申请入驻

DeepSeek逆势破局:开源模型的反击与Agent新赛道

0
分享至

哈喽,大家好,杆哥这篇评论,主要来分析DeepSeek逆势破局:开源模型的反击与Agent新赛道



2025年末,Google Gemini 3 Pro横空出世,让开源模型陷入“是否已到极限”的质疑。就在此时,12月1日DeepSeek一举发布V3.2和Speciale两款模型,给开源阵营注入强心剂。

这不仅是一次常规更新,更是对闭源技术高地的正面回应,也抛出了行业新命题:后Scaling时代,开源模型的破局路在哪?

架构重塑:不堆算力的“反超”逻辑



DeepSeek-V3.2在推理类基准测试中全面对标GPT-5,仅略逊于Gemini 3 Pro,还刷新了国内开源模型推理纪录。

关键突破在于自研的稀疏注意力机制(DSA),它把传统



Transformer平方级的计算复杂度,降到了近线性。通过“闪电索引器”筛选核心token再精算,即便128K超长上下文也能保持效率。

团队采用“密集预热—稀疏过渡”策略,先让索引器模仿原始分布,再逐步替换结构,既提效又保精度,长文本任务得分显著上升。



押注Agent:从“插件”到核心引擎

V3.2最关键的转向,是将Agent能力与推理能力并列作为核心指标。这并非跟风,而是瞄准了产业落地的关键。



企业已不再满足于“聪明的聊天机器人”,而是愿意为自动写报告、批量修代码等“可执行”的Agent付费。DeepSeek为此搭建了1800多个智能体环境,生成8.5万条高复杂度任务提示。



自研的GRPO强化学习策略解决了训练稳定性问题,多维奖励信号避免“灾难性遗忘”,让模型在多轮任务中保持逻辑连贯。



后训练战术:开源模型的“以巧胜拙”



DeepSeek坦言,开源模型在知识广度等维度仍落后闭源,但他们用“后训练三件套”实现了突围。

先通过6类专家模型蒸馏出高质量样本,再用超预训练10%算力的强化学习优化,最后融合“工具中思考”机制。模型不再“思考完再调用工具”,而是边调用边思考,减少重复推理。



这种策略提升了“单位token智能密度”,在SWE-Verified等Agent基准上,V3.2解决率达73.1%,接近GPT-5的74.9%。

开源未到终局:两种路线的博弈



Gemini 3 Pro代表闭源“更大更快更强”的路径,而DeepSeek走出了“更轻更稳更聪明”的开源新方向。

当然差距仍存在,V3.2世界知识广度不足,Speciale模型token开销偏高。但它证明,规模红利见顶后,架构创新和训练策略优化能打开新空间。



这场反击不仅让开源阵营重拾信心,更指明了未来方向:AI竞争已从“参数多少”转向“思维组织力”与“能效比”的较量。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
塔利班规定:男子可殴打妻子但不得致重伤

塔利班规定:男子可殴打妻子但不得致重伤

特约前排观众
2026-03-04 00:10:03
舒淇米兰街头随性出街 简约穿搭气质绝了

舒淇米兰街头随性出街 简约穿搭气质绝了

述家娱记
2026-03-03 11:52:24
太惨烈!影院经理哭诉:整个二月就靠一部电影活命

太惨烈!影院经理哭诉:整个二月就靠一部电影活命

东方不败然多多
2026-03-04 07:54:05
吴桂贤为何好命?大起大落的人生之路,守住良知底线

吴桂贤为何好命?大起大落的人生之路,守住良知底线

混沌录
2026-01-29 23:47:04
体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

带你感受人间冷暖
2026-02-24 01:03:13
世上没有后悔药!下半身"贪婪"的任素汐,现状印证王菲评价

世上没有后悔药!下半身"贪婪"的任素汐,现状印证王菲评价

秋姐居
2026-02-27 17:16:02
噩耗!利物浦7200万新援官宣手术,《队报》实锤:本赛季彻底报销

噩耗!利物浦7200万新援官宣手术,《队报》实锤:本赛季彻底报销

田先生篮球
2026-03-03 22:56:55
“特朗普以为靠军事震慑中方,然而…”

“特朗普以为靠军事震慑中方,然而…”

观察者网
2026-03-03 14:22:08
15万人撤离,千亿项目烂尾!光伏集体血亏,未来将何去何从?

15万人撤离,千亿项目烂尾!光伏集体血亏,未来将何去何从?

胖福的小木屋
2026-03-03 17:03:43
帕森斯:在我心里詹姆斯就是GOAT,无论怎么排都只有他和乔丹

帕森斯:在我心里詹姆斯就是GOAT,无论怎么排都只有他和乔丹

懂球帝
2026-03-04 11:56:23
不要轻易做手术!医生提醒:62岁后,这5类手术可尽量避免

不要轻易做手术!医生提醒:62岁后,这5类手术可尽量避免

今日养生之道
2026-02-15 14:14:53
美知名学者警告:中东战火或将失控,“爆发世界大战并非不可能”

美知名学者警告:中东战火或将失控,“爆发世界大战并非不可能”

中国青年报
2026-03-03 14:53:26
最受好评iPhone出炉:第一名竟是6年前的小屏神机

最受好评iPhone出炉:第一名竟是6年前的小屏神机

快科技
2026-03-04 07:22:06
如果伊朗倒下,中国将受到重创?别急,中国已备好三条退路

如果伊朗倒下,中国将受到重创?别急,中国已备好三条退路

荷兰豆爱健康
2026-03-03 19:32:58
美军阵亡6人,击落伊朗轰炸机!乱打海湾国家让特朗普都感到意外

美军阵亡6人,击落伊朗轰炸机!乱打海湾国家让特朗普都感到意外

鹰眼Defence
2026-03-03 18:07:38
火箭噩耗!轰下22+12+4主控末节伤退,本就残缺的阵容彻底难了

火箭噩耗!轰下22+12+4主控末节伤退,本就残缺的阵容彻底难了

现代小青青慕慕
2026-03-04 09:38:55
除夕夜我备满桌菜被婆婆踹倒,丈夫默默扶起我:妈,以后靠你自己吧

除夕夜我备满桌菜被婆婆踹倒,丈夫默默扶起我:妈,以后靠你自己吧

奶茶麦子
2026-03-03 19:29:10
李雨桐爆料波及13位明星!胡彦斌薛之谦因爱结仇,周杰伦何炅躺枪

李雨桐爆料波及13位明星!胡彦斌薛之谦因爱结仇,周杰伦何炅躺枪

萌神木木
2026-03-03 12:09:34
现货黄金跌超4% 现货白银跌超12%

现货黄金跌超4% 现货白银跌超12%

证券时报
2026-03-03 19:51:16
狗仔曝31岁白鹿和24岁陈鑫海热恋?2人相差7岁,曾舜晞只是烟雾弹

狗仔曝31岁白鹿和24岁陈鑫海热恋?2人相差7岁,曾舜晞只是烟雾弹

好贤观史记
2026-03-02 21:15:49
2026-03-04 13:27:00
凡知 incentive-icons
凡知
莫道书中无用处, 兴替之间皆学问。
5557文章数 1400关注度
往期回顾 全部

科技要闻

新MacBook Pro首发M5 Pro/Max芯片 17999起

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

体育要闻

“头铁”拼图在NBA也有生存环境

娱乐要闻

迪丽热巴转机滞留迪拜 错过巴黎时装周

财经要闻

伊朗,正在打破特朗普的幻想

汽车要闻

比亚迪元PLUS遭导弹袭击 车辆未起火/乘员均生还

态度原创

旅游
时尚
本地
数码
亲子

旅游要闻

擂响“东方第一鼓”雅集翰墨绘团圆,浦东元宵游园会劲展“动”“静”中国韵

三件外套拍出17万美元天价!为什么时装精都想买她的同款?

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

数码要闻

AI路由器接管一切!MWC上的智能家居,终于开始治「连接病」

亲子要闻

30岁女子患有巨阴症,能不能怀上小孩?医生:主要看4个方面

无障碍浏览 进入关怀版