网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek补全R1技术报告，训练路径首次详细公开

2026-01-13 19:44:45　来源: 随梦而飞起

四川举报

0

分享至

这事在AI圈炸了锅，要知道现在大模型公司恨不得把参数表都当商业机密，他们倒好，把训练日志都快写成教学手册了。

这次补充材料最让人眼前一亮的，是他们把R1的训练过程扒了个底朝天。

跟GPT、Claude这些"混合派"不同，DeepSeek团队走了条"纯强化学习"的野路子。

本来想跟着行业主流用RLHF（人类反馈强化学习），但后来发现光靠人类标注根本不够用，索性搞了套四步训练法。

冷启动阶段就挺反常规，别人都用海量数据"喂饱"模型，他们偏偏只用几千条自己编的思维链数据。

这些数据不直接给答案，而是把解题思路一步步写出来，比如算数学题会标注"这里需要用勾股定理，因为已知直角边长度"。

这种"授人以渔"的训练方式，难怪模型推理能力这么强。

后来对比GPT-4的混合数据模式才发现，专注思维过程的训练，就像让模型先学会"思考"再学"说话"，基础打得确实牢。

MMLU测试里跨语种准确率提升不少，这手操作确实秀。

技术突破归突破，AI安全这根弦谁都不敢松。

DeepSeek这次把安全防护的家底也亮出来了10.6万条风险提示数据，光标注就花了三个多月。

他们的双轨风控系统挺有意思，第一层是关键词过滤，2000多个风险词库实时扫描，响应快得跟眨眼睛似的。

但光靠关键词肯定不够，比如用户问"怎么制造危险物品"，换个说法就可能绕过去。

所以第二层上了个"模型审查官"，用自家的DeepSeek-V3模型再审一遍，复杂案例拦截准确率能到九成以上。

不过知识产权这块还有短板，HarmBench测试里得分比行业平均低了7分，看来给AI划"版权红线"比想象中难。

对比GPT-4藏着掖着的安全机制，DeepSeek这套"透明防御"思路确实大胆。

把安全数据集和拦截逻辑全公开，等于让同行来挑毛病。

但换个角度想，开源模型本来就该把"防护网"亮出来，藏着掖着反而让人更不放心。

讲完技术和安全，这次补充材料里有个细节特别戳人团队名单。

这是什么概念？2023年全球AI人才平均流失率快四分之一，MetaAI团队更是走了三成。

RuiqiGe的回归挺有代表性，这位前DeepMind研究员去年离职时，多少人以为是被硅谷挖角。

结果人家转了圈又回来，采访里说"这里能安安静静做五年以上的长线研究"。

看来DeepSeek的留人秘诀，不是靠硅谷式的高薪期权，而是让研究员能"踩踏实做学问"。

对比OpenAI动不动就重组团队，Meta因为管理层变动黄了好几个长期项目，这种"技术定力"确实难得。

现在AI圈都在赌下一个突破点，有人拼参数规模，有人抢多模态赛道，DeepSeek用64页补充材料证明，把一件事做到极致同样能杀出重围。

至于大家惦记的R2版本，按这个节奏，说不定真的不远了。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

2026年，大模型训练的下半场属于「强化学习云」

机器之心Pro 2026-01-12 14:03:47
0 跟贴 0
AGILE：自监督+交互式强化学习助力VLMs感知与推理全面提升

机器之心Pro 2025-10-20 18:30:03
0 跟贴 0

AI APP全球100强：中国应用加速“出海”，DeepSeek冲至全球第4

华尔街见闻官方 2026-03-11 10:06:49
0 跟贴 0

多模态推理新范式ThinkMorph ，文字与图像在统一架构共同演化

机器之心Pro 2026-03-10 16:02:54
0 跟贴 0
物理AI的「原生」时刻：原力灵机发布具身大模型DM0

机器之心Pro 2026-03-11 16:32:04
0 跟贴 0

情感识别不再是分类题：EmotionThinker让SpeechLLM 学会解释情绪

机器之心Pro 2026-02-25 13:45:15
0 跟贴 0

英伟达发力智能体！开源模型吞吐量提升五倍

华尔街见闻官方 2026-03-12 01:38:24
0 跟贴 0
云天励飞千卡AI推理集群落地，打造“国模国芯”生态样板

经济观察报 2026-03-12 11:02:05
0 跟贴 0

行业最大规模具身数据集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟贴 0
行业最大规模具身数据集！出自简智机器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟贴 0
AI数据中心光互连需求提速，CPO渗透率2030年有望达35%

华尔街见闻官方 2026-03-12 11:22:00
0 跟贴 0
VinciCoder：多模态统一代码生成框架和视觉反馈强化学习

机器之心Pro 2025-11-17 14:12:38
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
Deepseek冲至AI APP榜单全球第四，科创人工智能ETF华夏(589010)午后下探

每日经济新闻 2026-03-11 14:14:16
0 跟贴 0
当男生和女友合照，用到女友的美颜参数

财经时间官方 2026-03-09 21:02:10
0 跟贴 0
大风315 | 游客称飞3000公里在西双版纳一景区游玩，因明星录制综艺节目被清场；景区：具体情况需由游客回应

大风新闻 2026-03-09 17:06:09
6989 跟贴 6989
阿德巴约单场83分"刷"新纪录引质疑本人发声致敬科比

澎湃新闻 2026-03-11 12:04:34
5020 跟贴 5020
兑现用户至上探店东风标致、东风雪铁龙 “春风关爱行动”

第e台车 2026-03-10 12:25:28
5 跟贴 5
买车最容易让人忽略的三个参数！

Mr刘然 2026-03-09 08:21:38
8 跟贴 8
逻辑是文明之本

易欣看大世界 2026-03-12 05:20:55
2 跟贴 2
“龙虾”的冷与热：政府争相“放水养虾”，专家叫“别急着下锅”

八桂知事 2026-03-11 14:13:21
2 跟贴 2
各种仿造银元声音区别，银又不值钱，何必在材料上省！

莎莎搞笑社 2026-03-11 10:06:35
1 跟贴 1
一出电梯就踩空，上海一天桥出现“施工错误”？真相来了：有历史原因，仍在建设中

上海新闻广播 2026-03-11 14:21:00
131 跟贴 131
天塌了，山姆的三文鱼原来不能生吃！很多人被包装误导

新民周刊 2026-03-11 19:48:20
697 跟贴 697
联合国贸发会议：霍尔木兹海峡航运量骤降97%

界面新闻 2026-03-11 17:07:09
1797 跟贴 1797
别再让大模型“想太多”！最新研究揭示 LLM 推理效率的关键瓶颈

机器之心Pro 2026-03-10 19:10:08
0 跟贴 0
李勇：美以袭击伊朗，中国是最大赢家？这套逻辑，该拆了！

温哥华保洁张姐 2026-03-12 00:42:34
0 跟贴 0
打了十来天，“最高强度”打击来了

中国新闻周刊 2026-03-11 15:02:08
10 跟贴 10
气块泡沫砖，是坚硬的建筑材料

小雯讲废话 2026-03-07 19:57:46
1 跟贴 1
郑州市管城回族区外国语学校寒假特色作业展之数学篇

大象新闻 2026-03-11 15:45:05
0 跟贴 0
首都生存指南手册

微微热评 2026-03-11 00:28:13
32 跟贴 32
6元能干什么？3月14日起，在武汉可以坐火车“环游”全城了！

极目新闻 2026-03-12 10:00:12
10 跟贴 10
王濛被推荐申报破格晋升国家级教练

现代快报 2026-03-11 19:34:32
772 跟贴 772
谁懂啊！小孩哥没出正月就去理发，舅舅知道后的反应太真实

北青网-北京青年报 2026-03-12 07:21:20
11 跟贴 11
碳纤维概念集体高开中复神鹰、吉林化纤一字涨停

财联社 2026-03-12 09:27:10
0 跟贴 0
西安航天城多个小区住户反映自来水有异味供水公司：春节后调整了次氯酸钠投放量

大风新闻 2026-03-12 08:29:18
27 跟贴 27
用户要的从来不是参数堆料，而是重新定义电池安全标杆

科技娜评 2026-03-11 23:48:19
14 跟贴 14
CBA联赛战火重燃山西男篮主场告捷

锦绣太原 2026-03-12 09:03:10
23 跟贴 23
苹果首款折叠屏机型顶配版定价超2万元！将成为苹果最贵手机

大象新闻 2026-03-12 08:41:03
0 跟贴 0
每经热评|“养龙虾”不是“奖龙虾” 真正的创新不需要“催肥”

每日经济新闻 2026-03-12 11:08:09
0 跟贴 0

以为只是小毛病，一查竟是晚期！做完所有治疗，他还是永远离开了

以为只是小毛病，一查竟是晚期！做完所有治疗，他还是永远离开了

新时代的两性情感

2026-02-18 08:36:45

中方再打出组合拳，刚把港口抢到手的巴拿马，彻底没了“财神爷”

中方再打出组合拳，刚把港口抢到手的巴拿马，彻底没了“财神爷”

石江月

2026-03-11 17:08:17

没想到，特朗普访华规格缩水，美国先遣队抵达北京，中国要求被拒

没想到，特朗普访华规格缩水，美国先遣队抵达北京，中国要求被拒

吴欣纯Deborah

2026-03-11 12:22:05

击毙 583 人！巴基斯坦反恐战打满16天，阿富汗塔利班低头求和

击毙 583 人！巴基斯坦反恐战打满16天，阿富汗塔利班低头求和

Ck的蜜糖

2026-03-11 20:11:58

美国五年的女儿突然回国，国安局登门：你女儿的虹膜指纹全都不符

美国五年的女儿突然回国，国安局登门：你女儿的虹膜指纹全都不符

无心小姐姐

2026-03-11 19:45:10

以色列卫星地面站被“精准击中”

以色列卫星地面站被“精准击中”

陆弃

2026-03-12 08:20:05

女子结婚时同事随礼200元，前同事离职4年后发信息要求返还礼金

女子结婚时同事随礼200元，前同事离职4年后发信息要求返还礼金

观威海

2026-03-12 09:59:19

曝伊朗女足被关押在吉隆坡酒店！遭严密看守又有3名球员不愿回国

曝伊朗女足被关押在吉隆坡酒店！遭严密看守又有3名球员不愿回国

念洲

2026-03-12 06:43:50

浙江情侣买二手机，用了3天要原价退，被拒后上门威胁，网友炸锅

浙江情侣买二手机，用了3天要原价退，被拒后上门威胁，网友炸锅

离离言几许

2026-03-11 18:40:09

曝王曼昱将暂停世界大赛，教练组对输球负全责，孙颖莎压力山大

曝王曼昱将暂停世界大赛，教练组对输球负全责，孙颖莎压力山大

詹妹侃体育

2026-03-11 22:02:52

超级大反转！ “戴高乐”号进入地中海，炮口竟然对准以色列？

超级大反转！ “戴高乐”号进入地中海，炮口竟然对准以色列？

书纪文谭

2026-03-11 13:34:36

世界上第一次超重型加油机被实战摧毁！

世界上第一次超重型加油机被实战摧毁！

安安说

2026-03-11 10:11:13

七国集团：原则上支持必要时动用战略储备稳定能源市场

七国集团：原则上支持必要时动用战略储备稳定能源市场

每日经济新闻

2026-03-11 20:59:34

毛主席逝世1年后，谢静宜被开除党籍后直言：我永远是党的女儿！

毛主席逝世1年后，谢静宜被开除党籍后直言：我永远是党的女儿！

今明文史

2026-03-10 20:25:04

近期，一名中国男子去泰国玩，花6000泰铢找21岁女孩，悲剧发生了

近期，一名中国男子去泰国玩，花6000泰铢找21岁女孩，悲剧发生了

鲸探所长

2026-03-01 14:38:25

重磅突发！美、伊，相继释放“停战消息”；抛4亿桶，油价仍大涨；美股期货，跌幅扩大

重磅突发！美、伊，相继释放“停战消息”；抛4亿桶，油价仍大涨；美股期货，跌幅扩大

金融界

2026-03-12 08:02:05

法国和浙江同为6000万人口，2025年法国创3万亿美元GDP，浙江呢？

法国和浙江同为6000万人口，2025年法国创3万亿美元GDP，浙江呢？

八斗小先生

2026-02-28 18:56:17

今日！CCTV5直播国乒孙颖莎+王楚钦出战+中国女篮，网络转CBA+NBA

今日！CCTV5直播国乒孙颖莎+王楚钦出战+中国女篮，网络转CBA+NBA

晚池

2026-03-12 00:06:45

悲壮一刻！导弹拼命拦截失败，16架运输机被毁：伊朗空军全军覆没

悲壮一刻！导弹拼命拦截失败，16架运输机被毁：伊朗空军全军覆没

安珈使者啊

2026-03-12 10:32:43

浙江一男子懒得动脑一直守号，结果中了500万：我就随便找了几个号码，每次就买一样的，中奖真的就是靠运气

浙江一男子懒得动脑一直守号，结果中了500万：我就随便找了几个号码，每次就买一样的，中奖真的就是靠运气

台州交通广播

2026-03-12 02:06:11

随梦而飞起

随梦而飞起

399文章数 34关注度

往期回顾全部

科技要闻

腾讯"养虾"暴涨后，百度急得在门口"装虾"

头条要闻

刚从伊朗回来的中国学者：街上是平静的人心是涌动的

头条要闻

刚从伊朗回来的中国学者：街上是平静的人心是涌动的

体育要闻

要脸，还是要83分纪录？

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜携女儿出席

财经要闻

卢锋：从特朗普团队群演看时代变局

汽车要闻

大众2025财报：转型虽有阵痛 "大象"已然起跑

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

时尚

手机

家居

教育

旅游要闻

伊斯坦布尔亚洲老城区

今年春天最时髦的6组搭配，照着穿美出新高度！

手机要闻

iPhone 18 Pro设计挤牙膏了继续用前代模具

家居要闻

触感本真家的迹象

教育要闻

五年级常考题：B×B-2B=2208

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版