网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

刚刚，DeepSeek最新发文！V3/R1训练细节全公开，信息量巨大

2025-09-01 20:41:19　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：KingHZ 桃子

【新智元导读】新规第一天，DeepSeek第一时间站出来了！接下来，所有自家AI生成内容，统统标出「AI身份」。更劲爆的是，DeepSeek主动「交底」V3/R1的模型训练细节。

今天，网信办《人工智能生成合成内容标识办法》正式生效。

其中，第四条要求：对符合要求的AI生成合成内容添加显式标识。

紧跟最新政策，DeepSeek出手了。

刚刚，DeepSeek官微发布了最新回应公告——凡是AI生成的内容，都会清楚标注「AI生成」。

它还郑重提醒，用户严禁恶意删除、篡改、隐匿标识，更别提用AI传播、制作虚假信息。

此外，这次还发布了《模型原理与训练方法说明》，可以一瞥DeepSeek的技术路径。

接下来，深扒一下DeepSeek V3/R1的一些训练细节。

传送门：https://cdn.deepseek.com/policies/zh-CN/model-algorithm-disclosure.html

回应新要求，DeepSeek公开技术说明

DeepSeek主要介绍了大模型的训练和推理阶段，包括预训练、优化训练（微调）以及训练数据等。

不同大模型的神经网络架构

模型训练

模型训练阶段即模型的开发阶段：通过设计好的深度神经网络架构和训练方法，开发人员开发出可被部署使用的模型。

模型由多层神经网络组成，不同的架构直接影响模型的性能。此外，模型性能也受参数规模的制约，而训练的目的就是找到具体的参数值。

目前，大模型的参数规模数以亿计。最新的DeepSeek-V3-0324，参数总量为6850亿。

在训练过程中，这些参数通过梯度下降算法迭代优化。

这次，DeepSeek把模型训练分为预训练和优化训练两个环节。

预训练：预训练目标是通过数据训练模型，使模型掌握通用的语言理解与生成能力。

优化训练：也称为微调，是在预训练模型的基础上通过特定任务的数据进一步调整模型参数，使模型适应实际应用场景。

在预训练阶段，模型通过大规模自监督学习，从文本数据中学习语言模式与知识关联。预训练完成后，模型能理解并生成连贯的文本，但还不会精准地回答问题或执行任务，因此需要进一步的训练微调。

在优化训练阶段，模型一般通过SFT、RL等方法，学会根据指令回答问题，符合人类的偏好和需求，并激发在特定领域的专业能力。

经过优化训练的模型能更好地满足实际需求，可被部署使用。

深挖训练「内幕」，炼出最强大脑

DeepSeek模型的能力，是建立在高质量、大规模、多样化的数据之上。

在「预训练阶段」和「优化训练阶段」，各有不同。

预训练阶段

在预训练阶段，主要使用了两类数据：

互联网公开可用的信息，比如网页、公开文档等。

与第三方合作获取许可的数据

需要强调的是，在此阶段，根本无需获取个人信息用于训练，DeepSeek不会有意关联至任何特定账户和个人，更不会主动将其用于训练模型。

不过，预训练数据规模过于庞大，可能偶然包含了一些个人信息。

对此，DeepSeek会通过技术手段，尽力筛查并移除这些信息，确保数据「干干净净」。

为了保证数据质量、安全、多样，他们还打造了一套硬核数据治理流程——

首先，通过「过滤器」自动剔除仇恨言论、色情低俗、暴力、垃圾信息，以及可能侵权的原始数据。

其次，通过算法+人工审核，识别并降低数据中的统计性偏见，让模型更公平、更客观。

优化训练阶段

到了优化训练阶段，一般需要通过人工或自动化的方式构造、标注一批问答对数据来对模型进行训练。

DeepSeek这次表示：这些问答对数据是由研究团队生成提供的，其中少部分数据的构造可能会基于用户的输入。

在DeepSeek-R1训练中，研究人员直接提示模型生成包含反思和验证的详细答案；收集并整理DeepSeek-R1-Zero的输出，使其具有可读性；以及通过人工注释者的后期处理来提高数据质量

如涉及利用用户的输入构造训练数据，DeepSeek会对数据进行安全加密技术处理、严格的去标识化和匿名化处理，从而尽可能避免训练数据关联到任何特定个人，且不会在模型给其他用户的输出中带有个人信息，更不会将其用于用户画像或个性化推荐。

同时，DeepSeek为用户提供了选择退出的权利。

为了确保模型的安全性，在模型优化训练阶段，DeepSeek构造了专门的安全数据对模型进行安全对齐，教会模型的回复符合人类的价值观，增强模型内生的安全能力。

模型推理

模型的推理阶段即模型被部署提供服务。

模型训练完成并被部署后，可以通过对输入信息进行编码和计算来预测下一个token，从而具备文本生成和对话等能力。

部署后的模型能够熟练执行基于文本生成的广泛多样的任务，并可以集成到各种下游系统或应用中。

具体到DeepSeek的产品服务，基于用户的输入，模型采用自回归生成方式，基于输入的上下文内容，通过概率计算预测最可能的接续词汇序列。

推理完成后，模型输出相应的内容作为响应，包括文字、表格和代码等。

此并非简单检索或「复制粘贴」训练数据中的原始文本，模型也并未存储用于训练的原始文本数据副本，而是基于对语言结构和语义关系的深度理解，动态生成符合语境的回答。

DeepSeek这次还强调模型开源。

我们通过开源平台对外公开发布了所有模型的权重、参数以及推理工具代码等，并采用宽松的MIT协议，供使用者自由、免费下载部署使用。

同时，DeepSeek发布各模型的完整技术报告，供社区和研究人员参考，并帮助公众更深入地了解每个模型的技术原理和细节。

LLM致命幻觉，全周期硬核对抗

毋庸置疑，当前AI发展还在早期阶段，存在无法避免的局限性。

若是再被加以滥用，将会带来严重的后果。

局限性

AI往往会生成错误、遗漏，或不符合事实的内容，这种现象统一称之为「幻觉」。

这个问题，是整个AI行业面临的挑战。

对此，DeepSeek正通过一些技术手段降低幻觉率，包括高质量的训练数据、优化对齐策略、RAG等，但现阶段依无法完全消灭。

同时，他们还在欢迎页、生成文本的末尾，以及交互界面底部，添加显著的提示标识。

特别提醒用户——内容由人工智能生成，可能不准确。

因此，AI生成的内容仅供参考，所有人不应将输出的内容作为专业建议。

尤其是，在医疗、法律、金融等专业领域，DeepSeek不提供任何建议或承诺，专业的事儿还得找专业的人。

滥用风险

AI技术本身是中立的，但滥用可能带来隐私保护、版权、数据安全、内容安全、偏见歧视等风险。

DeepSeek对此也是高度重视，采取了一系列硬核措施，贯穿了模型研发、训练、部署的全生命周期。

制定内部风险管理制度

开展模型安全性评估

进行红队测试

增强模型和服务透明度等

更重要的是，DeepSeek还赋予了用户知情权、选择权、控制权——

你可以查询服务的基本信息、拒绝其数据用于模型训练、删除其历史数据等。

参考资料：

https://cdn.deepseek.com/policies/zh-CN/model-algorithm-disclosure.html

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Muon作者仅用一篇博客，就被OpenAI看中了

机器之心Pro 2025-06-16 14:27:12
1 跟贴 1
2.1亿！DeepSeek大单来了：300P算力、120台昇腾910C服务器

智东西 2025-09-12 14:19:43
23 跟贴 23

强化学习的两个「大坑」，终于被两篇ICLR论文给解决了

机器之心Pro 2025-07-17 18:17:19
0 跟贴 0

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

量子位 2025-09-12 11:07:58
62 跟贴 62
扩散语言模型也有MoE版本!蚂蚁&人大从头训练LLaDA-MoE,即将开源

机器之心Pro 2025-09-12 21:35:04
1 跟贴 1

从分布外检测到代码生成，这位博士生要让AI既可靠又好用

DeepTech深科技 2025-09-05 23:07:42
0 跟贴 0

DeepMind用AI重构科研流程，Kaggle竞赛击败84%选手

DeepTech深科技 2025-09-13 21:57:52
0 跟贴 0
攻克强化学习「最慢一环」！交大字节联手，RL训练速度飙升2.6倍

量子位 2025-09-13 16:38:07
3 跟贴 3

基于3DGS场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃

机器之心Pro 2025-09-08 13:26:10
0 跟贴 0
啥？陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

量子位 2025-09-14 13:16:23
9 跟贴 9
机器学习临床预测模型构建的一般流程

医咖会 2025-08-11 19:56:31
0 跟贴 0
兼得快与好！训练新范式TiM，原生支持FSDP+Flash Attention

量子位 2025-09-14 13:46:24
3 跟贴 3
重磅！5年破解黎曼猜想，10年接管人类认知，AI超级增长曲线揭秘

新智元 2025-09-14 09:06:46
30 跟贴 30
对Transformer说不！清华刘嘉：2045数字永生降临｜新智元十年峰会

新智元 2025-09-13 13:07:14
2 跟贴 2
前谷歌X团队靠AI电影锁定戛纳！创立AI原生版皮克斯

量子位 2025-09-13 14:18:05
0 跟贴 0
AI解数学题只靠最后一个token

量子位 2025-09-14 13:38:04
1 跟贴 1
科学界论文高引第一人易主！AI站上历史巅峰

量子位 2025-08-25 14:10:09
0 跟贴 0
和ChatGPT聊完天，我患上了“精神病”

虎嗅APP 2025-09-14 20:10:21
0 跟贴 0
Nature系列综述：乔治·丘奇绘制 AI 蛋白质设计路线图，逐步指导利用AI工具设计蛋白质

生物世界 2025-09-14 12:08:50
0 跟贴 0
GPT-5是口袋博士？诺奖得主哈萨比斯怒怼奥特曼：博士级AI纯属扯淡！

新智元 2025-09-14 13:36:32
7 跟贴 7
2027万亿视频市场将爆发！AI十年如何重塑内容产业？｜新智元十周年峰会

新智元 2025-09-14 13:35:56
0 跟贴 0
马斯克深夜挥刀，Grok幕后员工1/3失业！谷歌AI靠人肉堆起，血汗工厂曝光

新智元 2025-09-14 19:09:00
3 跟贴 3
OpenAI反挖四位特斯拉、xAI、Meta高级工程师

机器之心Pro 2025-07-09 17:14:35
0 跟贴 0
机器人入职洗衣房，开始打工挣钱！苹果前AI高管打造

量子位 2025-09-14 18:15:34
1 跟贴 1
物流业deepseek时刻，中国无人车火爆全球

华商韬略 2025-06-17 10:58:23
0 跟贴 0
研究人员打造带有AI同行评审的预印本平台，有望革新科学出版方式

DeepTech深科技 2025-09-14 20:20:53
0 跟贴 0
超算互联网上线开源AI社区！模型+数据+算力，一站式解决

量子位 2025-06-23 20:07:47
0 跟贴 0
他们在1993年就提出了Scaling Law

量子位 2025-09-03 10:24:41
0 跟贴 0
CMU华人团队研发LegoGPT，打造包含47000个乐高结构数据集

DeepTech深科技 2025-05-10 17:44:13
10 跟贴 10
东风弹头为啥长的尖不尖扁不扁的，乘波体背后滑翔原理

不知名大咖 2025-09-11 18:30:00
3 跟贴 3
下一句会是什么？我们是否高估了预测编码理论？

钛媒体APP 2025-07-16 11:44:32
0 跟贴 0
无针注射的原理，究竟是什么样的？

星星科普 2025-09-13 10:28:54
9 跟贴 9
如果大模型是一片星空，谁是北斗？

脑极体 2025-09-10 17:55:43
1 跟贴 1
卫星图片：加沙城从废墟变为齑粉

央视新闻客户端 2025-09-13 16:19:29
17959 跟贴 17959
一刀砍掉90%训练成本！Qwen3-Next用1/10算力练成「长文推理利器」

新智元 2025-09-12 21:58:42
0 跟贴 0
美军新策略：突入中国腹地追击东风26导弹，展示双重战略

攒一兜星星 2025-09-14 21:43:25
0 跟贴 0
如果把针插本子上，用笔画画针就跟着走，这是什么原理！

三熊爱搞笑 2025-09-13 10:18:38
1 跟贴 1
【DeepSeek谈艺】周石峰·山水画 | 烟霞漫卷，绘尽自然生机与沉厚

文化视界网 2025-09-13 17:04:06
1 跟贴 1
高楼不倒的原因，再大台风也不怕，这就是阻尼器的原理！

老沾看生活 2025-09-10 15:20:29
0 跟贴 0
女子称贷款100多万中介收31万多方回应

极目新闻 2025-09-14 08:55:17
3980 跟贴 3980

西贝创始人贾国龙道歉：我应对方式有错，改！以后打明牌，向胖东来学习

西贝创始人贾国龙道歉：我应对方式有错，改！以后打明牌，向胖东来学习

红星新闻

2025-09-14 21:15:20

1小时爆卖230亿！李书福杭州湾库里南，一夜间血洗BBA

1小时爆卖230亿！李书福杭州湾库里南，一夜间血洗BBA

象视汽车

2025-09-14 07:00:13

68岁的国家一级演员杜源，最近因为应聘保安上了热搜

68岁的国家一级演员杜源，最近因为应聘保安上了热搜

小光侃娱乐

2025-09-12 18:15:08

以色列与西班牙爆发激烈外交冲突

以色列与西班牙爆发激烈外交冲突

参考消息

2025-09-14 11:56:11

何时开胡？红军1.16亿新援维尔茨英超踢了4场，现仍0球0助

何时开胡？红军1.16亿新援维尔茨英超踢了4场，现仍0球0助

直播吧

2025-09-14 23:13:11

贾国龙诉苦称西贝利润仅 5%，业内人士痛批：偷换概念，骗你为他高收入买单

贾国龙诉苦称西贝利润仅 5%，业内人士痛批：偷换概念，骗你为他高收入买单

西虹市闲话

2025-09-14 22:14:01

欧盟与俄罗斯都在加急，争抢购买中国同一关键物品，究竟是什么让他们如此着急？

欧盟与俄罗斯都在加急，争抢购买中国同一关键物品，究竟是什么让他们如此着急？

文雅笔墨

2025-09-14 19:31:37

还能撑几场？曼联开赛1胜1平3负，联赛杯出局&下场踢切尔西

还能撑几场？曼联开赛1胜1平3负，联赛杯出局&下场踢切尔西

雷速体育

2025-09-15 01:52:39

作家鲁班因胡可沙溢卖麻六记开骂张兰总，网友：麻六记招你惹你了

作家鲁班因胡可沙溢卖麻六记开骂张兰总，网友：麻六记招你惹你了

君笙的拂兮

2025-09-13 23:59:46

哪个瞬间你意识到一个人不能深交？网友：看得我心塞，你们真能忍

哪个瞬间你意识到一个人不能深交？网友：看得我心塞，你们真能忍

解读热点事件

2025-09-13 16:34:59

胡歌再次喜当爹，黄曦宁诞下二胎男孩，网友表示祝福！

胡歌再次喜当爹，黄曦宁诞下二胎男孩，网友表示祝福！

小小一米月儿

2025-09-14 02:20:03

妈妈亲手缝的NIKE书包火了！品牌留言要送礼物，当事人：已经联系礼物还未寄到

妈妈亲手缝的NIKE书包火了！品牌留言要送礼物，当事人：已经联系礼物还未寄到

现代快报

2025-09-14 15:13:20

库克谈iPhone 17 Pro首次引入VC均热板设计：我认为这算是苹果专属发明创新，或许只有苹果才能做到

库克谈iPhone 17 Pro首次引入VC均热板设计：我认为这算是苹果专属发明创新，或许只有苹果才能做到

FM93浙江交通之声

2025-09-14 12:55:53

于朦胧事件终于迎来阳光！嫌疑人被公司切割，多位公众人物发声！

于朦胧事件终于迎来阳光！嫌疑人被公司切割，多位公众人物发声！

花心电影

2025-09-14 16:38:05

结束二十年大巴黎生涯，金彭贝在自己的致敬仪式上泪流满面

结束二十年大巴黎生涯，金彭贝在自己的致敬仪式上泪流满面

懂球帝

2025-09-15 01:52:56

重磅消息！七国集团财政部长考虑对俄罗斯支持者征收关税！

重磅消息！七国集团财政部长考虑对俄罗斯支持者征收关税！

翻开历史和现实

2025-09-14 16:10:21

辽宁摄影金像奖获奖者李靖作品确定模仿抄袭！被收回相关荣誉

辽宁摄影金像奖获奖者李靖作品确定模仿抄袭！被收回相关荣誉

南方都市报

2025-09-14 10:27:06

西贝硬刚罗永浩，卫健委出手了！

西贝硬刚罗永浩，卫健委出手了！

梳子姐

2025-09-13 19:16:39

航班因天气原因备降太原引发乘客下跪求解决，海航回应

航班因天气原因备降太原引发乘客下跪求解决，海航回应

新京报

2025-09-14 21:24:07

吴京塌房，更多黑料被爆光，网友：这次，真的不忍了！

吴京塌房，更多黑料被爆光，网友：这次，真的不忍了！

犀利强哥

2025-09-14 06:58:42

AI产业主平台领航智能+时代

13445文章数 66149关注度

往期回顾全部

科技要闻

L3级车型要来了！辅助驾驶迎重大利好

头条要闻

罗永浩向贾国龙重新开战：我看你智力有问题不可救药

头条要闻

罗永浩向贾国龙重新开战：我看你智力有问题不可救药

体育要闻

利物浦1-0绝杀十人伯恩利萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚结束与老公5年婚姻

财经要闻

西贝贾国龙，“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

本地

旅游

时尚

公开课

亲子要闻

小学孩子记不住数学抽象概念咋办？幼儿园老师这招值得家长学习！

本地新闻

云游中国 | 草原驭秋风祁连山邂逅黑河源头

旅游要闻

热闻|清明假期将至，热门目的地有哪些?

听说现在年轻人的家都“歪七扭八”的？

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版