网易首页 > 网易号 > 正文 申请入驻

刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大

0
分享至


新智元报道

编辑:KingHZ 桃子

【新智元导读】新规第一天,DeepSeek第一时间站出来了!接下来,所有自家AI生成内容,统统标出「AI身份」。更劲爆的是,DeepSeek主动「交底」V3/R1的模型训练细节。

今天,网信办《人工智能生成合成内容标识办法》正式生效。

其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。

紧跟最新政策,DeepSeek出手了。

刚刚,DeepSeek官微发布了最新回应公告——凡是AI生成的内容,都会清楚标注「AI生成」。

它还郑重提醒,用户严禁恶意删除、篡改、隐匿标识,更别提用AI传播、制作虚假信息。


此外,这次还发布了《模型原理与训练方法说明》,可以一瞥DeepSeek的技术路径。

接下来,深扒一下DeepSeek V3/R1的一些训练细节。


传送门:https://cdn.deepseek.com/policies/zh-CN/model-algorithm-disclosure.html

回应新要求,DeepSeek公开技术说明

DeepSeek主要介绍了大模型的训练和推理阶段,包括预训练、优化训练(微调)以及训练数据等。


不同大模型的神经网络架构

模型训练

模型训练阶段即模型的开发阶段:通过设计好的深度神经网络架构和训练方法,开发人员开发出可被部署使用的模型。

模型由多层神经网络组成,不同的架构直接影响模型的性能。此外,模型性能也受参数规模的制约,而训练的目的就是找到具体的参数值。


目前,大模型的参数规模数以亿计。最新的DeepSeek-V3-0324,参数总量为6850亿。

在训练过程中,这些参数通过梯度下降算法迭代优化。


这次,DeepSeek把模型训练分为预训练优化训练两个环节。

预训练:预训练目标是通过数据训练模型,使模型掌握通用的语言理解与生成能力。

优化训练:也称为微调,是在预训练模型的基础上通过特定任务的数据进一步调整模型参数,使模型适应实际应用场景。

在预训练阶段,模型通过大规模自监督学习,从文本数据中学习语言模式与知识关联。预训练完成后,模型能理解并生成连贯的文本,但还不会精准地回答问题或执行任务,因此需要进一步的训练微调。

在优化训练阶段,模型一般通过SFT、RL等方法,学会根据指令回答问题,符合人类的偏好和需求,并激发在特定领域的专业能力。


经过优化训练的模型能更好地满足实际需求,可被部署使用。

深挖训练「内幕」,炼出最强大脑

DeepSeek模型的能力,是建立在高质量、大规模、多样化的数据之上。

在「预训练阶段」和「优化训练阶段」,各有不同。

预训练阶段

在预训练阶段,主要使用了两类数据:

互联网公开可用的信息,比如网页、公开文档等。

与第三方合作获取许可的数据

需要强调的是,在此阶段,根本无需获取个人信息用于训练,DeepSeek不会有意关联至任何特定账户和个人,更不会主动将其用于训练模型。

不过,预训练数据规模过于庞大,可能偶然包含了一些个人信息。

对此,DeepSeek会通过技术手段,尽力筛查并移除这些信息,确保数据「干干净净」。

为了保证数据质量、安全、多样,他们还打造了一套硬核数据治理流程——

首先,通过「过滤器」自动剔除仇恨言论、色情低俗、暴力、垃圾信息,以及可能侵权的原始数据。

其次,通过算法+人工审核,识别并降低数据中的统计性偏见,让模型更公平、更客观。

优化训练阶段

到了优化训练阶段,一般需要通过人工或自动化的方式构造、标注一批问答对数据来对模型进行训练。

DeepSeek这次表示:这些问答对数据是由研究团队生成提供的,其中少部分数据的构造可能会基于用户的输入


在DeepSeek-R1训练中,研究人员直接提示模型生成包含反思和验证的详细答案;收集并整理DeepSeek-R1-Zero的输出,使其具有可读性;以及通过人工注释者的后期处理来提高数据质量

如涉及利用用户的输入构造训练数据,DeepSeek会对数据进行安全加密技术处理、严格的去标识化和匿名化处理,从而尽可能避免训练数据关联到任何特定个人,且不会在模型给其他用户的输出中带有个人信息,更不会将其用于用户画像或个性化推荐。

同时,DeepSeek为用户提供了选择退出的权利。

为了确保模型的安全性,在模型优化训练阶段,DeepSeek构造了专门的安全数据对模型进行安全对齐,教会模型的回复符合人类的价值观,增强模型内生的安全能力。

模型推理

模型的推理阶段即模型被部署提供服务。

模型训练完成并被部署后,可以通过对输入信息进行编码和计算来预测下一个token,从而具备文本生成和对话等能力。

部署后的模型能够熟练执行基于文本生成的广泛多样的任务,并可以集成到各种下游系统或应用中。

具体到DeepSeek的产品服务,基于用户的输入,模型采用自回归生成方式,基于输入的上下文内容,通过概率计算预测最可能的接续词汇序列。


推理完成后,模型输出相应的内容作为响应,包括文字、表格和代码等。

此并非简单检索或「复制粘贴」训练数据中的原始文本,模型也并未存储用于训练的原始文本数据副本,而是基于对语言结构和语义关系的深度理解,动态生成符合语境的回答。

DeepSeek这次还强调模型开源。

我们通过开源平台对外公开发布了所有模型的权重、参数以及推理工具代码等,并采用宽松的MIT协议,供使用者自由、免费下载部署使用。

同时,DeepSeek发布各模型的完整技术报告,供社区和研究人员参考,并帮助公众更深入地了解每个模型的技术原理和细节。

LLM致命幻觉,全周期硬核对抗

毋庸置疑,当前AI发展还在早期阶段,存在无法避免的局限性。

若是再被加以滥用,将会带来严重的后果。

局限性

AI往往会生成错误、遗漏,或不符合事实的内容,这种现象统一称之为「幻觉」。

这个问题,是整个AI行业面临的挑战。

对此,DeepSeek正通过一些技术手段降低幻觉率,包括高质量的训练数据、优化对齐策略、RAG等,但现阶段依无法完全消灭。

同时,他们还在欢迎页、生成文本的末尾,以及交互界面底部,添加显著的提示标识。

特别提醒用户——内容由人工智能生成,可能不准确。

因此,AI生成的内容仅供参考,所有人不应将输出的内容作为专业建议。

尤其是,在医疗、法律、金融等专业领域,DeepSeek不提供任何建议或承诺,专业的事儿还得找专业的人。


滥用风险

AI技术本身是中立的,但滥用可能带来隐私保护、版权、数据安全、内容安全、偏见歧视等风险。

DeepSeek对此也是高度重视,采取了一系列硬核措施,贯穿了模型研发、训练、部署的全生命周期。

制定内部风险管理制度

开展模型安全性评估

进行红队测试

增强模型和服务透明度等

更重要的是,DeepSeek还赋予了用户知情权、选择权、控制权——

你可以查询服务的基本信息、拒绝其数据用于模型训练、删除其历史数据等。

参考资料:

https://cdn.deepseek.com/policies/zh-CN/model-algorithm-disclosure.html


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西媒:亚马尔父亲疑似订婚 女方仅比亚马尔大5岁

西媒:亚马尔父亲疑似订婚 女方仅比亚马尔大5岁

搜狐体育
2025-11-05 14:41:26
美媒模拟交易方案:火箭队送走双控卫+首轮,冠军后卫联手杜兰特

美媒模拟交易方案:火箭队送走双控卫+首轮,冠军后卫联手杜兰特

熊哥爱篮球
2025-11-06 00:22:01
对决地下高炮,撸贷大军上演“黑吃黑”

对决地下高炮,撸贷大军上演“黑吃黑”

柒财经
2025-11-05 11:34:51
小米“先收钱后造车”引众怒!20万订单压垮产能,律师:涉嫌欺诈

小米“先收钱后造车”引众怒!20万订单压垮产能,律师:涉嫌欺诈

吃瓜局
2025-11-05 15:25:33
两场6-1!国锦赛首场8强对阵出炉:赵心童VS塞尔比,具体时间如下

两场6-1!国锦赛首场8强对阵出炉:赵心童VS塞尔比,具体时间如下

球场没跑道
2025-11-05 16:51:50
全中国最大的骗局,竟然是茅台专卖店,一瓶飞天都不卖年收入过亿

全中国最大的骗局,竟然是茅台专卖店,一瓶飞天都不卖年收入过亿

好贤观史记
2025-11-05 09:54:41
哇太漂亮了,俄罗斯顶级女神,五官绝美,完全符合东方的审美

哇太漂亮了,俄罗斯顶级女神,五官绝美,完全符合东方的审美

陈意小可爱
2025-10-11 15:05:05
你无意中看见哪些不可见人的事?网友:成年人的世界都这么污吗

你无意中看见哪些不可见人的事?网友:成年人的世界都这么污吗

带你感受人间冷暖
2025-11-04 00:15:08
乌军反击红军城:16000士兵与260辆战车的绝命一战!

乌军反击红军城:16000士兵与260辆战车的绝命一战!

世界探索者探索
2025-11-05 23:17:14
初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

悬案解密档案
2025-10-21 09:24:49
为什么电影里很多黑帮老大坚决不做毒品生意?网友评论引万千共鸣

为什么电影里很多黑帮老大坚决不做毒品生意?网友评论引万千共鸣

小椰的奶奶
2025-10-27 02:51:34
她是高鑫夫妇的女儿,不拍广告不进娱乐圈,读上海重点高中是学霸

她是高鑫夫妇的女儿,不拍广告不进娱乐圈,读上海重点高中是学霸

仙味少女心
2025-11-05 06:29:43
你做过最疯狂的事是什么?网友:在公园亲了一小时

你做过最疯狂的事是什么?网友:在公园亲了一小时

解读热点事件
2025-10-11 00:20:03
湖南前主持田源,直播间哭诉:维嘉能回去,求求前东家也让我回去

湖南前主持田源,直播间哭诉:维嘉能回去,求求前东家也让我回去

乐悠悠娱乐
2025-11-05 10:38:51
当年签下“买断工龄”协议的职工,现在终于等来了法律正名!

当年签下“买断工龄”协议的职工,现在终于等来了法律正名!

阿燕姐说育儿
2025-11-05 07:20:03
湖南某三甲医院美女眼科主任与副院长的瓜

湖南某三甲医院美女眼科主任与副院长的瓜

笔杆论道
2025-11-05 22:02:55
已冻结阿布24万镑3年!英政府震怒:他有15亿贷款 剩余9亿需捐出

已冻结阿布24万镑3年!英政府震怒:他有15亿贷款 剩余9亿需捐出

风过乡
2025-11-04 21:14:31
A股:不必再等了,涨到3969,明天周四,熟悉的剧情又要上演了?

A股:不必再等了,涨到3969,明天周四,熟悉的剧情又要上演了?

云鹏叙事
2025-11-05 16:17:32
一位资深地产大佬对于万科现状的解读(1)

一位资深地产大佬对于万科现状的解读(1)

科学发掘
2025-11-05 11:47:58
乌克兰撑不住了,向全世界求救,特朗普不想管,欧盟只有口头支票

乌克兰撑不住了,向全世界求救,特朗普不想管,欧盟只有口头支票

肖兹探秘说
2025-11-06 00:00:43
2025-11-06 00:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13794文章数 66238关注度
往期回顾 全部

科技要闻

大转弯!特朗普再提名马斯克盟友任NASA局长

头条要闻

丈夫突然病亡2天后妻子也离世留下一儿一女 妹妹发声

头条要闻

丈夫突然病亡2天后妻子也离世留下一儿一女 妹妹发声

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

港星林尚武突发心脏病去世

财经要闻

事关加快建设金融强国 中央金融办发声

汽车要闻

智己LS9入局"9系"混战 全尺寸SUV市场迎来新变量

态度原创

房产
手机
旅游
健康
军事航空

房产要闻

最新!海南楼市10月热销榜单出炉!

手机要闻

苹果Shazam更新26.0版:液态玻璃界面焕新登场

旅游要闻

立冬将至 秋韵未央

超声探头会加重受伤情况吗?

军事要闻

美国“福特”号航母驶往加勒比海

无障碍浏览 进入关怀版