网易首页 > 网易号 > 正文 申请入驻

机器学习中的判别式模型和生成式模型

0
分享至

如今已经进入2020年了,5G的时代已经到来,而机器人应用将更加的广泛,下面就让我们去了解机器人在学习中的两类模型,这文章告诉两种类型的区别,推荐给对机器人感兴趣的朋友们阅读!

在机器学习中,对于有监督学习可以将其分为两类模型:判别式模型和生成式模型。简单地说,判别式模型是针对条件分布建模,而生成式模型则针对联合分布进行建模。

01 基本概念

假设我们有训练数据(X,Y),X是属性集合,Y是类别标记。这时来了一个新的样本样本 x ,我们想要预测它的类别y。

我们最终的目的是求得最大的条件概率 P(y|x)作为新样本的分类。

1. 判别式模型这么做

根据训练数据得到分类函数和分界面,比如说根据SVM模型得到一个分界面,然后直接计算条件概率 P(y|x),我们将最大的 P(y|x)。

作为新样本的分类。判别式模型是对条件概率建模,学习不同类别之间的最优边界,无法反映训练数据本身的特性,能力有限,其只能告诉我们分类的类别。

2. 生成式模型这么做

一般会对每一个类建立一个模型,有多少个类别,就建立多少个模型。比如说类别标签有{猫,狗,猪},那首先根据猫的特征学习出一个猫的模型,再根据狗的特征学习出狗的模型,之后分别计算新样本X跟三个类别的联合概率 P(y|x),然后根据贝叶斯公式:

分别计算 P(y|x),选择三类中最大的 P(y|x)作为样本的分类。

3.两个模型的小结

不管是生成式模型还是判别式模型,它们最终的判断依据都是条件概率 P(y|x),但是生成式模型先计算了联合概率P(x,y),再由贝叶斯公式计算得到条件概率。因此,生成式模型可以体现更多数据本身的分布信息,其普适性更广。

02 用例子说明概念 1. 山羊绵羊的例子

判别式模型:要确定一个羊是山羊还是绵羊,用判别式模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。

生成式模型:是根据山羊的特征首先学习出一个山羊的模型,然后根据绵羊的特征学习出一个绵羊的模型,然后从这只羊中提取特征,放到山羊模型中看概率是多少,再放到绵羊模型中看概率是多少,哪个大就是哪个。

2. 模型范例

假设现在有一个分类问题,X是特征,Y是类标记。用判别式模型学习一个条件概率分布 P(y|x),用生成式模型学习一个联合概率分布P(x,y)。

用一个简单的例子来说明这个问题。假设X就是两个特征(1或2),Y有两类(0或1),有如下训练样本(1,0)、(1,0)、(1,1)、(2,1)。

则学习到的条件概率分布(判别式模型)如下:

而学习到的联合概率分布(生成式模型)如下:

在实际分类问题中,判别式模型可以直接用来判断特征的类别情况;而生成式模型需要加上贝叶斯公式,然后应用到分类中。但是,生成式模型的概率分布可以有其他应用,就是说生成式模型更一般更普适。不过判别式模型更直接,更简单。两种方法目前交叉较多。由生成式模型可以得到判别式模型,但由判别式模型得不到生成式模型。

03 判别式模型和生成式模型的区别 1. 判别式模型和生成式模型的对比图

上图左边为判别式模型而右边为生成式模型,可以很清晰地看到差别,判别式模型是在寻找一个决策边界,通过该边界来将样本划分到对应类别。而生成式模型则不同,它学习了每个类别的边界,它包含了更多信息,可以用来生成样本。

2. 判别式模型和生成式模型的特点

判别式模型特点:

判别式模型直接学习决策函数Y=f(X),或者条件概率P(Y|X),不能反映训练数据本身的特性,但它寻找不同类别之间的最优分裂面,反映的是异类数据之间的差异,直接面对预测往往学习准确度更高。具体来说有以下特点:

  1. 对条件概率建模,学习不同类别之间的最优边界。
  2. 捕捉不同类别特征的差异信息,不学习本身分布信息,无法反应数据本身特性。
  3. 学习成本较低,需要的计算资源较少。
  4. 需要的样本数可以较少,少样本也能很好学习。
  5. 预测时拥有较好性能。
  6. 无法转换成生成式。

生成式模型的特点:

生成式模型学习的是联合概率密度分布P(X,Y),可以从统计的角度表示分布的情况,能够反映同类数据本身的相似度,它不关心到底划分不同类的边界在哪里。生成式模型的学习收敛速度更快,当样本容量增加时,学习到的模型可以更快的收敛到真实模型,当存在隐变量时,依旧可以用生成式模型,此时判别式方法就不行了。具体来说,有以下特点:

  1. 对联合概率建模,学习所有分类数据的分布。
  2. 学习到的数据本身信息更多,能反应数据本身特性。
  3. 学习成本较高,需要更多的计算资源。
  4. 需要的样本数更多,样本较少时学习效果较差。
  5. 推断时性能较差。
  6. 一定条件下能转换成判别式。

总之,判别式模型和生成式模型都是使后验概率最大化,判别式是直接对后验概率建模,而生成式模型通过贝叶斯定理这一“桥梁”使问题转化为求联合概率。

03 二者所包含的算法

原文作者:Microstrong

本文由 @Microstrong 授权发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳深夜无人车事件刷屏!终于明白,为什么很多人对印度人观感差

深圳深夜无人车事件刷屏!终于明白,为什么很多人对印度人观感差

笔墨V
2026-06-28 15:41:51
医生:希望你的血脂报告里,永远不要出现这3项异常

医生:希望你的血脂报告里,永远不要出现这3项异常

华庭讲美食
2026-06-23 16:28:06
沙特找中国,要签1.1万亿美元大单!中国基建将再度打造沙漠奇迹

沙特找中国,要签1.1万亿美元大单!中国基建将再度打造沙漠奇迹

有范又有料
2026-06-27 12:55:26
昔日6号秀遭放弃!魔术正式裁掉艾萨克 节省650万美元奢侈税

昔日6号秀遭放弃!魔术正式裁掉艾萨克 节省650万美元奢侈税

罗说NBA
2026-06-28 06:07:53
心理学:没有任何物种会因为“被养大”而终身服从,幼崽离巢时从不回头张望,进化论里最冰冷的底层代码,亲缘的尽头只写着两个字

心理学:没有任何物种会因为“被养大”而终身服从,幼崽离巢时从不回头张望,进化论里最冰冷的底层代码,亲缘的尽头只写着两个字

心理观察局
2026-06-26 07:26:06
保护东北虎50年,中俄东北虎数量差距断崖,俄罗斯700只,中国呢

保护东北虎50年,中俄东北虎数量差距断崖,俄罗斯700只,中国呢

掠影后有感
2026-06-15 09:45:27
梅西:我所获得的所有荣誉,都比不上和安东内拉相伴的时光!

梅西:我所获得的所有荣誉,都比不上和安东内拉相伴的时光!

可爱小菜
2026-06-28 15:03:05
毛岸英入朝作战牺牲,主要责任人是谁?毛主席其实早就点明过真相

毛岸英入朝作战牺牲,主要责任人是谁?毛主席其实早就点明过真相

听风行天涯
2026-06-25 17:37:54
斯基拉:切尔西和扎卡谈妥至2029年的合同,桑德兰要价4000万

斯基拉:切尔西和扎卡谈妥至2029年的合同,桑德兰要价4000万

懂球帝
2026-06-28 09:13:10
多辆“百吨王”在京新高速强行冲卡,当地:正在处理 大货车司机:该路段常见超载车辆

多辆“百吨王”在京新高速强行冲卡,当地:正在处理 大货车司机:该路段常见超载车辆

红星新闻
2026-06-28 11:49:17
莱因克尔恭喜凯恩:为你高兴,这个纪录我守了40年早就腻了

莱因克尔恭喜凯恩:为你高兴,这个纪录我守了40年早就腻了

懂球帝
2026-06-28 17:01:26
什么东西让你体会到贵有贵的道理?网友:买完之后真香了!

什么东西让你体会到贵有贵的道理?网友:买完之后真香了!

阿康四岁啦
2026-06-26 10:40:55
苏州市委常委、副市长施嘉泓,任姑苏区委书记

苏州市委常委、副市长施嘉泓,任姑苏区委书记

江南江南
2026-06-28 17:08:47
为什么一旦去了浙江打拼,不仅自己就连下一代也很难再回老家生活

为什么一旦去了浙江打拼,不仅自己就连下一代也很难再回老家生活

小鹿姐姐情感说
2026-06-28 08:36:02
三观不正的人有多么可怕,看网友讲述心底一阵恶寒。

三观不正的人有多么可怕,看网友讲述心底一阵恶寒。

侃神评故事
2026-06-23 16:15:05
世界杯加纳疑似放水坑韩国,戏剧性一夜引球迷争议

世界杯加纳疑似放水坑韩国,戏剧性一夜引球迷争议

领悟看世界
2026-06-28 11:17:26
真不好惹,最有可能扔核弹的,不是英美,也不是中俄,而是个小国

真不好惹,最有可能扔核弹的,不是英美,也不是中俄,而是个小国

史智文道
2026-06-28 19:11:41
医生发现:每天早起后先排便的人,用不了半年,身体迎来5大改变

医生发现:每天早起后先排便的人,用不了半年,身体迎来5大改变

任医生聊健康
2026-06-28 17:00:11
河南农村小伙娶美国女博士,婚后21年不工作,直言:这软饭吃定了

河南农村小伙娶美国女博士,婚后21年不工作,直言:这软饭吃定了

情感艺术家
2026-06-12 21:10:32
白玉兰奖落幕:3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

白玉兰奖落幕:3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

青梅侃史啊
2026-06-28 07:15:09
2026-06-28 22:15:00
人人都是产品经理社区 incentive-icons
人人都是产品经理社区
想要成为大牛先从学做产品开始
64848文章数 311631关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

C罗变了连续7场没过人 淘汰赛将对战老队友莫德里奇

头条要闻

C罗变了连续7场没过人 淘汰赛将对战老队友莫德里奇

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

亲子
艺术
游戏
教育
军事航空

亲子要闻

肠道真菌菌群紊乱增加儿童过敏风险

艺术要闻

23幅 张文惠风景油画选

《收获日2》迎底层大更新 容量从86GB降至32GB

教育要闻

教育哲学精品课,道家老子与庄子的教育思想

军事要闻

特朗普又发文威胁:伊朗将不复存在

无障碍浏览 进入关怀版