网易首页 > 网易号 > 正文 申请入驻

2018年你应该知道的十大机器学习算法

0
分享至

本文简要介绍一些最常用的机器学习算法,没有代码,没有抽象理论,只有图片和一些如何使用它们的例子。

本文涵盖的算法列表包括:

  • 决策树
  • 随机森林
  • 逻辑回归
  • 支持向量机
  • 朴素贝叶斯
  • k-最近邻
  • k-均值
  • Adaboost
  • 神经网络
  • Markov

1.决策树

使用某些属性将一组数据分类为不同的组中,在每个节点上执行测试,通过brach判断,进一步将数据拆分两个不同的组,此次等等。测试是基于现有的数据进行的,当添加新数据时,可以将其分类为相应的组。

根据某些特征对数据进行分类,每当过程进入下一步时,就会有一个判断分支,并且判断将数据分为两部分,然后过程继续。当对现有数据进行测试时,新数据可以通过现有数据了解这些问题,当有新的数据出现时,计算机可以将数据归类到正确的分支中。

2.随机森林

从原始数据中随机选择,并形成不同的子集。

矩阵S是原始数据,它包含1-N数据行,而A,B,C是特征,最后一个C代表类别。

从S中创建随机子集,假设我们有M组子集。

我们从这些子集得到M组决策树:将新的数据放入这些树中,我们可以得到M组的结果,并且我们计算出在所有M组中哪个结果是最多的,我们可以把这看作是最终结果。

3.逻辑回归

当预测目标的概率大于0且小于或等于1时,简单的线性模型不能满足预测目标的概率。因为当定义的域不在一定级别时,范围将超过指定的间隔。

我们最好使用这种模型。

那么我们如何得到这个模型呢?

这个模型需要满足两个条件:“大于或等于0”,“小于或等于1”。

我们变换公式,得到逻辑回归模型:

通过计算原始数据,我们可以得到相应的系数。
我们得到逻辑模型图:

4.支持向量机

为了将这两个类从超平面中分离出来,最好的选择是在两个类中最大限度地保留最大边距的超平面。因为Z2>Z1,所以绿色的更好。

使用线性方程表示超平面,线上方的类大于或等于1,另一个类小于或等于-1。

利用图中的方程计算出点到曲面之间的距离:

所以我们得到了下面的总边际的表达式,目的是最大化边际,我们需要做的是最小化分母:

例如,我们用3个点来找到最优的超平面,定义权向量=(2,3)- (1,1):

并获得权重向量(a,2a),将这两个点代入方程:

当a被确认时,使用(a,2a)的结果为支持向量,代入a和w0的方程为支持向量机。

5.朴素贝叶斯

下面是NLP的一个例子:给出一段文字,检查文本的态度是积极的还是消极的,

为了解决这个问题,我们只能看一些单词:

而这些话,只会代表一些单词和它们的数量:

原来的问题是:给你一个句子,它属于哪一类?

通过使用贝叶斯规则,这将是一个简单的问题。

问题是,在这个课堂上,这个句子出现的概率是多少?记住不要忘记方程中的其它两个概率。

例如:“爱”一词的出现概率在正类中为0.1,在负类中为0.001。

6.k-最近邻

当出现一个新的数据时,哪个类别有最接近它的点,它属于哪个类别。

例如:为了区分“狗”和“猫”,我们从“爪子”和“声音”两个特征来判断。圆圈和三角形是已知的类别,“星星”代表疑问:

当K = 3时,这三条线连接最近的3个点,圆圈更多,所以“星”属于“猫”。

7.k-均值

将数据分为3类,粉色部分最大,黄色最小。

选择3、2、1作为默认值,并计算其余数据与默认值之间的距离,并将其分类为具有最短距离的类。

分类后,计算每个类的方法,并将其设置为新中心。

经过几轮之后,我们可以在类不再更改时停止。

8.Adaboost

Adaboost是提高的一种方法。

促进是收集没有得到满意结果的分类器,并生成一个可能具有更好效果的分类器。

如下图所示,树1和树2分别没有好的效果,但是如果我们输入相同的数据,并对结果进行总结,最终的结果会更有说服力。

以adaboost为例,在手写识别中,面板可以提取许多特征,例如开始方向,起点和终点之间的距离等。

在训练机器时,它会得到每个特征的重量,比如2和3,它们的起始点非常相似,所以这个特征对分类没有什么影响,因此它的重量很小。

但是这个角度有很大的可识别性,所以这个特征的重量是很大的。最后的结果将是考虑所有这些特性的结果。

9.神经网络

在NN中,输入可能会被至少分成两个类。

神经网络是由网络和网络连接形成的。

第一层是输入层,最后一层是输出层。

在隐藏层和输出层中,它们都有自己的分类器。

当输入进入网络并被激活时,计算得分将传递到下一层。输出层显示的分数是每个班级的分数。下面的例子得到第1类的结果:

传递给不同节点的相同输入产生不同的分数,这是因为在每个节点中,它具有不同的权重和偏差,这是传播。

10.马尔可夫链

马尔可夫链由状态和转换组成。

例如,基于“快速的棕色狐狸跳过懒狗”获得马尔可夫链。

首先,我们需要将每个单词设置在一个状态下,并且我们需要计算状态转换的概率。

这些是由一个句子计算出来的概率。当你使用大量的文本数据来训练计算机时,你会得到一个更大的状态转换矩阵,比如可以跟随“the”的单词,以及它们对应的概率。

本文为编译作品,转载请注明出处。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

青烟小先生
2026-01-31 19:10:22
史诗级封杀!2000万网红“听风的蚕”彻底凉了

史诗级封杀!2000万网红“听风的蚕”彻底凉了

互联网品牌官
2026-02-12 01:17:23
希金斯:比赛最后走势不可思议,关键时刻我进入了专注境界

希金斯:比赛最后走势不可思议,关键时刻我进入了专注境界

画夕
2026-02-22 12:57:11
“网友把网红同款买回家后……”哈哈哈哈哈哈到底是哪里出问题了!!

“网友把网红同款买回家后……”哈哈哈哈哈哈到底是哪里出问题了!!

脆皮先生
2026-02-22 19:36:40
深夜十点!宏远陈老板约谈杜锋,徐杰离开国家队,贝兹利官宣回归

深夜十点!宏远陈老板约谈杜锋,徐杰离开国家队,贝兹利官宣回归

多特体育说
2026-02-22 21:52:55
美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

蜉蝣说
2025-12-01 11:20:58
沙尘暴席卷华北多地:北京、大同、石家庄等机场多个航班延误;众多景区关闭,山西悬空寺有商户商品被风吹跑

沙尘暴席卷华北多地:北京、大同、石家庄等机场多个航班延误;众多景区关闭,山西悬空寺有商户商品被风吹跑

大风新闻
2026-02-22 08:56:04
厚黑:一种有重量的温柔

厚黑:一种有重量的温柔

疾跑的小蜗牛
2026-02-22 21:18:17
“穷就别硬装了!”一家三口吃火锅花了217元,父亲心疼钱被群嘲

“穷就别硬装了!”一家三口吃火锅花了217元,父亲心疼钱被群嘲

妍妍教育日记
2025-11-18 19:53:15
0射门0助攻0过人,19次丢失球权被换,敢硬刚克洛普的萨拉赫笑了

0射门0助攻0过人,19次丢失球权被换,敢硬刚克洛普的萨拉赫笑了

夏侯看英超
2026-02-23 01:50:42
“中产阶级”及格线诞生!全国只有3320万户,你达标了吗?

“中产阶级”及格线诞生!全国只有3320万户,你达标了吗?

李云飞Afey
2026-01-01 12:52:31
6600万,再见火箭!管理层续约太着急了,杜兰特难在休城取得成功

6600万,再见火箭!管理层续约太着急了,杜兰特难在休城取得成功

呆哥聊球
2026-02-22 21:25:55
中国小伙在韩国租女友,2000块一天陪吃陪玩,分手时小伙依依不舍

中国小伙在韩国租女友,2000块一天陪吃陪玩,分手时小伙依依不舍

胡一舸南游y
2026-02-11 13:49:10
史上最乱伦成语“上蒸下报”

史上最乱伦成语“上蒸下报”

华人星光
2026-02-21 11:24:05
欠债22亿,内娱巨头没招了

欠债22亿,内娱巨头没招了

最人物
2026-01-12 15:08:23
国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

南权先生
2026-02-12 15:38:28
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
刷屏!无锡“梅王”开花,荣智健先生现身梅园

刷屏!无锡“梅王”开花,荣智健先生现身梅园

江南晚报
2026-02-22 18:03:47
奇才为内线新星送出3年长约,这次他会在球队中站稳脚跟吗?

奇才为内线新星送出3年长约,这次他会在球队中站稳脚跟吗?

稻谷与小麦
2026-02-23 01:44:37
记录报:普雷斯蒂亚尼已向本菲卡全队道歉,家人遭死亡威胁

记录报:普雷斯蒂亚尼已向本菲卡全队道歉,家人遭死亡威胁

砚底沉香
2026-02-23 05:22:56
2026-02-23 05:59:00
AiTechYun
AiTechYun
专注于人工智能
101文章数 79关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

男子持霰弹枪燃烧罐闯特朗普私宅被击毙 细节披露

头条要闻

男子持霰弹枪燃烧罐闯特朗普私宅被击毙 细节披露

体育要闻

谷爱凌:6次参赛6次夺牌 我对自己非常自豪

娱乐要闻

谷爱凌:真正的强大 敢接纳生命的节奏

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

艺术
房产
教育
数码
本地

艺术要闻

十大名家画春,送给春天的你!

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

教育要闻

计算机专业竞争激烈?桂电计算机学院超高就业率!

数码要闻

古尔曼:苹果3月2 - 4日发布“至少五款产品”

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

无障碍浏览 进入关怀版