网易首页 > 网易号 > 正文 申请入驻

相关性分析的形式和正态分布检测的方法

0
分享至

变量相关的不同形式

变量分三种,计量(数值变量、连续变量、定距变量等不同叫法)、等级(有序)和计数(分类、名义),因此变量的相关就有不同的形式。

一、两个计量资料之间的相关

(一)pearson相关:必须双变量符合正态分布

(二)Spearman相关:双变量不符合正态分布或者一个不符合正态分布、或者分布不清资料。对于服从Pearson相关系数的数据也可以计算Spearman相关系数,但统计效能比Pearson相关系数要低一些(不容易检测出两者事实上存在的相关关系)。

二、两个等级资料之间相关

(一)Spearman相关

(二)对于行和列都包含已排序值的表,请选择伽玛(对于 2 阶表,为零阶;对于 3 阶到 10 阶表,为条件)、Kendall 的 tau-b 和Kendall 的 tau-c。要根据行类别预测列类别,请选择 Somers 的 d。

(1)伽玛 (Gamma). 两个有序变量之间的对称相关性测量,它的范围是从 -1 到 1。绝对值接近 1 的值表示两个变量之间存在紧密的关系。接近 0 的值表示关系较弱或者没有关系。对于双向表,显示零阶伽玛。对于三阶表到 n 阶表,显示条件伽玛。

(2)Somers' d. 两个有序变量之间相关性测量,它的范围是从 -1 到 1。绝对值接近 1 的值表示两个变量之间存在紧密的关系,值接近 0 则表示两个变量之间关系很弱或没有关系。Somers 的 d 是伽玛的不对称扩展,不同之处仅在于它包含了未约束到自变量上的成对的数目。还将计算此统计的对称版本。

(3)Kendall 的 tau-b (Kendall's tau-b). 将结考虑在内的有序变量或排序变量的非参数相关性测量。系数的符号指示关系的方向,绝对值指示强度,绝对值越大则表示关系强度越高。可能的取值范围是从 -1 到 1,但 -1 或 +1 值只能从正方表中取得。

(4)Kendall's tau-c (Kendall's tau-c). 忽略结的有序变量的非参数相关性测量。系数的符号指示关系的方向,绝对值指示强度,绝对值越大则表示关系强度越高。可能的取值范围是从 -1 到 1,但 -1 或 +1 值只能从正方表中取得。

三、两个分类变量之间的相关

(一)列联系数(contingency coefficient):等于卡方/(卡方+n),其值介于0-1之间,越大说明相关性越强。

(二)Phi and Cramers V:phi等于卡方/N,越大说明相关性越强,Cramers V是Phi的一个调整,绝对值越大,说明相关性越强。

(三)lamda系数:

用于反映自变量对因变量的预测效果,即知道自变量取值时对因变量的预测有多少改进,或者说知道自变量的取值时期望预测误差个数减少的比例,Lambda将误差定义为列(行)变量预测时的错误,其预测值是基于个体所在行(列)的众数。值为 1时表明知道了自变量就可以完全确定因变量取值,为 0时表明自变量对因变量完全无预测作用。

(四)不确定系数:

其值介于 0~1之间,和 lambda类似,也用于反映当知道自变量后,因变量的不确定性下降了多少(比例),只是在误差的定义上稍有差异。以熵为不确定性大小的度量指标,共会输出行变量为自变量、列变量为自变量、对称不确定系数三个结果,后者为前两者的对称平均指标。

四、分类变量与数值变量相关

希望测量一个名义变量和连续变量间的相关程度时,还可以使用一个叫做 Eta的指标,它所对应的问题以前是用方差分析来解决的。实际上, Eta的平方表示

由组间差异所解释的因变量的方差的比例,即 ss组间/ss总。范围在 0 到 1 之间的相关性测量,其中 0 值表示行变量和列变量之间无相关性,接近 1 的值表示高度相关。Eta 适用于在区间刻度上度量的因变量(例如收入)以及具有有限类别的自变量(例如性别)。计算两个 eta 值:一个将行变量视为区间变量,另一个将列变量视为区间变量。

貌似已经结束了,别急,还有呢?

五、偏相关(Partial correlation)

当我们处理X和Y之间的相关性,可是Z与X和Y都有密切相关,因此Z的存在会影响X和Y之间真实的相关性,因此,需要控制Z后,研究X和Y之间的相关性。因此偏相关又叫做净相关。Z可能为X和Y的共同因素或者中介因素。偏相关为下图中A的部分。

六、部分相关(Part correlation)

有的时候,研究者想知道当去除了第三变量Z在X和Y变量中的效应后,两个变量X和Y之间的相关,在这种情况下,当用X来解释Y时,我们仅将Z从X中去除,而保持Y的“完整性”,在从X中去除Z后,"完整的"Y因变量和自变量X残差之间的相关,称为控制Z后的X和Y之间的部分相关。

如下图,Y为完整的,X中去除了Z。

松哥,结束了吗???? 别急,还有呢!!!

七、典型相关(canonical correlation analysis)


当我们处理资料为两组资料之间的相关性时,就不能采用上面的相关性分析了,如一个班级学生的身体健康资料(身高、体重)与考试成绩(语文、数学、外语)之间的相关性,此时就是两组资料之间的相关性,应该采用典型相关分析。

八、距离相关(Distance correlation)

距离相关时用于计算数值变量之间的距离相关性,通常不单独分析,一般为聚类分析或者因子分析的中间过程。 Distinces过程就可以用于计算记录(或变量)间的距离(或相似程度),根据变量的不同类型,可以有许多距离、相似程度测量指标供用户选择。但由于本模块只是一个预分析的过程,因此距离分析并不会给出常用的p值,而只给出各变量/记录之间的距离大小,以供用户自行进行判断相似性。

这么多啊!!!!!!!!!在哪算呀??

呵呵,品种确实不少,SPSS中通常如下几个地方可以计算

1、交叉表

下图中的相关系数,前面都介绍过了哦!

2、分析—相关

包括了双变量(Pearson、Spearman和Kendall)、偏相关、距离相关,还有典型相关(注典型相关以前小编都是通过编程实现的,可费劲了,SPSS23已经加载进菜单了,赞一个!!)

3、部分相关在哪算呢?

看下图的标题,知道了吧!算出结果是这样的!

上图中零阶表示pearson相关,偏就是偏相关(1阶相关),部分就是部分相关的意思呢!

判定数据正态分布的方法

方法一:直方图分布形态判断法

(直方图SPSS至少5种操作方法,此处演示1种)

案例:某高校随机抽取600人,测得身高和体重,现做体重的直方图。

1.SPSS菜单-图形-直方图。如下:

方法二:SPSS-菜单-分析-描述-探索

松哥:此种方法很重要,里面会有很多种结果哦,有图有指标!

案例同上:还做体重

1.SPSS菜单-分析-描述-探索。如下:


(如果勾选上方直方图,将再次画直方图)

2.结果

2.1P-P图

2.2Q-Q图


2.3箱式图

2.4茎叶图

解读:茎叶图现在基本很少用啦!其命名似乎是根据形态,如果整个图逆时针转90度,不就是变相的直方图吗?也是反映分布形态的,但信息含量远大于直方图,大家请看倒数第二行,我解读一下,最左边的7是指右边的小数点后面有7个数字,发现4444555,确实7个。7.是茎,4444555是7个树叶,最后一行主干宽度是10,意味上面数字得放大10倍,意思是有4个74。3个75。就这样解读的。

解读:SPSS此处提供了两种检验,D检验和W检验。本例两种检验得到的P值均小于0.05,因此认为不符合正态分布。但是也会出现D检验和W检验不一致的情况,此时如何选择以前文章发过,此处不赘述!

峰度系数是用于判定分布是不是太尖或太平;偏度系数用于判定偏左还是偏右,这点很容易理解!如下图

本例的分析结果见下表,红色框中分别为峰度系数和偏度系数及其各自的标准误差;那么如何判断呢,比如看偏度判断=0.908/0.101约等于9,如果此值的绝对值大于1.96就认为偏,因为此处是正值,因此为正偏态(右偏态);峰度系数判断方法同样,正值为尖峭峰,负值为平阔峰。

解读:大家看下图,均值、中位数与众数在三种分布的关系如下,如果三者偏差太大,一般不可能符合正态分布。

一般正态分布的标准差不会大于均值的1/3,这是目测判断法哦,最终还是要经过检验,但如果标准差都大于均数,一般不太可能正态分布。

方法三:SPSS-菜单-非参数

1.案例数据依旧同上。现在采用非参数的方法。SPSS-分析-非参数-单个样本K-S检验,弹出下图:

解读:单样本K-S检验可以验证四种分布,本例选择的是正态分布验证,非参数检验结果一般比较简单,大家看最后的P值=0.000<0.05。因此,不符合正态分布哦!

注:来源于 精鼎数据分析联盟

《计量经济圈Membership》

最新获计量经济圈Membership成员:

“11mg”,“王夫子”,“宇”

恭喜进入圈友们。

在后面:各位圈友,咱们的计量经济圈社群里面资料和计量咨询都很多,希望大家能够积极加入咱们这个大家庭戳这里),进去之后一定要看“群公告”,不然接收不了群信息。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大脚击中海鸥的门将:当时感觉糟透了,但救活它让我们很欣慰

大脚击中海鸥的门将:当时感觉糟透了,但救活它让我们很欣慰

懂球帝
2026-03-10 17:34:28
资本让老头老太太连垃圾都捡不了!武汉部分小区,惊现废品回收机

资本让老头老太太连垃圾都捡不了!武汉部分小区,惊现废品回收机

火山詩话
2026-03-11 14:33:00
我调到县财政局工作后,局长打我的主意,有一天我哥调任纪委书记

我调到县财政局工作后,局长打我的主意,有一天我哥调任纪委书记

刺头体育
2026-03-11 07:19:03
恩里克:首夺欧冠冠军比再拿一次难;罗塞尼尔的战术很有特点

恩里克:首夺欧冠冠军比再拿一次难;罗塞尼尔的战术很有特点

懂球帝
2026-03-11 02:26:24
不是那个年代的,你真看不懂

不是那个年代的,你真看不懂

深度报
2026-02-15 23:01:53
2026年“电车”新排名:海豚第7,理想i6第4,第一名月销27362辆

2026年“电车”新排名:海豚第7,理想i6第4,第一名月销27362辆

柳先说
2026-03-11 16:28:05
女孩相亲被约挖野菜后续!男方独吞野菜还炫耀,母亲受牵连

女孩相亲被约挖野菜后续!男方独吞野菜还炫耀,母亲受牵连

天天热点见闻
2026-03-11 08:00:16
TVB前“咪神”大婚惊艳四座,这胸围是真实存在的吗?

TVB前“咪神”大婚惊艳四座,这胸围是真实存在的吗?

娱乐领航家
2026-03-09 21:30:03
癌细胞最爱的5大食物,很多人天天吃!医生提醒:再馋也要管住嘴

癌细胞最爱的5大食物,很多人天天吃!医生提醒:再馋也要管住嘴

孟大夫之家1
2026-02-23 18:33:03
从烂片王到爆款预定,黄子华的逆天编年史

从烂片王到爆款预定,黄子华的逆天编年史

北戴河桃罐头厂电影修士会
2026-03-11 14:04:20
中国人不买了?销量暴跌、闭店裁员,究竟是谁“打败”了保时捷?

中国人不买了?销量暴跌、闭店裁员,究竟是谁“打败”了保时捷?

小兰聊历史
2026-03-11 16:31:34
美伊大战打醒韩国: 李在明第一次说如此掏心窝的话,对中国太有利

美伊大战打醒韩国: 李在明第一次说如此掏心窝的话,对中国太有利

阿芒娱乐说
2026-03-10 19:34:01
美军印太司令:再遭中国拦截就采取行动,中国军队需要提前防范

美军印太司令:再遭中国拦截就采取行动,中国军队需要提前防范

纪中百大事
2026-03-09 10:00:26
江苏放大招!脑机接口迎政策利好 9只概念股业绩有望高增长

江苏放大招!脑机接口迎政策利好 9只概念股业绩有望高增长

新浪财经
2026-03-11 08:58:30
德转列意甲剩余10轮各队对手平均排名:尤文难度最低,国米第6

德转列意甲剩余10轮各队对手平均排名:尤文难度最低,国米第6

懂球帝
2026-03-11 12:12:18
两架无人机坠落迪拜国际机场附近致4人受伤

两架无人机坠落迪拜国际机场附近致4人受伤

新华社
2026-03-11 16:25:02
WTT重庆冠军赛最新战报:国乒2胜2负!王曼昱惨败,日本3胜1负

WTT重庆冠军赛最新战报:国乒2胜2负!王曼昱惨败,日本3胜1负

往史过眼云烟
2026-03-11 09:45:15
未来10年,真正的“铁饭碗”来了!这8个行业,只涨不跌!

未来10年,真正的“铁饭碗”来了!这8个行业,只涨不跌!

老特有话说
2026-03-08 15:31:39
伊朗总统之子称最高领袖穆杰塔巴·哈梅内伊“平安”;此前在被炸医院举行新闻发布会,伊朗方称其会发表讲话

伊朗总统之子称最高领袖穆杰塔巴·哈梅内伊“平安”;此前在被炸医院举行新闻发布会,伊朗方称其会发表讲话

芒果都市
2026-03-11 15:21:20
乔冠华后人现状:儿子子承父业,女儿成军医,继女名字家喻户晓

乔冠华后人现状:儿子子承父业,女儿成军医,继女名字家喻户晓

林雁飞
2026-02-14 18:52:26
2026-03-11 17:15:00
计量经济圈
计量经济圈
经济、金融等相关问题
338文章数 155关注度
往期回顾 全部

头条要闻

博纳影业于冬被澳门永利追讨473万港元 起诉书披露

头条要闻

博纳影业于冬被澳门永利追讨473万港元 起诉书披露

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

杨幂连续五年为刘诗诗庆生,刘诗诗回应

财经要闻

油价大转头?一天,从末日到曙光!

科技要闻

腾讯急了急了,微信绝密AI智能体首度曝光

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

手机
艺术
家居
旅游
军事航空

手机要闻

消息称iPhone 18 Pro系列或复用前代模具,屏下Face ID延期至下代

艺术要闻

这组剪纸太美了!

家居要闻

中式风格 人间朝与暮

旅游要闻

“税动力”激活云南入境游发展新引擎

军事要闻

朝鲜"崔贤"号驱逐舰进行战略巡航导弹试射

无障碍浏览 进入关怀版