网易首页 > 网易号 > 正文 申请入驻

数据分享|R语言、SPSS基于主成分PCA的中国城镇居民消费结构研究可视化分析

0
分享至

全文链接:http://tecdat.cn/?p=31563

以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据查看文末了解数据免费获取方式为依据, 利用SPSS和R统计软件, 采用主成分分析法对当前城镇居民消费结构进行分析点击文末“阅读原文”获取完整代码数据)。

相关视频

结果显示: 娱乐教育文化服务、交通通讯、家庭设备用品、居住、食品是影响消费大小变动的主要因素, 而衣着、医疗保健、居住、食品是影响消费结构变动的主要因素; 各省市城镇居民消费大小与其经济发达程度密切相关; 相邻省市消费结构比较相似; 沿海地区与内地消费结构有较大的差别。

第一步:录入或调入数据

第二步:打开“因子分析”对话框。

沿着主菜单的“Analyze→Data Reduction→Factor”的路径(图2)打开因子分析选项框

第三步:选项设置。

首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value”栏。下面逐项设置

⒈ 设置Descriptives选项。

单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

在Statistics栏中选中Univariate descriptives复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。

点击标题查阅往期内容

01

02

03

04

在Correlation Matrix栏中,选中Coefficients复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant复选项,则会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。

设置完成以后,单击Continue按钮完成设置(图5)。

设置Extraction选项。

打开Extraction对话框(图6)。因子提取方法主要有7种,在Method栏中可以看到,系统默认的提取方法是主成分,因此对此栏不作变动,就是认可了主成分分析方法。

在Analyze栏中,选中Correlation matirx复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。

在Display栏中,选中Unrotated factor solution(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。

选中Scree Plot(“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。

主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是25次。但是,当数据量较大时,25次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。

设置Scores设置。

选中Save as variables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言

选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。

选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。

其它。

对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。

Correlation Matrixa

消费支出 食品烟酒 衣著 居住 生活用品及服务 交通通信 教育文化娱乐 医疗保健 其他用品及服务 Correlation 消费支出 1.000 .873 .499 .960 .838 .872 .860 .715 .906 食品烟酒 .873 1.000 .262 .811 .663 .755 .620 .396 .751
衣著 .499 .262 1.000 .377 .646 .424 .355 .606 .649
居住 .960 .811 .377 1.000 .774 .761 .825 .657 .861
生活用品及服务 .838 .663 .646 .774 1.000 .685 .730 .608 .804
交通通信 .872 .755 .424 .761 .685 1.000 .774 .624 .727
教育文化娱乐 .860 .620 .355 .825 .730 .774 1.000 .735 .743
医疗保健 .715 .396 .606 .657 .608 .624 .735 1.000 .694
其他用品及服务 .906 .751 .649 .861 .804 .727 .743 .694 1.000
a. Determinant = 1.69E-014

Correlation Matrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。

在Communalities(公因子方差)中,给出了因子载荷阵的初始公因子方差(Initial)和提取公因子方差(Extraction)

Communalities

Initial Extraction 消费支出 1.000 .975 食品烟酒 1.000 .659 衣著 1.000 .362 居住 1.000 .860 生活用品及服务 1.000 .770 交通通信 1.000 .754 教育文化娱乐 1.000 .764 医疗保健 1.000 .605 其他用品及服务 1.000 .864 Extraction Method: Principal Component Analysis.

在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues(初始特 7 征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根λ,因此可以直接根据特征根计算每一个主成分的方差百分比(% of Variance)。

Total Variance Explained

Component Initial Eigenvalues Extraction Sums of Squared Loadings

Total % of Variance Cumulative % Total % of Variance Cumulative %
1 6.613 73.479 73.479 6.613 73.479 73.479 2 .992 11.027 84.506

3 .555 6.162 90.668

4 .298 3.313 93.980

5 .259 2.879 96.859

6 .131 1.454 98.314

7 .088 .980 99.294

8 .064 .706 100.000

9 8.213E-11 9.125E-10 100.000

Extraction Method: Principal Component Analysis.

主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据λ值决定主成分数目的准则有三:

i 只取λ>1的特征根对应的主成分

从Total Variance Explained表中可见,第一、第二和第三个主成分对应的λ值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。

ii 累计百分比达到80%~85%以上的λ值对应的主成分

在Total Variance Explained表可以看出,前三个主成分对应的λ值累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。

iii 根据特征根变化的突变点决定主成分的数量

从特征根分布的折线图(Scree Plot)上可以看到,第4个λ值是一个明显的折点,这暗示选取的主成分数目应有p≤4(图8)。那么,究竟是3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。

在Component Matrix(成分矩阵)中,给出了主成分载荷矩阵,每一列载荷值都显示了各个变量与有关主成分的相关系数。以第一列为例,0.885实际上是消费支出与第一个主成分的相关系数。

Component Matrixa

Component
1 消费支出 .987 食品烟酒 .812 衣著 .601 居住 .928 生活用品及服务 .877 交通通信 .868 教育文化娱乐 .874 医疗保健 .778 其他用品及服务 .930 Extraction Method: Principal Component Analysis.
a. 1 components extracted.

R语言按地区划分的主成分可视化

res.pca <- prcomp(data[, -1], scale = TRUE)

数据获取


本文中分析的数据会员群,扫描下面二维码即可加群!

获取全文完整代码数据资料。

本文选自《R语言、SPSS基于主成分PCA的中国城镇居民消费结构研究可视化分析》。

点击标题查阅往期内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
布林肯就是不说,伊方透露:哈马斯要求中国等作担保

布林肯就是不说,伊方透露:哈马斯要求中国等作担保

观察者网
2024-06-13 12:00:08
为何有人没打过疫苗?全民接种时,这些人是如何逃过去的?

为何有人没打过疫苗?全民接种时,这些人是如何逃过去的?

人情皆文史
2024-06-13 03:36:33
深度:中美关系已走向质变!

深度:中美关系已走向质变!

算法与数学之美
2024-06-11 21:04:03
此刻,下雨了!雷雨大风、短时强降水!西安气象最新发布→

此刻,下雨了!雷雨大风、短时强降水!西安气象最新发布→

91.6陕西交通广播
2024-06-13 17:29:04
不可思议!复旦大学经管院金融专硕2024应届生就业仅有40%?

不可思议!复旦大学经管院金融专硕2024应届生就业仅有40%?

火山诗话
2024-06-12 06:49:29
是谁逼急了曾庆洪

是谁逼急了曾庆洪

一笑一言
2024-06-12 09:19:35
卖爆了!比亚迪官方:订单极为庞大,股价连续大涨,剑指万亿?

卖爆了!比亚迪官方:订单极为庞大,股价连续大涨,剑指万亿?

看财经show
2024-06-13 15:44:47
吉林银行取款2万元以上需派出所同意!是因噎废食还是苦口良药?

吉林银行取款2万元以上需派出所同意!是因噎废食还是苦口良药?

火山诗话
2024-06-12 20:14:22
56岁张也演出近照曝光,身材臃肿肚子胀大,穿长裙脖子粗短显笨重

56岁张也演出近照曝光,身材臃肿肚子胀大,穿长裙脖子粗短显笨重

咖啡店的老板娘
2024-06-13 00:02:00
华为官宣!全球首款

华为官宣!全球首款

每日经济新闻
2024-06-13 07:13:08
看完这个你就知道,为什么魔兽世界很难有新玩家了

看完这个你就知道,为什么魔兽世界很难有新玩家了

苹果牛看游戏
2024-06-13 13:28:16
汪小菲带新婚妻子爬长城,两处细节胜过大S,才懂汪小菲再婚原因

汪小菲带新婚妻子爬长城,两处细节胜过大S,才懂汪小菲再婚原因

萌神木木
2024-06-13 20:29:42
河南持续干旱,女子请假回老家帮爷爷抽井水浇地:他守着土地也守着他的家

河南持续干旱,女子请假回老家帮爷爷抽井水浇地:他守着土地也守着他的家

潇湘晨报
2024-06-13 18:41:07
上汽回应:将采取一切必要措施

上汽回应:将采取一切必要措施

观察者网
2024-06-13 14:19:05
黄一鸣称怀孕生子全过程王思聪都知道,只想给孩子父爱不要抚养费

黄一鸣称怀孕生子全过程王思聪都知道,只想给孩子父爱不要抚养费

鑫鑫说说
2024-06-13 09:23:49
传说中的“天马”,误闯江西居民区,众人合伙才将其控制

传说中的“天马”,误闯江西居民区,众人合伙才将其控制

文史微鉴
2024-06-13 06:28:53
董路:孙兴慜绝对是个伪君子&比李刚仁差远了 安慰王大雷是在羞辱

董路:孙兴慜绝对是个伪君子&比李刚仁差远了 安慰王大雷是在羞辱

直播吧
2024-06-13 19:35:15
炸裂!那些震碎你三观的八卦!网友:真的是太劲爆了

炸裂!那些震碎你三观的八卦!网友:真的是太劲爆了

王二哥老搞笑
2024-05-30 12:26:57
喜讯!足协正式敲定国足新归化4人补强名单,欧冠豪门队长领衔

喜讯!足协正式敲定国足新归化4人补强名单,欧冠豪门队长领衔

罗掌柜体育
2024-06-13 13:29:46
从国产手机618战绩可以看出,手机行业凛冬已至,手机卖不动了

从国产手机618战绩可以看出,手机行业凛冬已至,手机卖不动了

柏铭锐谈
2024-06-13 12:21:39
2024-06-13 22:08:49
拓端数据科技
拓端数据科技
数据.咨询.价值
487文章数 106关注度
往期回顾 全部

科技要闻

小红书员工仅1/5工龄满2年 32岁就不让进了

头条要闻

美联储连续七次不降息 专家:或在大选前2个月降息

头条要闻

美联储连续七次不降息 专家:或在大选前2个月降息

体育要闻

乔丹最想单挑的男人走了

娱乐要闻

森林北报案,称和汪峰的感情遭受压力

财经要闻

私募大佬孙强:中国为什么缺少耐心资本

汽车要闻

升级8155芯片 新款卡罗拉锐放售12.98-18.48万

态度原创

手机
本地
艺术
公开课
军事航空

手机要闻

荣耀Magic V Flip发布 外屏尺寸行业最大 4999元起

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

公开课

近视只是视力差?小心并发症

军事要闻

美军演习将罕见以4万吨级准航母作为靶舰

无障碍浏览 进入关怀版