网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

手把手教你学会主成分分析

2022-07-12 18:20:13　来源: 数学家

北京举报

0

分享至

定义

利用降维思想，考察多个变量间的相关性，研究如何从原始变量中导出少数几个综合指标（主成分），使它们尽可能多地保留原始变量的信息，且彼此间互不相关。

一个主成分不足以代表原来的p个变量，因此需要寻找第二乃至第三、第四主成分，各个主成分之间相互独立（统计上的描述就是让这几个主成分之间的协方差为零，几何上就是这几个主成分的方向两两正交）具体确定各个主成分的方法如下：设Zi表示第i个主成分，i=1,2,…,p,可设：

其中对每一个i，均有

公众号后台回复“spss”

领取最新安装包

主成分分析步骤

将原始数据标准化，以消除量纲的影响(这一步可借助spss进行计算)

假设进行主成分分析的指标变量有m个：x1,x2,…,xm，其中有n个评价对象，第i个评价对象的第j个指标的取值为xij，将各指标值转化成标准化指标xij，

其中

对应的，称

为标准化指标变量。即xj,sj为第j个指标的样本均值和样本标准差。

(2)建立变量之间的相关系数矩阵R

相关系数矩阵

，式中rii=1，rij=rji，rij是第i个指标与第j个指标的相关系数。

(3)计算相关系数矩阵R的特征值和特征向量

计算相关系数矩阵R的特征值λ1≥λ2≥…≥λm≥0,及对应的特征向量u1,u2 ,…,um,其中uj=（u1j,u2j,…,unj）^T,由特征向量组成m个新的指标变量。

其中y1是第一主成分，y2是第二主成分…,ym是第m主成分。

写出主成分并计算综合得分

计算特征值λj=(j=1,2,…,m)的信息贡献率和累计贡献率。称

为主成分yj的信息贡献率。

为主成分y1,y2,…,yp的累计贡献率，当ap接近于1（ar=0.85,0.90,0.95）时，则选择前p个指标变量y1,y2,…, yp,作为p个主成分，代替原来的m个指标变量，从而可对p个主成分进行综合分析。

,其中bj为第j个主成分的信息贡献率。

模型实战

上图中为实战的例题数据，下面为各变量的具体含义：

X1~人均生产总值(元)；X2~全社会从业人员年末数(万人)；

X3~社会消费品零售总额(亿元)；X4~固定资产投资(亿元)；

X5~出口总额(亿美元)；X6~财政总收入(亿元)；

X7~地方财政收入；X8~城乡居民储蓄存款年末余额(亿元);

X9~城镇居民人均可支配收入(元); X10~农村居民人均纯收入(元)。

对浙江省11座城市的国民经济发展水平进行主成分分析，并计算11个城市民经济主要指标主成分综合得分。

将原始数据标准化，以消除量纲的影响

建立变量之间的相关系数矩阵R

主成分分析适用于变量之间存在较强相关性的数据，如果原始数据相关性较弱，应用主成分分析后不能起到很好的降维作用，所得的各个主成分浓缩原始变量信息的能力相差不大。

一般认为，当原始数据大部分变量的相关系数都小于0.3时，应用主成分分析取得的效果不理想。

检验各因素之间有没有关联程度。一般情况下，KMO值应≥0.6，显著性值≤0.05，表明各因素之间有较强的关联程度。在本例题中，KMO的值为0.663，显著性值为0.000，说明各因素之间有较强的关联程度，可以进行降维。

计算相关系数矩阵R的特征值和特征向量

上图中被红框框住的两个值即为相关矩阵的特征值，

以x10为例，依据成分矩阵中x10的值，通过0.605÷2.791=0.217，0.763÷1.186=0.643计算得到不同变量在不同主成分中的值。同理，计算得到其他变量的两个值，则：

之后将标准化后的原始数据代入主成分表达式计算各个样本的主成分得分。

(4)写出主成分并计算综合得分

然后根据不同成分所占的百分比，得到最终每个样本的值：

总结

结果受量纲的影响，各变量的单位可能不一样，如果各自改变量纲，结果会不一样，实际中可以先把各变量的数据标准化，然后使用协方差矩阵或相关系数矩阵进行分析。
主成分的保留。用相关系数矩阵求主成分时，SPSS默认将特征值小于1的主成分予以放弃。
在实际研究中，由于主成分的目的是为了降维，减少变量的个数，故一般选取少量的主成分(不超过5或6个)，只要它们能解释变量的70% ~80% (称累积贡献率)即可。

BONUS TIME

数学建模资料、视频讲解、历年赛题

后台回复【校苑】领取

100G MATLAB资料

后台回复【干货】领取

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

军迷用无人机拍高清新型军舰获刑

央视新闻客户端 2024-06-20 07:53:23
50975 跟贴 50975
唐山丰南区原人大副主任利用职权违规经商拖欠工资耍赖欺诈！

看眼想世界 2024-06-20 17:30:10
6 跟贴 6

北京将迎来“80后”区长，曾是最年轻区领导的她也拟任新职

鲁中晨报 2024-06-20 17:11:08
161 跟贴 161

事关重大！多地书记省长部署

鲁中晨报 2024-06-20 14:35:02
92 跟贴 92
韩国麦当劳宣布暂停销售炸薯条

红星新闻 2024-06-20 18:34:43
2888 跟贴 2888

南昌医学院党委委员、副院长洪珺简历已从官网撤下

澎湃新闻 2024-06-20 13:10:33
228 跟贴 228

媒体：普京和金正恩抱团取暖都是美国和北约逼出来的

直新闻 2024-06-20 00:29:19
23 跟贴 23
成都城市低空载人出行来了，今天开始验证飞行

封面新闻 2024-06-20 10:29:10
211 跟贴 211

杭州一公司拖欠工资并威胁员工？当地街道办：正调查处置

新京报 2024-06-20 17:22:17
1738 跟贴 1738
北大回应复旦打老师男生被录取：处于思想品德考核期

新京报 2024-06-20 20:34:19
334 跟贴 334
中联部部长在海参崴出席“抵制新殖民主义”论坛，让人如鲠在喉

顾礼先生 2024-06-20 14:53:15
708 跟贴 708
联合国专家：以色列军队是世界上最罪恶的军队之一

环球网资讯 2024-06-20 11:47:37
2226 跟贴 2226
热闻|柳州两任市委书记同日被通报，此前为“老搭档”，曾同受处分

齐鲁壹点 2024-06-20 14:13:31
102 跟贴 102
Manner咖啡店员情绪失控向顾客泼咖啡粉，品牌方回应了

南方都市报 2024-06-20 16:48:07
201 跟贴 201
中共代表团访问津巴布韦

新华社 2024-06-20 17:33:16
56 跟贴 56
创业板指跌幅扩大至1% 两市超4200家个股飘绿

每日经济新闻 2024-06-20 11:31:21
1258 跟贴 1258
上交所：终止对长鹰硬科等四家公司IPO审核

财联社 2024-06-20 17:38:09
47 跟贴 47
网红学位房14万/平跌到4万/平？记者实探：几乎每月都有成交购房者看中租金回报

北青网-北京青年报 2024-06-20 12:49:08
245 跟贴 245
对话遇大水坐消防车赶去结婚的桂林新娘：曾邀请消防员吃酒席

南方都市报 2024-06-20 13:53:09
128 跟贴 128
全数字化，外国游客正在适应

环球时报国际 2024-06-20 08:51:40
319 跟贴 319
广州在建最深车站“封底” 主体结构开始施工

新快报新闻 2024-06-20 21:58:04
4 跟贴 4
世界女排联赛总决赛打响，中国女排0比3不敌日本无缘四强

澎湃新闻 2024-06-20 19:22:28
0 跟贴 0

云南省昭通市镇雄县搬迁安置局党组书记、局长杜云平接受审查调查

云南省昭通市镇雄县搬迁安置局党组书记、局长杜云平接受审查调查

鲁中晨报

2024-06-20 16:55:02

身体好不好，看鞋就知道？提醒：鞋底若是这4种情况，多长点心

身体好不好，看鞋就知道？提醒：鞋底若是这4种情况，多长点心

39健康网

2024-06-19 20:30:02

王思聪终于回复黄一鸣，网友：确实是他的风格

王思聪终于回复黄一鸣，网友：确实是他的风格

菠萝小九

2024-06-18 12:40:43

彻底倒向美囯？拒绝中方移民，驱离中方工人，中方大怒：永不合作

彻底倒向美囯？拒绝中方移民，驱离中方工人，中方大怒：永不合作

星辰故事屋

2024-04-27 19:04:44

竞争巴黎席位？庄宇珊29扣11中张常宁28扣8中总决赛练兵蔡斌选谁

竞争巴黎席位？庄宇珊29扣11中张常宁28扣8中总决赛练兵蔡斌选谁

颜小白的篮球梦

2024-06-20 19:36:22

姜萍家的厨房门被踹了，屋内家具被拍，连鸡鸭也被网友追着录像

姜萍家的厨房门被踹了，屋内家具被拍，连鸡鸭也被网友追着录像

素素娱乐

2024-06-19 16:00:38

歪戴警帽、休闲裤、休闲鞋、叉着腰，这是警察吗，警容警貌何在

歪戴警帽、休闲裤、休闲鞋、叉着腰，这是警察吗，警容警貌何在

附允历史观

2024-06-20 16:37:12

当过5年县长、7年县委书记，廖敏严重损害当地政治生态

当过5年县长、7年县委书记，廖敏严重损害当地政治生态

鲁中晨报

2024-06-20 16:47:11

后续！继央视为俞莉打抱不平后，党媒也来力挺，网友：说的太好了

后续！继央视为俞莉打抱不平后，党媒也来力挺，网友：说的太好了

户外小阿隋

2024-06-20 15:26:05

618手机销量榜单，把人看沉默了

618手机销量榜单，把人看沉默了

小慢

2024-06-20 15:19:01

13岁小红军过草地时，因尿急去方便，回来却发现茫茫草地空无一人

13岁小红军过草地时，因尿急去方便，回来却发现茫茫草地空无一人

百年历史老号

2024-06-20 10:10:21

都不生了…

子木聊房啊

2024-06-20 19:51:28

悲剧了！网传深圳一家成立40年的工程上市企业，全员停产待岗…

悲剧了！网传深圳一家成立40年的工程上市企业，全员停产待岗…

火山诗话

2024-06-20 07:44:49

主持人问蒋大为身为加拿大国籍，还回国赚钱，蒋大为：我是中国人

主持人问蒋大为身为加拿大国籍，还回国赚钱，蒋大为：我是中国人

南权先生

2024-06-20 11:15:37

雷阵雨+38℃+10级风！山东开启“蒸烤”模式，济南降雨时段→

雷阵雨+38℃+10级风！山东开启“蒸烤”模式，济南降雨时段→

鲁中晨报

2024-06-20 17:47:17

一集入坑！尺度大到头皮发麻！

天天美剧吧

2024-06-20 11:48:06

业务招待费没附菜单，不能报销？税务局早已明确：要按这个来！

业务招待费没附菜单，不能报销？税务局早已明确：要按这个来！

学税

2024-06-20 18:13:53

新型卖淫方式，让人预想不到，但却真实存在！

新型卖淫方式，让人预想不到，但却真实存在！

雪影的情感

2023-11-18 11:51:16

后续！泼咖啡粉的女店员被辞退，现场完整对话曝光，果然有情况

后续！泼咖啡粉的女店员被辞退，现场完整对话曝光，果然有情况

皖声微言

2024-06-20 16:01:24

这是选美还是选丑？香港小姐2024佳丽引群嘲，网友：真不如以前的

这是选美还是选丑？香港小姐2024佳丽引群嘲，网友：真不如以前的

番茄说史聊

2024-06-18 23:57:10

服务于数学建模爱好者的平台

3647文章数 1924关注度

往期回顾全部

科技要闻

小米SU7流量泼天，富贵却被蔚来接住了

头条要闻

原中候补受审今年年初曾被中纪委公开通报

头条要闻

原中候补受审今年年初曾被中纪委公开通报

体育要闻

绿军的真老大，开始备战下赛季了

娱乐要闻

叶舒华参加柯震东生日聚会，五毒俱全

财经要闻

楼市加速去库存收储扩围至县级以上城市

汽车要闻

售价11.79-14.39万元新一代哈弗H6正式上市

态度原创

数码

健康

旅游

教育

军事航空

数码要闻

优派推出 4K 160Hz 显示器 VX2759-4K-PRO，首发 2099 元

晚餐不吃or吃七分饱，哪种更减肥？

旅游要闻

铁路儿童票新规已有超4900万小旅客免费出行

教育要闻

QS2025更新后，前百学校里面最保值的几个学校！

军事要闻

以军发言人公开表示"哈马斯无法被消灭" 以政府反驳

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版