请教SPSS高人,主成份分析和因子分析有什么不同?做主成分分析目的是什么?谢谢
2019-10-11 · 百度认证:SPSSAU官方账号,优质教育领域创作者
2023-08-27 广告
推荐于2017-09-06 · 知道合伙人金融证券行家
其实所谓的区别只不过是在学科研究当中存在的,因为同属于统计学的理论,所以一定要找出两者的区别来。但是如果你只是应用的话,那就没必要考虑两者有什么区别。
况且spss使用因子分析非常方便 就可以得出各因子的得分,但是如果你非要用主成分分析方法,则需要自己手动再根据spss输出的某些因子分析结果来计算主成分得分。
做主成分分析或者说因子分析的目的 是为了浓缩众多变量,使之在后续的计算中更加简介。比如原来有80多个变量,如果直接进行综合排名要考虑每个变量进行综合,所以此时通过主成分分析,可以将原来的80多个变量浓缩成3~5个代替原来众多变量的新变量 即所谓的主成分或主因子。这样后续的计算就很简洁了
在spss应用上,是没区别的
因子分析会用到主成分分析方法
我经常帮别人做类似的数据分析的
主成分分析和因子分析有什么不同:
主成分分析与因子分析有相似之处,也有明显区别,以下是对主成分分析和因子分析进行的一个简单比较。
主成分分析
基本思想
主成分几何意义及求解
主成分分析优缺点
分析步骤
因子分析
基本思想
与主成分分析的区别和联系
分析步骤
主成分是原始变量的线性组合
主成分的数量相对于原始数量更少
主成分保留了原始变量的大部分信息
主成分之间相互独立
保留的主成分使得方差贡献率达到80%以上
保留的主成分的方差(特征值)大于1
Cattell碎石检验绘制了关于各主成分及其特征值的图形,我们只需要保留图形中变化最大之处以上的主成分即可
优点
不要求数据呈正态分布,主成分就是按数据离散程度最大的方向对基组进行旋转,这特性扩展了其应用范围,比如,用于人脸识别
通过对原始变量进行综合与简化,可以客观地确定各个指标的权重,避免主观判断的随意性
缺点
主成分分析适用于变量间有较强相关性的数据,若原始数据相关性弱,则起不到很好的降维作用
降维后,存在少量信息丢失,不可能包含100%原始数据
原始数据经过标准化处理之后,含义会发生变化,且主成分的解释含义较原始数据比较模糊
【1】主成分分析——基本思想
主成分分析(Principal Component Analysis,PCA)通过将原始变量转换为原始变量的线性组合(主成分),在保留主要信息的基础上,达到简化和降维的目的。
主成分与原始变量之间的关系:
【2】主成分分析——几何意义及求解
通过旋转变换,将分布在x1,x2坐标轴上的原始数据,转换到F1,F2坐标轴表示的坐标系上,使得数据在F1轴上离散程度最大,此时,可以忽略F2轴,仅通过F1轴就可以表示数据的大部分信息,从而达到降维的目的。
不同的线性变换,得到的Fi统计特性不同,为得到较好的效果,我们希望主成分之间相互独立,同时方差尽可能得大,即
求解以上公式,得
因此,我们只需要对协方差矩阵∑求特征值λ及特征向量ui,即可构成主成分分析的解。
由此可知,主成分分析是把p个随机变量的方差分解为p个不相关的随机变量的方差和,使得第一个主成分的方差达到最大,其贡献率等于其方差在全部主成分方差中的占比。
主成分分析的一个关键问题是:主成分的个数选多少个比较合适?
有3个主要的衡量标准:
【3】主成分分析——优缺点