因子分析方法
2020-01-18 · 技术研发知识服务融合发展。
因子分析是一种多变量化简技术,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性较低,每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。其分析方法有很多种,最常用的有两种:一是主成分分析方法;另外一种是一般因子分析法。通常所说的因子分析指的就是一般因子分析法,它通过原始变量的方差去构造因子,一般情况下,因子的数量总是要少于变量的数量。所以对于一般因子分析而言,如何正确解释因子将会比主成分分析更困难。
因子分析一般可以分成四步:
考察变量之间的相关性,判断是否要进行因子分析;
进行分析,按一定的标准确定提取的因子数目,一般要求特征值大于1;
考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式;
计算出因子得分等中间指标,供进一步分析使用。
利用因子分析,可以把搜集到的比较杂乱的原始数据进行压缩,找出最重要的因子,并对其按照成因归类、整理,从中找出几条主线,帮助分析充满度的主要控制因素。
本研究中共统计岩性圈闭354个,参与统计分析和计算的圈闭有249个。由于其中的落空圈闭无法参与因子分析及充满度预测模型的建立,因此实际参与分析和预测的岩性油气藏为222个。初步地质分析后,选取平均孔隙度,%;平均渗透率,10-3μm2;排烃强度,104t/km2;与排烃中心的平面距离,km;与排烃中心的垂直距离,m;地层压力系数;砂体厚度,m;砂体面积,km2;有机质丰度,%;围岩厚度,m;平均埋深,m;共11个地质参数进行因子分析。
本研究按不同的成藏体系进行,建立其充满度预测模型并进行回代验证。同一成藏体系内的岩性油气藏的生、储、盖、圈、运、保等成藏条件相互影响、相互制约,关系密切,将同一成藏体系中的岩性油气藏又分别划分为构造-岩性、透镜体油气藏进行预测。
KMO(Kaiser-Meyer-Olkin)检验是多元统计的因子分析中用于检验变量是否适合采用因子分析的方法,是度量因子分析效率的基本测度。KMO检验的统计量是变量之间相关系数与其偏相关系数的比值。
2. Bartlett检验
Bartlett检验(Bartlett Test)又称为Bartlett球形检验(Bartlett Test of Sphericity)。Bartlett检验与KMO检验类似,也是通过检验变量之间的相关性来判断是否适合采用因子分析的一种方法。
3. 累积方差贡献率
在因子分析中,采用正交旋转方式,依据方差最大化原则,构建了一组新的线性组合来表示原有的变量,并按照特征值大于1的标准来确定主要线性组合的个数,从而以较少的主要线性组合来反映原始变量变异的主要部分,这些特征值大于1的主要的线性组合便是主因子。
4. 探索性因子分析
探索性因子分析(EFA)是基于因子分析的一种社会调查的因素分析方法。