相关性分析的概念及方法
2020-01-17 · 技术研发知识服务融合发展。
相关分析就是根据一个因素(变量)与另一个因素(变量)的相关系数是否大于临界值,判断两个因素是否相关。在相关的因素之间,根据相关系数大小判断两个因素关系的密切程度,相关系数越大,说明两者关系越密切(何晓群,2002)。这种方法从总体上对问题可以有一个大致认识,但却很难在错综复杂的关系中把握现象的本质,找出哪些是主要因素,哪些是次要因素,有时甚至得出错误结论。为此,提出使用数学上的偏相关分析与逐步回归相结合的办法来解决这类问题。
偏相关性分析基本原理是,若众多因素都对某一因素都存在影响,当分析某一因素的影响大小时,把其他因素都限制在某一水平范围内,单独分析该因素对某一因素所带来的影响,从而消除其他因素带来的干扰。比如分析压实作用(或埋深)对孔隙度和渗透率的影响时,便把岩石成分、粒度、胶结类型等都限制在一定范围来单独讨论压实作用,而数学上的偏相关分析恰恰就是解决这类问题的方法,偏相关系数的大小就代表了这种影响程度。结合多因素边引入、边剔除的逐步回归分析方法,也可消除多个因素(自变量)间的相互干扰和多个因素对因变量的重复影响,保留其中的有用信息,挑选出对因变量影响较显著的因素,剔除了一些次要因素,被挑选出的主要因素的标准回归系数和偏回归平方和的大小反映了各参数对因变量(充满度)的影响大小。因此根据各因素(自变量)与因变量间的偏相关系数大小,结合标准回归系数和偏回归平方和,便可以将各因素对因变量的影响大小进行定量排序。其基本步骤如下:
第一步,找出所有可能对因变量产生影响的因素(或参数),同时对一些非数值型参数进行量化处理;
第二步,计算因变量与各参数间的简单相关系数,根据这些简单相关系数的大小,初步分析它们与因变量间的简单相关关系;
第三步,计算因变量与各参数间的偏相关系数、标准回归系数和偏回归平方和;
第四步,根据偏相关系数的大小,再结合标准回归系数和偏回归平方和,综合分析因变量与各参数间的关系密切程度,其值越大,关系越密切,影响越大,反之亦然。