主成分分析的主要步骤包括

 我来答
知心姐姐小马老师
2020-11-23 · TA获得超过1.8万个赞
知道大有可为答主
回答量:1万
采纳率:87%
帮助的人:349万
展开全部
收藏
立即下载
为了提升浏览体验,原视图版网页已升级为如下版式
主成分分析法的步骤和原理
主成分分析法的步骤和原理.pdf
438.91K, 15页, 13478次阅读

sshiiwengy6 分享于2016-11-16 09:09

立即下载 举报
(一)主成分分析法的基本思想

主成分分析(Principal Component Analysis )是利用降维的思想,将多个变 量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性 组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信 息,且所含的信息互不重叠。[2]

采用这种方法可以克服单一的财务指标不能真实反映公司的财务情况的缺 点,引进多方面的财务指标,但又将复杂因素归结为几个主成分,使得复杂问 题得以简化,同时得到更为科学、准确的财务信息。

(二)主成分分析法代数模型

假设用p个变量来描述研究对象,分别用 X1, X2…Xp来表示,这p个变量 构成的p维随机向量为X=(X1, X2…Xp)t。设随机向量X 的均值为μ,协方差 矩阵为Σ。假设 X 是以 n 个标量随机变量组成的列向量,并且μk 是其第k个元素的 期望值,即,μk= E(xk),协方差矩阵然后被定义为:

Σ=E{(X-E[X])(X-E [X])}=(如图

对 X 进行线性变化,考虑原始变量的线性组合:

Zp=μ p1X1+μ p2X2+…μ ppXp

主成分是不相关的线性组合Z1, Z2……Zp,并且Z1是 X1, X2…Xp的线性 组合中方差最大者, Z2是与 Z1不相关的线性组合中方差最大者,…, Zp是与

Z1, Z2 ……Zp-1 都不相关的线性组合中方差最大者。

(三)主成分分析法基本步骤

第一步:设估计样本数为n,选取的财务指标数为p,则由估计样本的原始 数据可得矩阵 X=(xij)m×p,其中 xij表示第 i 家上市公司的第 j 项财务指标数据。

第二步:为了消除各项财务指标之间在量纲化和数量级上的差别,对指标 数据进行标准化,得到标准化矩阵(系统自动生成)。

第三步:根据标准化数据矩阵建立协方差矩阵 R,是反映标准化后的数据 之间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分 析。其中, Rij (i, j=1, 2,…, p)为原始变量Xi与Xj的相关系数。 R为实对 称矩阵(即 Rij=Rji),只需计算其上三角元素或下三角元素即可,其计算公式为:

1/15页
n

第四步:根据协方差矩阵 R 求出特征值、主成分贡献率和累计方差贡献率, 确定主成分个数。解特征方程ER  0,求出特征值λi

(i=1, 2,…, p)。因为R是正定矩阵,所以其特征值λi都为正数,将其按 大小顺序排列,即λ1≥λ2≥…≥λi≥0。特征值是各主成分的方差,它的大

1 且累计贡

献率达80%-95%的特征值λ1,λ2,…,λm所对应的1, 2,…, m (m≤p), 其中整数 m 即为主成分的个数。

第五步:建立初始因子载荷矩阵,解释主成分。因子载荷量是主成分Zi与 原始指标Xi的相关系数R (Zi, Xi),揭示了主成分与各财务比率之间的相关程 度,利用它可较好地解释主成分的经济意义。

第六步:计算企业财务综合评分函数Fm,计算出上市公司的综合值,并进 行降序排列:

Fm=W1Z1 + W2Z2+…+ WiZi
上海欧易
2025-01-17 广告
数据非依赖采集(DIA)是近年来备受瞩目的质谱采集技术之一,一度带领了定量蛋白质组学新发展。DIA相比于DDA的优势在于高效测定复杂样品中相对低丰度的蛋白分子,大幅提高了定量分析的可信度。具有高通量、高分辨率、高可重现性、定量准确等优点,而... 点击进入详情页
本回答由上海欧易提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式