如何理解卡方检验中的卡方值的概念?

 我来答
城市秋天1
高粉答主

2023-06-20 · 日常,旅游,美食,情感经历,创业
城市秋天1
采纳数:94 获赞数:148225

向TA提问 私信TA
展开全部

T代表每个格子中的理论频数。

计算方法:

卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。

每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。

卡方检验要求:

最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据不符合要求,就要应用校正卡方。

利用统计学软件分析结果如下:

data kafang;

input row column number @@;

cards;

1 1 52

1 2 19

2 1 39

2 2 3

;

run;

proc freq;

tables row*column/chisq;

weight number;

run;

扩展资料

一、卡方检验的基本思想

卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。

该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。

如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

二、卡方值的计算与意义

χ2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。

1、设A代表某个类别的观察频数,E代表基于解析失败 (PNG 转换失败; 请检查是否正确安装了 latex, dvips, gs 和 convert): H_0 计算出的期望频数,A与E之差称为残差。

2、显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。

3、另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。

参考资料来源:百度百科-卡方检验

数据工作站
2023-06-29 · TA获得超过181个赞
知道小有建树答主
回答量:1747
采纳率:100%
帮助的人:54.2万
展开全部

卡方检验中的卡方值(Chi-square value)是用于衡量观察值与期望值之间的差异程度的统计量。它通过比较观察到的数据与假设的期望数据之间的差异,来判断观察到的数据是否与假设的理论分布相符。

在卡方检验中,我们将观察到的频数与期望的频数进行比较。观察到的频数是我们根据实际观测结果得到的,而期望的频数是根据假设的理论分布计算得到的。卡方值表示了观察到的频数与期望的频数之间的差异程度。

计算卡方值的步骤如下:

  • 根据给定的数据和假设,计算出每个单元格的期望频数。

  • 计算每个单元格的观察频数与期望频数之间的差异。

  • 对每个差异值进行平方处理,以消除正负影响并放大差异。

  • 将所有平方值相加,得到卡方值。

  • 卡方值越大,表示观察到的数据与假设的理论分布之间的差异越大。通过与卡方分布进行比较,可以进行假设检验,从而判断观察到的数据与理论分布是否存在显著差异。

    需要注意的是,卡方值的大小只能反映观察数据和期望数据的差异程度,不能直接用来表示变量之间的关联程度或效应大小。如果卡方值达到了一定的显著水平,那么我们可以拒绝原假设,认为观察数据与理论分布存在显著差异。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式