如何理解卡方检验中的卡方值的概念？

 我来答

2个回答

#热议# 在购买新能源车时，要注意哪些？

城市秋天1

高粉答主

2023-06-20 · 日常，旅游，美食，情感经历，创业

城市秋天1

采纳数：94 获赞数：148225

向TA提问私信TA

关注

展开全部

T代表每个格子中的理论频数。

计算方法：

卡方检验的统计量是卡方值，它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。

每个格子中的理论频数T是在假定两组的发癌率相等（均等于两组合计的发癌率）的情况下计算出来的，如第一行第一列的理论频数为71*(91/113)=57.18，故卡方值越大，说明实际频数与理论频数的差别越明显，两组发癌率不同的可能性越大。

卡方检验要求：

最好是大样本数据。一般每个个案最好出现一次，四分之一的个案至少出现五次。如果数据不符合要求，就要应用校正卡方。

利用统计学软件分析结果如下：

data kafang;

input row column number @@;

cards;

1 1 52

1 2 19

2 1 39

2 2 3

;

run;

proc freq;

tables row*column/chisq;

weight number;

run;

扩展资料

一、卡方检验的基本思想

卡方检验是以χ2分布为基础的一种常用假设检验方法，它的无效假设H0是：观察频数与期望频数没有差别。

该检验的基本思想是：首先假设H0成立，基于此前提计算出χ2值，它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。

如果P值很小，说明观察值与理论值偏离程度太大，应当拒绝无效假设，表示比较资料之间有显著差异；否则就不能拒绝无效假设，尚不能认为样本所代表的实际情况和理论假设有差别。

二、卡方值的计算与意义

χ2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。

1、设A代表某个类别的观察频数，E代表基于解析失败 (PNG 转换失败; 请检查是否正确安装了 latex, dvips, gs 和 convert): H_0 计算出的期望频数，A与E之差称为残差。

2、显然，残差可以表示某一个类别观察值和理论值的偏离程度，但如果将残差简单相加以表示各类别观察频数与期望频数的差别，则有一定的不足之处。因为残差有正有负，相加后会彼此抵消，总和仍然为0，为此可以将残差平方后求和。

3、另一方面，残差大小是一个相对的概念，相对于期望频数为10时，期望频数为20的残差非常大，但相对于期望频数为1 000时20的残差就很小了。考虑到这一点，人们又将残差平方除以期望频数再求和，以估计观察频数与期望频数的差别。

参考资料来源：百度百科-卡方检验

已赞过 已踩过<

评论收起

数据工作站
2023-06-29 · TA获得超过181个赞

知道小有建树答主

回答量：1747

采纳率：100%

帮助的人：54.2万

我也去答题访问个人页

关注

展开全部

卡方检验中的卡方值（Chi-square value）是用于衡量观察值与期望值之间的差异程度的统计量。它通过比较观察到的数据与假设的期望数据之间的差异，来判断观察到的数据是否与假设的理论分布相符。

在卡方检验中，我们将观察到的频数与期望的频数进行比较。观察到的频数是我们根据实际观测结果得到的，而期望的频数是根据假设的理论分布计算得到的。卡方值表示了观察到的频数与期望的频数之间的差异程度。

计算卡方值的步骤如下：

根据给定的数据和假设，计算出每个单元格的期望频数。
计算每个单元格的观察频数与期望频数之间的差异。
对每个差异值进行平方处理，以消除正负影响并放大差异。
将所有平方值相加，得到卡方值。

卡方值越大，表示观察到的数据与假设的理论分布之间的差异越大。通过与卡方分布进行比较，可以进行假设检验，从而判断观察到的数据与理论分布是否存在显著差异。

需要注意的是，卡方值的大小只能反映观察数据和期望数据的差异程度，不能直接用来表示变量之间的关联程度或效应大小。如果卡方值达到了一定的显著水平，那么我们可以拒绝原假设，认为观察数据与理论分布存在显著差异。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何理解卡方检验中的卡方值的概念？

其他类似问题

为你推荐：