请问卡方检验中理论频数怎么算?
我给你的数据起个名字好了,第一列列名叫患病,第二列叫健康,第一行行名叫吸烟,第二行行名叫不吸烟。
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
扩展资料:
理论频数又称验频数,统计学概念,是指用阳性理论率推算各实际频数的估计值 。
双向无序列联表的理论频数Eij等于所在行、列的合计数Oi.、O.j之积除以总频数N
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1<T<5的格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行×列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。
参考资料:百度百科-理论频数
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
下面是适用于四格表应用条件:
1)随机样本数据。两个独立样本比较可以分以下3种情况:
(1)所有的理论频数T≥5并且总样本量n≥40,用卡方进行检验。
(2)如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。
(3)如果有理论数T<1或n<40,则用Fisher’s检验。
手打请采纳