假设检验中的P值的计算方法
P值的计算:
一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:
左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}
右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}
双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。
扩展资料:
假设检验的意义:
假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设。
然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。
用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。
通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。
参考资料来源:百度百科——假设检验中的P值
参考资料来源:百度百科——假设检验
2024-10-13 广告
P值的计算:一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:
左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}
右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。
若X服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。
计算出P值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:
如果α > P值,则在显著性水平α下拒绝原假设。
如果α ≤ P值,则在显著性水平α下接受原假设。
在实践中,当α = P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。
扩展资料:
假设检验理论的具体做法是:
假定某一参数的取值。
选择一个检验统计量(例如z 统计量或Z 统计量) ,该统计量的分布在假定的参数取值为真时应该是完全已知的。
从研究总体中抽取一个随机样本计算检验统计量的值计算概率P值或者说观测的显著水平,即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
如果0.01<P值<0.05,说明较弱的判定结果,拒绝假定的参数取值。
如果P值>0.05,说明结果更倾向于接受假定的参数取值。
可是,那个年代,由于硬件的问题,计算P值并非易事,人们就采用了统计量检验方法,也就是我们最初学的t值和t临界值比较的方法。
统计检验法是在检验之前确定显著性水平α,也就是说事先确定了拒绝域。但是,如果选中相同的a,所有检验结论的可靠性都一样,无法给出观测数据与原假设之间不一致程度的精确度量。
只要统计量落在拒绝域,假设的结果都是一样,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际上的显著性有较大的差异。
因此,随着计算机的发展,P值的计算不再是个难题,使得P值变成最常用的统计指标之一。
参考资料来源:百度百科--概率
参考资料来源:百度百科--P值
(1) P值是:
1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的)显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
(2) P值的计算:
一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:
左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}
右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}
双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。
计算出P值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:
如果α > P值,则在显著性水平α下拒绝原假设。
如果α ≤ P值,则在显著性水平α下接受原假设。
在实践中,当α = P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。
整理自:
樊冬梅,假设检验中的P值.郑州经济管理干部学院学报,2002;韩志霞,张 玲,P值检验和假设检验。边疆经济与文化,2006中国航天工业医药,1999
=2[1-φ(z0)]
当被测假设h1为
p不等于p0时;
=1-φ(z0)
当被测假设h1为
p大于p0时;
=φ(z0)
当被测假设h1为
p小于p0时;
其中,φ(z0)要查表得到。
z0=(x-n*p0)/(根号下(np0(1-p0)))
最后,当p值小于某个显著参数的时候我们就可以否定假设。反之,则不能否定假设。
注意,这里p0是那个缺少的假设满意度,而不是要求的p值。
没有p0就形不成假设检验,也就不存在p值
统计学上规定的p值意义:
p值
碰巧的概率
对无效假设
统计意义
p>0.05
碰巧出现的可能性大于5%
不能否定无效假设
两组差别无显著意义
p<0.05
碰巧出现的可能性小于5%
可以否定无效假设
两组差别有显著意义
p
<0.01
碰巧出现的可能性小于1%
可以否定无效假设
两者差别有非常显著意义