什么是统计检验?怎么选择统计检验方法?
统计检验亦称“假设检验”。根据抽样结果,在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝(予以接受)结论的程序。决定常取决于样本统计量的数值与所假设的总体参数是否有显著差异。这时称差异显著性检验。检验的推理逻辑为具有概率性质的反证法。
选择
显著性水平和否定域
有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果;另一类人们预料这些结果很可能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。
在统计检验中,这些不大可能的结果称为否定域。如果这类结果真的发生了,我们将否定假设;反之就不否定假设。概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。
值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。为了使检验更严格、更科学,还需要更多的东西。首先,我们必须确定冒犯第一类和第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。
第一类错误是,零假设H0实际上是正确的,却被否定了。第二类错误则是,H0实际上是错的,却没有被否定。第二类错误是,零假设H0实际上是错误的,却没有被否定。遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。
对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。
由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必须事先在冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用α表示),它决定了否定域的大小。
如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显著性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计概率的方法找出一组构成否定域的结果。
即在已知概率分布表上,从两端可能性最小的概率开始向中心累计,直至概率之和略小于选定的显著性水平为止。在许多场合,我们能预测偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被预测的时候,在同样显著性水平的条件下,单侧检验比双侧检验更合适。
因为否定域被集中到抽样分布更合适的一侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少了犯第二类错误的危险。
扩展资料
选择统计检验程序的方法时需考虑以下条件:
1、看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。
2、在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用Z检验;如果总体方差未知,根据样本方差,采取不同的t检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取Z’检验;如果总体方差未知,根据独立和相关采取不同的Z‘检验。
3、根据题目考虑用单侧还是双侧检验。
4、在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。
参考资料来源:百度百科-统计检验