概率论与数理统计 第八章 假设检验
统计推断的另一类重要问题是假设检验问题。
参数估计的主要任务是找 参数值等于多少 ,或在 哪个范围内取值 。而假设检验则主要是看参数的值 是否等于某个特定的值 。
通常进行假设检验即选定一个假设,确定用以决策的拒绝域的形式,构造一个检验统计量,求出拒绝域或检验统计量的p值,查看结果是否落在拒绝域内或p值是否小于显著性水平,做出决策的一个过程。
举个例子,体现假设检验的思想:
对要检验的问题提出一个原假设 和备择假设 。
根据样本提供的信息,由样本给出未知参数 的点估计量 。比较 的观测值与 的距离。距离很近,则不拒绝原假设 ;如果距离远了,就拒绝原假设。
度量距离“远近”的方法:拒绝域
说明:拒绝域从备择假设开始
一个假设检验通过拒绝域的方式将样本数据进行了划分,通过这种划分做出一个决策:接受 或拒绝 。但这一决策是基于样本提供的 不完全信息 对未知的总体参数做出的判断。因此总会存在 不正确决策 的风险。
所以借助于样本来进行的假设检验可能有四种结果:(第一类错误:弃真、第二类错误:采伪)
一般来说,当第一类错误概率小时,第二类错误概率就显得大。
从上面两类错误的分析我们知道,在样本量一定的条件下,不可能同时控制一个检验的两类错误概率。所以,在此基础上,采用折中方案,仅限制犯 第一类错误的概率 不超过事先设定的值 ,再尽量减少犯第二类错误的概率。
称该拒绝域所代表的检验为显著性水平 的检验,称 为 显著性水平 。 最常用的选择是 。
确定了显著性水平后,可以来确定拒绝域中的临界值c了。下面这个例子介绍具体步骤。
在这里,为了求出临界值c的值,构造了一个统计量 ,称符合这个要求的统计量为检验统计量。再本例中,检验统计量 服从标准正态分布,故该检验又称为 -检验(又可称为 -检验)
综上所述,在给定显著性水平 下,求拒绝域 的一般步骤如下:
假定总体 ,考虑以下三种均值 的检验问题:
1.方差\sigma^2已知时的均值 检验
在上述过程中,检验的原假设与备择假设构成一个双侧检验问题,换成如下单侧(右侧)检验问题:
检验的讨论过程完全相似。
考虑如下三种关于方差 的检验问题:
同单正态总体的假设检验一样,两个总体的未知参数的检验问题都有一对原假设和备择假设,同样也存在双侧和单侧假设检验。
综上所述,关于两个正态总体方差比的假设检验问题如下表所示:
第七章的参数固定是假定总体的分布类型是已知的,需要通过样本来估计刻画总体分布的一个或若干个参数。但是,在实际问题中,经常不知道总体服从什么分布,这时只能 假定其为某种分布 ,那么就需要根据样本数据来检验假设是否合理,即 检验假设的总体分布是否可以被接受 。又称为 分布的拟合检验 。常用的方法有 拟合优度检验。
上面这个例子中,我们假定每一组 的概率 都是已知的i=1,2,...,k,但在实际问题中,有时 还依赖于r个未知参数,而这r个未知参数需要利用样本来估计。
这时先用点估计法估计出这r个位置参数,然后再算出 的估计值
假设检验与区间估计的关系 :