假设检验中P值的深入理解
首先,我们来看一下p值的定义: 在原假设H 0 成立的条件下,发生与样本结果相同或更极端结果的概率。 那么,什么叫与样本结果相同或更极端结果呢?我们以抛硬币这个例子来说明。
我们想通过假设检验的方法验证一枚硬币是否均匀,那么原假设H 0 为:正面朝上的概率为0.5(硬币是均匀的);备择假设H 1 为:正面朝上的概率不等于0.5(硬币是不均匀的)。现在随机抛该硬币5次,发现有4次正面朝上,那么在显著性水平为0.05的条件下,是否应该拒绝原假设呢?
首先需要考虑一个问题,这里的p值应该如何计算?按照定义,如果原价假设成立,即硬币是均匀的,出现4次正面朝上的概率为 0.15625,更极端情况下出现5次正面朝上的概率为0.03125 。此外,我们还应该考虑出现4次及以上反面朝上的概率,因为这也是背离原假设且比样本结果更极端的概率,这个概率为0.15625+0.03125=0.1875。因此,p值为上面所有情况的和0.375,因此,我们不能拒绝原假设,不能认为硬币是不均匀的。
从这里可以看出,这里的更极端结果,是指与样本结果相比,更加背离原假设的情况。因此, p值其实反映了样本在多大程度上或多大概率上背离原假设,如果p值越小,表明样本发生的概率越小,即更加背离原假设,当背离原假设到一定程度时(小于显著性水平),我们就会拒绝原假设。
这里,原假设为真的概率为P(B1),是贝叶斯公式里的先验概率。因此,p值的大小并不代表原假设到底有多真或多假。