统计学(43)-置信区间与P值的关系
(1)置信区间的前缀数字称为置信系数,一般我们习惯用95%, 但这并非唯一选择,根据研究目的也可以用90%、99%等。
(2)置信系数越大,所得的区间越宽;置信系数越小,所得的区间越窄。
(3)置信区间的宽窄反映了对参数估计的精确度,置信区间越窄,说明估计越精确;置信区间越宽,说明估计越不精确,但更为可靠。
(4)我估计一个人的身高在10~300cm 之间,这一说法非常可靠,但是精确度很差,没什么实际价值。
(1)置信区间和P值在做出统计学结论的时候,结果是一样的。
(2)区别在于置信区间只是告诉我们一种概率,即当无效假设成立时,出现当前结果(或者更极端结果)的概率。
(3)但我们并不知道计算的结果与无效假设差别有多大,当样本例数很大时,即使轻微的偏离也会出现一个很小的P值。如无效假设为两组收缩压的差值为0,如果每组例数为10000人,那么即使两组收缩压的差值为0.1,也会出现P<0.05 的结论。但0.1这种差值是否有实际意义呢?仅从P值是看不出来的。
(4)置信区间还可以提示与无效假设的参数偏离有多远,如无效假设为两组收缩压的差值为0,最后计算95%置信区间为(0.1,0.15 ), 这至少提示两点:第一,两组差异有统计学意义,因为置信区间没有包含0; 第二,两组总体的差值并不大,因为我们有95% 的信心认为两组差值在0.1 ~0.15 之间。这说明尽管结果有统计学意义,但从专业角度来看,收缩压差别太少,没有太大的实际价值。这一信息是P值所无法提供的。
置信区间不仅可以看出两组是否有差异,还能说明差异多少,是否有实际价值。
一般来说,样本量越大,计算的置信区间越窄,精度越高,此时P值也会越小。因为样本量越大,抽样误差越小。当样本量跟总体一样多时(相当于普查),就没有抽样误差了,计算的置信区间就窄成了只有一个值。而此时也没有P值了,因为根本不用统计推断,计算的指标已经是参数了,也就没有“样本统计量推断总体参数”这一说法了。