为什么一个小的p-value要比大的p-value值要更有意义
首先要明白p-value的定义:P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。
总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。
所以的小的pvalue说明一件事:不是小概率事件发生了,就是原假设是错的。
比如:一个生产厂家专门生产一种重量为50g的砝码.结果生产了一批,最后用统计方法测得均值47.6标准差20,算出pvalue只有3%,意味着可能是小概率事件发生。
比如机器有小故障、技术人员玩忽职守、昼夜温差大影响生产人员心情等等,但以上情况发生的概率只有区区0.03,或者该生产厂家就不是生产50g的砝码。
大的pvalue说明还没有足够的证据拒绝原假设,并不是一个积极的态度接受原假设,这个说法要从原假设和对立假设的确立说起,这两个假设的地位根本不是平等的。
扩展资料:
P值(P value)的发展史
R·A·Fisher(1890-1962)作为一代假设检验理论的创立者,在假设检验中首先提出P值的概念。他认为假设检验是一种程序,研究人员依照这一程序可以对某一总体参数形成一种判断。也就是说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。
Fisher的具体做法是:
假定某一参数的取值。
选择一个检验统计量(例如z 统计量或Z 统计量) ,该统计量的分布在假定的参数取值为真时应该是完全已知的。
从研究总体中抽取一个随机样本计算检验统计量的值计算概率P值或者说观测的显著水平,即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
如果0.01<P值<0.05,说明较弱的判定结果,拒绝假定的参数取值。
如果P值>0.05,说明结果更倾向于接受假定的参数取值。
可是,那个年代,由于硬件的问题,计算P值并非易事,人们就采用了统计量检验方法,也就是我们最初学的t值和t临界值比较的方法。
统计检验法是在检验之前确定显著性水平α,也就是说事先确定了拒绝域。但是,如果选中相同的α,所有检验结论的可靠性都一样,无法给出观测数据与原假设之间不一致程度的精确度量。
只要统计量落在拒绝域,假设的结果都是一样,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际上的显著性有较大的差异。
因此,随着计算机的发展,P值的计算不再是个难题,使得P值变成最常用的统计指标之一。
所以的小的pvalue说明一件事:不是小概率事件发生了,就是你的原假设是错的。
比如 一个生产厂家专门生产一种重量为50g的砝码。结果生产了一批,最后用统计方法测得均值47.6标准差20,算出pvalue只有3%,意味着可能是小概率事件发生,比如机器有小故障,技术人员玩忽职守,昼夜温差大影响生产人员心情,但以上情况发生的概率只有区区0.03;或者你这个生产厂家压根儿就不是生产50g的砝码。 此时你更愿意相信哪个判断呢?
大的pvalue说明还没有足够的证据拒绝原假设,并不是一个积极的态度接受原假设,这个说法要从原假设和对立假设的确立说起,这两个假设的地位根本不是平等的。
p-value越小,confidence interval越大。以双侧检验为例,如果p-value = 2.5%,则置信区间(confidence interval) = 95%,如果p-value = 1%,则confidnece interval = 98%。
在假设检验中,confidence interval越大,说明检验结果准确性越高。