统计学中p值的意义是什么?
2023-11-01 · 百度认证:SPSSAU官方账号,优质教育领域创作者
p值,也称显著性值或者Sig.值,用于描述某件事情发生的概率情况,其取值范围是0~1,不包括0和1,通常情况下,一般有三个判断标准一个是0.01、0.05以及0.1。在绝大多数情况下,如果p值小于0.01,则说明至少有99%的把握,如果p值小于0.05(且大于或等于0.01),则说明至少有95%的把握,如果p值小于0.1(且大于或等于0.05),则说明至少有90%的把握。
在统计语言表达上,如果p值小于0.01,则称作0.01水平显著,例如,研究人员分析X对Y是否存在影响关系时,如果X对应的p值为0.00(由于小数位精度要求,展示为0.00),则说明X对Y存在影响关系这件事至少有99%的把握,统计语言描述为X在0.01水平上呈现显著性。
如果P值小于0.05(且大于或等于0.01),则称作在0.05水平上显著。例如,研究人员在研究不同性别人群的购买意愿是否有明显的差异时,如果对应的P值为0.01,则说明在0.05水平上呈现出显著性差异,即说明不同性别人群的购买意愿有着明显的差异,而且对此类差异至少有95%的把握。绝大多数研究希望P值小于0.05,即说明研究对象之间有影响、有关系或有差异等。但个别地方需要P值大于0.05,如方差齐性检验时需要P值大于0.05(此处P值大于0.05说明方差不相等)。
可以利用SPSSAU进行计算,假设计算方差分析中的p值,从而判断模型是否显著。分析不同学历对某产品的满意度是否有显著性差异。
如果手工计算,需要计算出F值,最后查表,然后判断是否有显著性差异,最后得到结论,使用SPSSAU直接将分析项拖拽到分析框内(过程简单,这里不展示),最后得到F值为0.606,p值为0.613大于0.1,说明不同学历对产品满意度没有显著性差异。
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。
在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05≥p>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。
所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。