当前位置：文档库 › 统计学中的P值

统计学中的P值

P值是论文中最常用的一个统计学指标，可是其误用、解释错误的现象却很常见。因此，很有必要说明p值的意义、用法及常见错误。

P值指的是比较的两者的差别是由机遇所致的可能性大小。P值越小，越有理由认为对比事物间存在差异。例如，P<0.05,就是说结果显示的差别是由机遇所致的可能性不足5%，或者说，别人在同样的条件下重复同样的研究，得出相反结论的可能性不足5%。P>0.05称“不显著”；P<=0.05称“显著”，P<=0.01称“非常显著”。

由于常用“显著”来表示P值大小，所以P值最常见的误用是把统计学上的显著与临床或实际中的显著差异相混淆，即混淆“差异具有显著性”和“具有显著差异”二者的意思。其实，前者指的是p<=0.05，即说明有充分的理由认为比较的二者来自同一总体的可能性不足5%，因而认为二者确实有差异，下这个结论出错的可能性<=5%。而后者的意思是二者的差别确实很大。举例来说，4和40的差别很大，因而可以说是“有显著差异”，而4和4.2差别不大，但如果计算得到的P值<=0.05，则认为二者“差别有显著性”，但是不能说“有显著差异”。

由于“有显著差异”和“差异具有显著性”容易混淆，因而现在有些期刊提倡用“差异有统计意义”来代替“差异有显著性”，用“差异无统计意义”、“差异有高度统计意义”来代替“差异不显著”和“差异有高度显著性”。例如《中华胃肠外科学》即是如此。

如果P>5%，是否我们就可以下结论说比较的二者没有差别呢？不能。P>5%只能说明没有充分的证据说明二者确有差别，但是也不能说二者没有差别或差别很小。在这两个极端之间还有一个过渡区间，即无论下有差别还是没有差别或差别很小的证据都不足。要推断二者没有差别或差别很小，需要采用等效检验的统计推断方法。

结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。专业上，p值为结果可信程度的一个递减指标，p值越大，我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联，我们重复类似实验，会发现约20个实验中有一个实验，我们所研究的变量关联将等于或强于我们的实验结果。（这并不是说如果变量间存在关联，我们可得到5%或95%次数的相同结果，当总体中的变量存在关联，重复研究和发现关联的可能性与设计的统计学效力有关。）在许多研究领域，0.05的p值通常被认为是可接受错误的边界水平。

显著性差异(significance level)，是一个统计学名词。它是统计学（Statistics）上对数据差异性的评价。当数据之间具有了显著性差异，就说明参与比对的数据不是来自于同一总体（Population），而是来自于具有差异的两个不同总体，这种差异可能因参与比对的数据是来自不同实验对象的，如比－西一般能力测验中，大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变，因而前测后测的数据会有显著性差异。例如，记忆术研究发现，被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异，这一差异很可能来自于学××记忆法对被试记忆能力的改变。

显著性差异是一种有量度的或然性评价。比如，我们说A、B两数据在.05水平上具备显著性差异，这是说两组数据具备显著性差异的可能性为95％。两个数据所代表的样本还有5％的可能性是没有差异的。这5％的差异是由于随机误差造成的。

通常情况下，实验结果达到.05水平或.01水平，才可以说数据之间具备了显著性差异。在作结论时，应确实描述方向性（例如显著大于或显著小于）。

如果我们是检验某实验（Hypothesis Test）中测得的数据，那么当数据之间具备了显著性差异，实验的虚无假设（Null Hypothesis）就可被推翻，对立假设（Alternative Hypothesis）得到支持；反之若数据之间不具备显著性差异，则实验的备则假设可以被推翻，虚无假设得到支持。