当P值<0.05时,我们可以下结论说,组间的差异有统计学意义了。

有些研究者在报告类似结果(P<0.05)时,用差异具有显著性这个表述。

显著性(significant)这个词,很多时候可能会产生歧义,比如P<0.01非常显著,P<0.001极显著,等等。读者在看到显著这个用词时,往往会联想到差异显著,也就是差异很大的意思。

但实际上,P值非常小,组间的差异不一定大,也可能是样本量大,或者组内变异很小。比如我们在上一篇文章中用到的卡方检验的例子:

有效率85% vs 70%,当每组样本量各80例时,P=0.0231,此时对两总体率差的点估计是15%,95%置信区间是(1.02%, 28.98%),也就是两组的疗效差异应该在这个区间内;

保持上述样本率不变,各组样本量增加到240例,则卡方检验的P值<.0001,结果极显著,但是
对两总体率差的点估计仍是15%,95%置信区间为(7.23%, 22.77%),置信区间的下限提高了,但上限降低了,其实随着样本量的持续增加,这个区间将持续收窄,也就是精度越来越高,但不会下限、上限同时增大(右移)。

所以P值越小,只能说组间有差异的证据越充分,而它不是差异大的直接证明