差异有统计学意义在医学论文中出现频率相当高,很多人都知道这个结论对应的P值是小于0.05(检验水准)的。但是这句话的真实含义是什么?一个实例给大家讲清楚。

先说结论:

差异有统计学意义,是指:我们看到的这个差异(在样本中观察到的),是源于真实的差异(存在于总体人群中)。

【实例】

来自Karmaus与Wolf(1995)的研究,调查了42名孕妇(其中22人吸烟),获得了新生儿的出生体重,数据如下:

640.png

如果我们采用独立样本t检验方法,结果为:

640-17812468054681.png

基于0.05的检验水准,我们认为:组间差异有统计学意义

即:我们所观察到的差异(样本中的均值差0.375Kg)是由总体差异(在总体人群中,吸烟的孕妇与不吸烟的孕妇,其新生儿体重的均值有差异)所决定的,而不太可能是由抽样误差(本来吸烟不会影响新生儿体重,但因为抽样时的随机误差,我们在样本中偶然性地观察到了组间差异)导致的。

如果我们只用上述数据中的一部分,比如两组各随机抽取8人的数据,再做一次分析(仍为t检验),结果却变成了:差异没有统计学意义

640-17812468054682.png

虽然我们观察到的组间差异变成了0.489Kg,比全部数据的0.375Kg更大,但是p值却变大了,无法得到阳性结论。

所以这里的:差异没有统计学意义,并不是组间没有差异,而是我们观察到的这个差异,无法排除是随机误差原因导致的,所以此时,我们无法得到总体中两个孕妇群体的新生儿体重存在差异,也不能认为这两个群体中的新生儿体重没有差异。这就是所谓的阴性结论。

抛开差异没有统计学意义这种说法,我们针对8 vs 8的这个结果,还可以按如下方式给出统计推断的结论:

当前研究的结果,尚无充分(或明确)的证据,表明吸烟的孕妇与不吸烟的孕妇,其新生儿体重存在差异。

这里的证据不充分或不明确,其实就是提示:这个阴性结果,可能是因为样本量太小导致的,并非真得吸烟不影响新生儿体重。这就像我们在单位食堂吃饭,如果10次中有8次菜太咸,我们基本可以排除后厨大师傅手抖的巧合(排除随机误差的干扰);但如果我们是第1次去食堂吃,这1次太咸,我们其实就无法分清,到底这是他的风格,还是他今天的心情,有异于日常。

最后总结:

差异有/没有统计学意义:差异是观察到的,有统计学意义是指样本间的差异可外推到总体间的差异;而无统计学意义,就意味着基于样本观察到的差异是不能外推的(因为无法排除随机误差的影响)。