吸烟孕妇的宝宝轻了375克，大样本说"有意义"而小样本说"没意义"-关于统计学意义的真相

差异有统计学意义在医学论文中出现频率相当高，很多人都知道这个结论对应的P值是小于0.05（检验水准）的。但是这句话的真实含义是什么？一个实例给大家讲清楚。

先说结论：

差异有统计学意义，是指：我们看到的这个差异（在样本中观察到的），是源于真实的差异（存在于总体人群中）。

【实例】

来自Karmaus与Wolf（1995）的研究，调查了42名孕妇（其中22人吸烟），获得了新生儿的出生体重，数据如下：

如果我们采用独立样本t检验方法，结果为：

基于0.05的检验水准，我们认为：组间差异有统计学意义。

即：我们所观察到的差异（样本中的均值差0.375Kg），是由总体差异（在总体人群中，吸烟的孕妇与不吸烟的孕妇，其新生儿体重的均值有差异）所决定的，而不太可能是由抽样误差（本来吸烟不会影响新生儿体重，但因为抽样时的随机误差，我们在样本中偶然性地观察到了组间差异）导致的。

如果我们只用上述数据中的一部分，比如两组各随机抽取8人的数据，再做一次分析（仍为t检验），结果却变成了：差异没有统计学意义。

虽然我们观察到的组间差异变成了0.489Kg，比全部数据的0.375Kg更大，但是p值却变大了，无法得到阳性结论。

所以这里的：差异没有统计学意义，并不是组间没有差异，而是我们观察到的这个差异，无法排除是随机误差原因导致的，所以此时，我们无法得到总体中两个孕妇群体的新生儿体重存在差异，也不能认为这两个群体中的新生儿体重没有差异。这就是所谓的阴性结论。

抛开差异没有统计学意义这种说法，我们针对8 vs 8的这个结果，还可以按如下方式给出统计推断的结论：

当前研究的结果，尚无充分（或明确）的证据，表明吸烟的孕妇与不吸烟的孕妇，其新生儿体重存在差异。

这里的证据不充分或不明确，其实就是提示：这个阴性结果，可能是因为样本量太小导致的，并非真得吸烟不影响新生儿体重。这就像我们在单位食堂吃饭，如果10次中有8次菜太咸，我们基本可以排除后厨大师傅手抖的巧合（排除随机误差的干扰）；但如果我们是第1次去食堂吃，这1次太咸，我们其实就无法分清，到底这是他的风格，还是他今天的心情，有异于日常。

最后总结：

差异有/没有统计学意义：差异是观察到的，有统计学意义是指样本间的差异可外推到总体间的差异；而无统计学意义，就意味着基于样本观察到的差异是不能外推的（因为无法排除随机误差的影响）。

吸烟孕妇的宝宝轻了375克，大样本说"有意义"而小样本说"没意义"-关于统计学意义的真相

添加新评论

最新文章

最近回复

分类

标签

归档

其它