非劣效临床试验的样本量计算, 检验水准α到底选择0.05还是0.025

这个问题本来也没什么可说的,因为将近10年前,导师执笔的专家共识中已经明确:2016年FDA发布的指南当中也有相关的描述,和上述论文中给出的实践标准一致。可是近些年有一些其他作者,也包括一些国外的SCI论文中,对于非劣效临床试验的样本量计算问题,在实际举例时,采用了α=0.05的设定(其实是双侧),这就给人一种错觉,好像我们可以将传统假设检验0.05的水准,原封不动地应用于非劣效试验。对于非劣效的

- 阅读全文 -

相关分析和回归分析的区别?

网上很多文章,讲得过于复杂,甚至有些内容都是错的。这里简单概括下相关分析和回归分析的本质区别:相关分析的两个或多个变量之间,不需要因果关系(可以有也可以无,有的话也无需区分谁是“因”谁是“果”),而回归分析,需要事先确定变量当中谁是“因”谁是“果”,即需要确定的因果关系。另外(感兴趣的可以继续),对于两者的分析结果:相关分析,从变量间数量上共变的关系去阐述结果;而回归分析,是从自变量如何影响应变量

- 阅读全文 -

从检验效能角度说说统计推断下结论的方式

对于数据的正态性检验,方差齐性检验,还有重复测量方差分析中的球形性检验,如果P>0.05,则我们就认为满足正态性、方差齐性和球形性假定(也就是接受了H0),但是,为什么进行差异性检验,P>0.05时我们没有接受H0,即没有作出无差异的推断呢?统计推断就像是法官判案,对于正态性检验、方差齐性检验以及球形性检验,适用了“疑罪从无”的原则,也就是P>0.05时(证据不足)接受了原假设,

- 阅读全文 -

从美国CDC网站下载NHANES数据并进行整合

为了制作一个方差分析相关的课件,去美国CDC网站下载了几个数据集并进行了整合。过程很简单,记录如下:因为要用到糖化血红蛋白检测结果以及人种、年龄、是否糖尿病患者等数据,所以要下载3个数据集:先进入站点:NHANES Questionnaires, Datasets, and Related Documentation (cdc.gov)选择一个比较近的年份 NHANES 2017-2018:下载列

- 阅读全文 -

今天聊聊数据的分布

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集

- 阅读全文 -