从美国CDC网站下载NHANES数据并进行整合

为了制作一个方差分析相关的课件,去美国CDC网站下载了几个数据集并进行了整合。过程很简单,记录如下:因为要用到糖化血红蛋白检测结果以及人种、年龄、是否糖尿病患者等数据,所以要下载3个数据集:先进入站点:NHANES Questionnaires, Datasets, and Related Documentation (cdc.gov)选择一个比较近的年份 NHANES 2017-2018:下载列

- 阅读全文 -

今天聊聊数据的分布

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集

- 阅读全文 -

统计推断的实质与内涵

任何抽样研究,抽样误差都是不可避免的。当我们抽取了一个样本,如何知道这个样本的特征,就一定是总体特征的真实反映,而不是由于抽样误差导致的假象呢?比如:正常的新生儿,体重平均是6斤半,某医生收集了35例早产儿的体重,平均体重是5斤。那么能不能从他收集的数据,直接得出早产儿的体重,要比足月的新生儿低这个结论呢。能不能下这个结论,最重要的,要解决一个问题:样本中的这30个数据,会不会存在较大的抽样误差,

- 阅读全文 -

常在河边走, 哪有不湿鞋--关于假设检验与检验水准α

[细说统计]之-统计基础(2)统计学中的假设检验,是一种基于概率的反证法,我们称之为“小概率反证法”。与数学上的反证法不同,用假设检验的方法证明了的命题,也有可能是错误的。用假设检验的方法,证明小明同学作弊了,需要分三步走:Step 1:明确两个假设(命题),并明确冤枉小明的概率大小H0(无效假设):小明没有作弊H1(备择假设):小明作弊了检验水准:α=0.05(当拒绝H0、接受H1时,犯错的概率

- 阅读全文 -