从美国CDC网站下载NHANES数据并进行整合

为了制作一个方差分析相关的课件,去美国CDC网站下载了几个数据集并进行了整合。过程很简单,记录如下:因为要用到糖化血红蛋白检测结果以及人种、年龄、是否糖尿病患者等数据,所以要下载3个数据集:先进入站点:NHANES Questionnaires, Datasets, and Related Documentation (cdc.gov)选择一个比较近的年份 NHANES 2017-2018:下载列

- 阅读全文 -

今天聊聊数据的分布

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集

- 阅读全文 -