今天聊聊数据的分布
对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集
对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集
任何抽样研究,抽样误差都是不可避免的。当我们抽取了一个样本,如何知道这个样本的特征,就一定是总体特征的真实反映,而不是由于抽样误差导致的假象呢?比如:正常的新生儿,体重平均是6斤半,某医生收集了35例早产儿的体重,平均体重是5斤。那么能不能从他收集的数据,直接得出早产儿的体重,要比足月的新生儿低这个结论呢。能不能下这个结论,最重要的,要解决一个问题:样本中的这30个数据,会不会存在较大的抽样误差,
Fisher's exact test is a statistical significance test used in the analysis of contingency tables. Although in practice it is employed when sample sizes are small, it is valid for all sample sizes.Wit
[细说统计]之-统计基础(2)统计学中的假设检验,是一种基于概率的反证法,我们称之为“小概率反证法”。与数学上的反证法不同,用假设检验的方法证明了的命题,也有可能是错误的。用假设检验的方法,证明小明同学作弊了,需要分三步走:Step 1:明确两个假设(命题),并明确冤枉小明的概率大小H0(无效假设):小明没有作弊H1(备择假设):小明作弊了检验水准:α=0.05(当拒绝H0、接受H1时,犯错的概率
[细说统计]之-统计基础(1)统计学由数学发展而来,因此统计学也构建于“概念”之上。作为细说统计系列的第一篇,本文用一张图,先把统计学中最重要的基本概念讲讲清楚。总体(population):由研究目的所确定的所有研究对象。如:想研究某降压药对高血压伴冠心病患者的疗效与安全性(研究目的),则研究的总体是高血压且伴有冠心病的所有患者。随机(random):事件结果的不确定性。比如,抛硬币落地后有两种