今天聊聊数据的分布

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中,数据在不同位置上往往具有不同的频数,数据的分布就是用来描述这个特征的。比如,男性和女性(某研究中定期进行锻炼的研究对象)的体重指数(计量资料)分布:体重指数(计量资料)分布再比如,在UCLA的演示数据集
任何抽样研究,抽样误差都是不可避免的。当我们抽取了一个样本,如何知道这个样本的特征,就一定是总体特征的真实反映,而不是由于抽样误差导致的假象呢?比如:正常的新生儿,体重平均是6斤半,某医生收集了35例早产儿的体重,平均体重是5斤。那么能不能从他收集的数据,直接得出早产儿的体重,要比足月的新生儿低这个结论呢。能不能下这个结论,最重要的,要解决一个问题:样本中的这30个数据,会不会存在较大的抽样误差,
Fisher's exact test is a statistical significance test used in the analysis of contingency tables. Although in practice it is employed when sample sizes are small, it is valid for all sample sizes.Wit
[细说统计]之-统计基础(2)统计学中的假设检验,是一种基于概率的反证法,我们称之为“小概率反证法”。与数学上的反证法不同,用假设检验的方法证明了的命题,也有可能是错误的。用假设检验的方法,证明小明同学作弊了,需要分三步走:Step 1:明确两个假设(命题),并明确冤枉小明的概率大小H0(无效假设):小明没有作弊H1(备择假设):小明作弊了检验水准:α=0.05(当拒绝H0、接受H1时,犯错的概率
[细说统计]之-统计基础(1)统计学由数学发展而来,因此统计学也构建于“概念”之上。作为细说统计系列的第一篇,本文用一张图,先把统计学中最重要的基本概念讲讲清楚。总体(population):由研究目的所确定的所有研究对象。如:想研究某降压药对高血压伴冠心病患者的疗效与安全性(研究目的),则研究的总体是高血压且伴有冠心病的所有患者。随机(random):事件结果的不确定性。比如,抛硬币落地后有两种
既然DeepTech深科技号称是关注三个方面:基于科学的发现;真正的科技创新;深科技应用的创新。既然你们要以科学的名义进行评价(review?),那么:一、关于文章的题目虽然你们写的不是论文,但尚未起跑已分高下,这样的题目,想要告诉读者什么?你们这个标题,起得足够科学吗??这和标题党有多大的区别?二、关于针对的患者人群(trial population)原文:两个试验,一个注册在国内的世卫组织临床
参加研究生的中期考评,发现很多人对研究中的统计学内容,表述不清,甚至错误。下面给出一个统计学处理的“通用模板”,在需要时进行适当的修改,就可以放到研究方案或者论文中了。统计学处理:1、统计软件SPSS 25/R 3.6.0/SAS 9.42、统计分析的基本原则所有统计推断,双侧检验设定检验水准α为0.05,单侧检验α为0.025;参数的可信区间估计采用95%可信区间。3、统计描述计量资料给出均数、
Wiki百科给出的多中心临床试验的定义非常简单[1]:A multicenter research trial is a clinical trial conducted at more than one medical center or clinic. 即其认为只要参与临床试验的临床中心或诊所数量超过1个,这个试验就是多中心的。而我国的《医疗器械临床试验质量管理规范》[2](国家食品药品监督管
CRF(病例报告表)作为临床试验/研究中,收集数据的载体(可能是纸质或电子化的),重要性不言而喻。良好设计的CRF可以使数据收集工作事半功倍,同时也有助于统计分析工作的顺利完成。一份设计良好的CRF,收集的数据应能够覆盖方案中规定收集的所有数据,而且没有重复收集的数据。然而,现实的情况,不容乐观。从经历的多个项目的CRF设计来看,设计中的问题很多,突出的是CRF的设计没有以方案与统计为目标,成了试
RankSchool NameAddressScore#1 in StatisticsStanford University (Department of Statistics)Stanford, CA5.0#2 in StatisticsUniversity of California--Berkeley (Department of Statistics)Berkeley, CA4.7#3 i