显示分类
最新发表
最后回复
最热评论
精华内容
712
0
StatX 发表于 2020-03-30 10:43 pm

[细说统计]之-统计基础(1)

统计学由数学发展而来,因此统计学也构建于“概念”之上。作为细说统计系列的第一篇,本文用一张图,先把统计学中最重要的基本概念讲讲清楚。

总体(population):由研究目的所确定的所有研究对象。如:想研究某降压药对高血压伴冠心病患者的疗效与安全性(研究目的),则研究的总体是高血压且伴有冠心病的所有患者。

随机(random):事件结果的不确定性。比如,抛硬币落地后有两种结果,正面朝上与朝下,在结果出现之前,哪个结果都有可能。统计学中有两个重要的随机过程:随机抽样与随机化,其核心是机会均等与不可人为干预(后面会有专门一篇讲到随机)。

样本(sample):从总体中随机抽取的部分个体。

统计量(statistics):描述样本信息的定量指标。比如均数、标准差,或者例数与百分比,等等定量指标,用于描述样本时,称为样本的统计量。而这些指标如果是针对研究总体,则被称为总体的参数(parameter)。统计量与参数分别用不同的符号表示,比如样本的标准差用S表示,而总体的标准差用σ表示。

统计描述(statistical description):用描述性统计量,定量地描述样本信息。是统计方法中的一种。

统计推断(statistical inference):利用样本信息,推断总体特征。是统计方法中的另一种。所以,其实统计就只有两大类方法:统计描述与统计推断。

统计推断又有两种方法:

参数估计(parameter estimation):用样本信息,估计总体参数。比如:已知样本量为400、均数为120cm,标准差为10cm,对总体均数进行估计,如果直接用120cm作为总体的均数,这种估计方法被称为点估计(point estimation),另一种估计方法是区间估计(interval estimation),即构造一个具有一定置信水平(confidence level,也称可信度,通常为95%)的置信区间(confidence interval,也称可信区间),上述样本对总体均数估计的95%CI为(119.02, 120.9smile

假设检验(hypothesis test):用样本信息,对关于总体的命题进行推断。设总体均数为μ,参数估计是:求μ=?,而假设检验则是:判断μ=120?

最后,什么是统计学?统计学,简言之,是统而计之,研究对象只有一个,就没有统计的必要。但我们面对的研究对象往往不止一个,而且情况千差万别(随机性),只能利用数学的手段,对样本信息进行描述,并在一定概率水平上,利用样本信息对总体特征进行刻画。

统计分析过程,涵盖资料的收集、整理、分析以及结果的解释利用等,并非单纯地把数据进行分析、出几个图表。

统计学最重要的作用,是为验证科学假设提供了另一种技术手段。伴随统计学的发展,生命科学,特别是临床研究才取得了长足进步。

2020/03/20


404
0
管理员 发表于 2020-03-01 11:19 am

1. 样本量计算功能

1.1 计量资料的样本量计算

1.1.1 单组均数比较(与目标值)的差异性、非劣/优效性、等效性检验的样本量计算方法

1.1.2 两组均数比较(成组设计)的差异性、非劣/优效性、等效性检验的样本量计算方法

1.1.3 多组均数比较(3或4个组,方差分析或多重比较)的样本量计算方法

1.2 计数资料的样本量计算

1.2.1 单组率的比较(与目标值)的差异性、非劣/优效性、等效性检验的样本量计算方法

2. 随机化

2.1 简单随机抽样

注:开放的功能,算法已进行了验证。未来,将主要以SAS中的算法为标准。

296
0

这个系统最早始于10年前,当时还没去读博士,还在一个大的申办方做着临床试验的工作。当时是出于自己的爱好,另外也是因为自己正处于由PM向统计师过渡的阶段,开发这样一个提供在线样本量计算的东西,当时还觉得挺Cool。

现在提供样本量计算的网站也有不少了,更有一个公司开展了线上的统计计算业务。

为什么我还要再造个轮子?

为什么有了SAS,还会有SPSS,Stata、Minitab等等,还会有R这样的开源统计软件,就说这样本量统计的软件,就不只NCSS的PASS,还有nQuery、G*Power等。统计世界的多样性。

我是一名统计工作者,也是StatIX的开发者,而且专注临床试验与医学研究领域,所以StatIX会重点以这个领域中的应用作为立脚点。

StatIX目前处于起步阶段。我们的脚步有些缓慢,但我们的脚步从未停歇。

2020,注定是不平凡的一年。

以上。


880
0

去年9月服务器升级后,导致近半年来样本量计算功能无法使用。 

期间一直在修改系统,因为科研教学任务比较重,所以一直没有完成。 

现在新的统计服务器已经建立,计算流程已经理顺,算法也已恢复,并且对部分算法进行了验证(SAS 9.4与SPSS15),经验证的计算功能,已于今日正式开放。

后续将在算法验证后,陆续开放其它计算功能。

3.6k
6
StatX 发表于 2017-08-07 6:04 pm

这个文档译自UCLA的《CHOOSING THE CORRECT STATISTICAL TEST IN SAS, STATA, SPSS AND R》,只列出资料类型及对应方法,方便大家查阅。

各方法的SAS、SPSS及R具体实现代码,可参考原文。

附件:选择正确的统计方法(译).pdf

最新回复: 管理员  ·  2017-08-07 6:04 pm
分类
浏览设置
隐藏帖子详情
启用无限滚动载入
该主题下的所有帖子将 已删除 ?
前一页
12345 ... 7
下一页
待审的草稿 ... 点击恢复编辑
放弃草稿