浅谈检验效能与样本量的关系

先明确概念,检验效能(Power)是指当备择假设为真时,拒绝原假设的概率。举例:想证明新药有效(而且确实有效,只是尚未被证实),统计上做这个证明的过程,是先假设新药无效,这个假设就叫原假设,用{$H_0$}表示;而“新药有效”即为备择假设,用{$H_1$}表示。如果统计分析(假设检验方法),能够证明{$H_0$}为假(注意:不是绝对的,是基于一定概率做出的这个推断),就能证明{$H_1$}为真(即

先明确概念,检验效能(Power)是指当备择假设为真时,拒绝原假设的概率。举例:想证明新药有效(而且确实有效,只是尚未被证实),统计上做这个证明的过程,是先假设新药无效,这个假设就叫原假设,用{$H_0$}表示;而“新药有效”即为备择假设,用{$H_1$}表示。如果统计分析(假设检验方法),能够证明{$H_0$}为假(注意:不是绝对的,是基于一定概率做出的这个推断),就能证明{$H_1$}为真(即

在新药研究中,都说RCT是临床试验金标准,而对照(Control)又以安慰剂(Placebo)对照为首选,但在实际操作中,因为伦理原因,很多适应症不可能只用安慰剂,如常见的心脑血管疾病、糖尿病、肿瘤等等。为了达到“与安慰剂对照”的效果,在研究设计中,常常设置一个所有患者都接受的基础治疗,在此基础上,再分别给予试验药或安慰剂。这种研究设计,严格来说不能称之为安慰剂对照,它属于复合处理对照,以A示基础

为了更新课件中的一个实例,我抛给Deepseek一个任务:16秒之后,它就给出了一个“看上去很靠谱”的实例:Deepseek不仅把实例给了我,而且还“相当专业”地进行了统计计算,给出了统计分析结果:还对结果进行了解释说明:至此,一切都perfect!然后,在我的再三追问之下,它把“原始数据集”给了我:我把数据集导入了SPSS(只为教学使用),一顿操作后发现,SPSS的分析结果与Deepseek给我

即使严格按照样本量计算结果确定研究规模,实施的结果也未必是达成目的。也就是样本量计算结果的可靠性,它取决于以下几个影响因素:1、在计算样本量时,所选择的把握度(Power = 1 - β )越大(当然,所需的研究规模也越大),达成研究目的的可靠性越高;2、计算样本时所设定的试验组、对照组的效应值越准确(越接近研究中的真实情况),达成研究目的的可靠性越高;所以,不要为了减小样本量计算结果,而刻意地低

当我们在研究中,遇到重复测量的数据,是否一定要使用重复测量的统计方法呢?答案当然是不一定。对于重复测量的数据,是否需要使用重复测量的统计方法,要根据研究实际和检验目的来确定,以两个降糖药(T vs C)的降糖试验为例:数据集中,FBG0W是2周导入期的初始(0天)空腹血糖水平,FBG2W是导入期末(14天)的空腹血糖水平,FBG4W、FBG6W、FBG10W、FBG14W分别是用药2周、4周、8周
很多同学在论文中描述自己的随机化方法为:使用随机数字表法进行随机化;这一方法,如果真地去实施的话,其实还怪麻烦的嘞。其实利用SPSS软件中的随机数发生器,可轻松实现随机化,感兴趣的戳这:用SPSS进行简单随机化(随机分组)。如果觉得上述方法还不够简单,还有更easy的方法(仅需输入3个参数,一键生成随机数字表,可下载为word文件保存):完全随机化(简单随机化)-在线随机化分组,这个随机化的程序,

很明显,这篇文章没有任何的技术性可言,写给临床试验行业的统计小白,普及一点生存分析的基本概念和基本常识。OS(overall survival),总生存时间,一般定义为从随机化(也可以是首次用药时间)至死亡的时间长度;这个指标几乎是任何肿瘤相关临床试验中都会采集的数据。所以OS(以及任何其它生存时间)的计算,肯定涉及两个时间点,一个起始时间、一个结局时间。起始时间,只要入组的受试者都会有,如随机化
样本量计算的目的:在一定检验效能(把握度)基础上,确定研究的最小规模。计算过程1、明确假设(1)明确研究设计类型,如完全随机、配对或随机区组设计;(2)确定研究的主要终点指标,也就是拿研究结果中最重要的那一个指标,作为计算样本量的依据;(3)上述主要终点指标的类型,是计量的还是计数的,是二分类还是多分类,是无序还是无序?2、指定检验水准一般双侧检验(即差异性检验)选定α=0.05,单侧检验α=0.

这个问题本来也没什么可说的,因为将近10年前,导师执笔的专家共识中已经明确:2016年FDA发布的指南当中也有相关的描述,和上述论文中给出的实践标准一致。可是近些年有一些其他作者,也包括一些国外的SCI论文中,对于非劣效临床试验的样本量计算问题,在实际举例时,采用了α=0.05的设定(其实是双侧),这就给人一种错觉,好像我们可以将传统假设检验0.05的水准,原封不动地应用于非劣效试验。对于非劣效的
网上很多文章,讲得过于复杂,甚至有些内容都是错的。这里简单概括下相关分析和回归分析的本质区别:相关分析的两个或多个变量之间,不需要因果关系(可以有也可以无,有的话也无需区分谁是“因”谁是“果”),而回归分析,需要事先确定变量当中谁是“因”谁是“果”,即需要确定的因果关系。另外(感兴趣的可以继续),对于两者的分析结果:相关分析,从变量间数量上共变的关系去阐述结果;而回归分析,是从自变量如何影响应变量