显示分类
最新发表
最后回复
最热评论
精华内容
377
0
StatX 发表于 2013-10-20 7:04 am

R软件被越来越多的科研人员用来进行统计计算与分析绘图,其更新速度也是越来越快,虽然使用者感觉到的变化不大。

不知SAS公司有没有压力。今年8月8日发布(也可能是更新的,我在暑假时才看到)的《R的合规性与验证问题-在注册用临床试验中使用R的指南》,给了我们一个明确的信息,R作为一款统计软件,虽然是开源、免费的,但其应用到SAS这种商业软件占据的领域,其验证性可以得到保证。

虽然目前还没有听说有用R软件进行临床试验的统计分析并用于注册的,但随着R的广泛应用和实际检验,FDA或许会公开承认R软件在临床试验中使用的“合法性”。

401
0
StatX 发表于 2013-10-20 3:00 am

最近有个同学的同学,问我关于样本量的问题,他很想知道,“我做N例,够不够”。这是一个很难让人回答的问题。

我很理解这些需要在实验室做试验的同学,想要发SCI,而自己的时间往往又很有限,所以,最好做个3例5例的,样本量不要太大。

回到样本量上。如果你能承受的样本量很小,其实根本无需计算。我的理解,统计对于这些样本量很小的研究,其实意义不大,描述性统计足够了,主要还是从专业角度(非统计角度)去讨论结果。

446
1

我实验设计类型属前后历史对照,就是两个独立样本的对照,但是最终数据不会是正态分布,不会有均数±标准差这样的数据。

我也从文献中找出来一个对照组的实验数据:M±IQR(91±9),就是中位数±四分位间距。请问能计算样本量吗?

334
0
tybtyb 发表于 2012-10-17 2:22 am

当对比两个位点的血压的测量值是否等效时,对计算样本量时,界值是指什么?用什么计算样本量方法

3.8k

新版的在线样本量计算工具由dot05.com移植而来,但采用了新的架构(原为R+Rserve,现为R+rApache),根据需要可在云服务器上扩展其计算能力。 对于新的样本量计算工具: 

1. 尚未进行算法的验证,验证工作将在1年内完成;

2. 将扩展部分样本量计算方法;

3. 将推出部分收费服务,以满足不同用户需求。

最新回复: chopper  ·  2020-07-04 6:15 pm
970
1

既然DeepTech深科技号称是关注三个方面:基于科学的发现;真正的科技创新;深科技应用的创新。既然你们要以科学的名义进行评价(review?),

那么:

一、关于文章的题目

虽然你们写的不是论文,但尚未起跑已分高下,这样的题目,想要告诉读者什么?你们这个标题,起得足够科学吗??这和标题党有多大的区别?

二、关于针对的患者人群(trial population)

原文:

两个试验,一个注册在国内的世卫组织临床试验注册一级平台,一个注册在美国的clinicaltrials.gov。我分别在两个平台上查阅了这两个试验的资料,确实如DeepTech深科技文章中所言,双黄连的试验排除了需要机械通气、危重型新冠肺炎患者,就是针对轻、中症患者的,我想这一治疗定位,与大家心里对于双黄连的定位,还是比较恰当的。但是反过来,瑞德西韦的试验,会入组哪些病人,其中有多少是危重的,只能等到试验数据公布时,我们才会知道,我们不能想像它就是针对重症患者的,虽然它没有明确排除危重患者,但,在瑞德西韦的试验方案中,排除标准的第1条是:

Physician makes a decision that trial involvement is not in patients' best interest, or any condition that does not allow the protocol to be followed safely.

也就是说,最终还是由医生决定某个患者是否入组。所以,最终这个试验入了哪样的患者,等试验结果公布。

三、关于药物结构与机理

原文:

这一段,你们大概是要告诉读者,双黄连天生不行。

我想说的是,它们俩本来就不一样,这种比较的意义何在?不过话要说回来,就算双黄连天生不行,也不代表瑞德西韦天生就行。开展临床试验的目的,就是要验证它们行不行。

在人体之外的试验,只是参考,毕竟人体是一个极其复杂的系统,进入人体会怎么样,疗效与安全性如何,要看最终的临床试验结果。瑞德西韦在理论上可以阻断病毒的复制,在体外实验中也有不错的表现,但据报导,在刚果开展的治疗埃博拉病毒的试验失败了。所以,在试验结果未出之时,行与不行的主观猜想,很显然不符合所谓科学的定位。

我们关注一个药物,核心的,应该是它的疗效与安全性,而非它的出身。 成份复杂,机理不清,正是我们深入研究的原由,而非打压的噱头。成份单一,机理清晰,只能为将来可能的疗效与安全性,提供一个相对容易的预测基础,而不代表将来的结果。

四、关于试验的设计

原文:

随机、对照、双盲的临床试验设计,可以看作是开展临床研究的金标准。瑞德西韦的试验采用双盲设计,客观讲,更为严谨科学。

但没有采用双盲设计,就不科学了? 在你们和某些专家眼里,确实非常不科学。

不过,在R.A.Fisher提出实验设计三原则的时候,还没有所谓的“双盲”。事实上,避免组间偏倚的最重要的手段,仍然是随机化。盲法的采用,只是让可能存在的偏倚尽可能再小些。

我们不应抓住设不设盲这个问题不放,盲不与盲,在严格随机、客观评价的情况下,不太可能从根本上改变试验的结果。

当然站在严谨、科学的角度,我也赞成试验在尽可能的情况下要设盲,能双盲就别单盲,能单盲就别开放,事实上,这是我给申办者一贯的建议。

但是,我们也不要迷信双盲(双盲试验设计仍然有可能被人为操作,国外不少试验造假、或者选择性地报导结果也是事实),同时把开放性试验妖魔化,或者猜想它的结果会怎么怎么样(此处略去几个字。。。),如果要质疑,请以科学的态度,凭借双盲与否就主观臆断研究者的态度,实属不该。这是其一。

其二,我更关心的,是试验的对照。双黄连采用了复合对照的方式(类似有基础治疗的安慰剂对照),即两组都接受常规治疗,试验组要加用双黄连,所以在最后比较时,要采用优效性检验,即,必须证明试验组优于对照组。否则,试验失败。

瑞德西韦的试验,采用了安慰剂对照,而且,我确实没有在公开的资料(clinicaltrials.gov)中看到两个组有接受基础治疗的说明,如果真的是单纯安慰剂对照,而无基础治疗,那么问题来了:这个试验的伦理是怎么考虑的?既然是随机双盲,而且是两组平行对照,那么理论上有一半(1:1对照的情况;如果是2:1对照,也有151例之多)的患者将进入安慰剂组。2003年我刚刚进入临床试验领域时,就从孙晓春博士那里知道了临床试验的两个核心问题:伦理与科学,而伦理(可以简单地理解为受试者的安全与权益),是第一位的,如果伦理与科学有冲突,那么,我们要站伦理一边。

如果瑞德西韦这个试验确实没有设置基础治疗,我想这个试验的伦理委员会专家们要出来给一个说法。

其三,关于主要终点指标的选择

原文:

从两者方案的注册资料看,主要终点的设计,瑞德西韦的比双黄连更严谨。其实双黄连的试验设计,国内当前的中医药研究中比较常见,众多中医药的研究,确实需要提高研究的设计水平,这是咱的心里话

但是,瑞德西韦与双黄连比,就没毛病了?你们,包括文中出现的这些专家(得罪了啊),既然要质疑那就本着科学的态度,两者的优缺点,全部列一列,客观地比一比。不能只拿一个的优点与另一个的缺点相比。

瑞德西韦的设计有没有可挑剔的地?

  • 主要终点,进行了修改(虽然不是大改,但确实是改变了评价标准);

  • 样本量刚注册时写的452,后来改为453,我很奇怪,Study Arms 那里明明写的2个试验组,453如何随机的,由原来的1:1对照,改成2:1对照了?在试验的中间修改随机化方法,这可是临床试验的大忌;另外有没有区组,有没有中心分层?

  • 关于试验终点,瑞德西韦共设计了:从6死亡到1出院共6个等级,主要终点TTCI是下降2个等级所用的时间,那么肯定是没有从6降到4的情况了,而且从5到3、从4到2、从3到1,都是下降两个等级,但病情的变化难度是相同的吗?(谁知道!)不同的变化程度对应的时间是不是要分层进行分析,而作为一个采用“生存分析”的试验,定义治愈、未愈的结局,会不会更好?等等。

五、最后,关于两个药物的安全性

原文:

我看了2014年的国家药品不良反应监测年度报告,确实有“中成药口服制剂排名前五位的品种分别是:双黄连合剂(口服液、颗粒、胶囊、片)”这一句,但是没有明确是按照什么标准排的,是报告不良反应的总数,还是发生的比例(排在首位这一句前面,一直是说报告的总数)。如果是报告的总数,那我们就得考虑实际的销量。如果是因为销量大排在前列,而实际发生的比例不高,那就是另外一种情况了。

瑞德西韦的安全性,很好?没有大规模的用药记录,目前已有的样本量和实验室研究,并不足以支持其安全性的说法。美国FDA审过上市的药,还有后来因为安全性问题退市的呢,何况一个还没上市的在研新药。所以安全性上不要妄下结论。搞统计的,看重的是用数据说话的,无论中西,都要用真实、准确、完整的数据说话。


写在最后:

其实每个试验的设计,都是从试验能够取得成功出发的,每个研究者也都有自己的考量。试验设计的水平确有高下,要质疑也没有问题,有问题提出来,大家共同提高。

在临床试验行业将近20年,亲身的感受,是国内临床试验的水平,这些年其实提高不少。但也确实存在一些设计不够严谨、不够合理的情况(很多情况是受限于研究经费),存在的问题,提出来应该是为了进一步提高我们的试验水平。

但是我反对厚此薄彼式的评价,站一个踩一个。如果一个事物的好与坏,已经在人的脑子里形成,那很可能就没有了公正、科学地评判,而在科学的名义下,这样的行为就更具危害性。

2.3k
0

参加研究生的中期考评,发现很多人对研究中的统计学内容,表述不清,甚至错误。

下面给出一个统计学处理的“通用模板”,**在需要时进行适当的修改**,就可以放到研究方案或者论文中了。

**统计学处理:**

1、统计软件

SPSS 25/R 3.6.0/SAS 9.4

2、统计分析的基本原则

所有统计推断,双侧检验设定检验水准α为0.05,单侧检验α为0.025;参数的可信区间估计采用95%可信区间。

3、统计描述

计量资料给出均数、最小值、最大值、标准差和95%可信区间,必要时给出P25、中位数和P75等;配对计量资料还应给出差值的均值和标准差;计数资料给出频数与百分数。

4、统计检验

**(两组间)**计量资料采用成组t检验,不满足正态性假设时使用Wilcoxon秩和检验;计数资料用Pearson χ2检验或Fisher确切概率法;等级资料用Wilcoxon秩和检验。考虑协变量时,二分类资料用logistic回归,等级资料用等级logistic回归。重复测量计量资料可采用重复测量方差分析方法。

**(两个以上组)**计量资料采用方差检验,不满足正态性假设时使用Kruskal-Wallis秩和检验;计数资料用Pearson χ2检验或Fisher确切概率法;等级资料采用Kruskal-Wallis秩和检验。考虑协变量时,二分类资料用logistic回归,等级资料用等级logistic回归。重复测量计量资料可采用重复测量方差分析方法。

3k
0
StatX 发表于 2019-06-21 7:18 am

Wiki百科给出的多中心临床试验的定义非常简单[1]:

A multicenter research trial is a clinical trial conducted at more than one medical center or clinic. 即其认为只要参与临床试验的临床中心或诊所数量超过1个,这个试验就是多中心的。

而我国的《医疗器械临床试验质量管理规范》[2](国家食品药品监督管理总局 中华人民共和国国家卫生和计划生育委员会令第25号)则在附则中明确规定:多中心临床试验,是指按照同一临床试验方案,在三个以上(含三个)临床试验机构实施的临床试验。

但在药物的GCP(现行与征求意义稿)中,对多中心试验的中心数量并没有明确的要求,如现行药物的GCP中,仅明确:多中心试验是由多位研究者按同一试验方案在不同地点和单位同时进行的临床试验。在FDA的相关文件与指南中,也没有明确的定义多中心试验中心的数量要求。

对于多中心临床试验,其实核心的要素是两个,一是统一的研究方案,二是多个研究中心。所以Wiki从参与中心的数量上去定义多中心临床试验,只是简单的一个方面。

对多中心的定义与理解,应更多地从从统计学角度考虑。多中心,统计上能够为研究的目标人群在不同地域进行“均匀”抽样提供保证,特别是在不同地域人群中潜在的相关基因型不同的情况下,试验的效应可能会有所不同,所以在不同地域选择不同中心,通过检验各中心的试验效应是否存在异质性,既有助于验证是否存在相关的潜在因素,也有利于得到一个更加接近研究总体真实效应的结果。

所以从这个意义上讲,多中心临床试验应该是不同地域、不同医疗条件与水平的研究中心参与下的临床研究。在具备条件的基础上,根据研究规模,至少应跨地域选择3个中心来实施临床试验。当然,从试验操作与管理的角度,中心数量增加、地域的扩大,意味着试验的管理难度也更大,投入的人力物力也会更多,但试验的进度可能更快,试验的规模也可以更大。

Ref:

[1] https://en.wikipedia.org/wiki/Multicenter_trial

[2] http://samr.cfda.gov.cn/WS01/CL0053/148101.html

4.1k
0
StatX 发表于 2019-06-14 10:59 am

CRF(病例报告表)作为临床试验/研究中,收集数据的载体(可能是纸质或电子化的),重要性不言而喻。良好设计的CRF可以使数据收集工作事半功倍,同时也有助于统计分析工作的顺利完成。

一份设计良好的CRF,收集的数据应能够覆盖方案中规定收集的所有数据,而且没有重复收集的数据。然而,现实的情况,不容乐观。从经历的多个项目的CRF设计来看,设计中的问题很多,突出的是CRF的设计没有以方案与统计为目标,成了试验信息的大杂烩。很多不需要的试验过程信息,重复收集的数据,大大增加了填写CRF表的工作量。而达成试验目的所需的数据,往往收集得不够充分,甚至该收集的没有收集。

这里举两个简单的例子:

这里记录了受试者的入组编号,下面又收集了受试者的分组信息。对于随机试验(这个CRF就是针对随机试验的),入组编号实则是随机号(这个写得有点不明确),而随机号对应的就是相应的组别,即便这里只是打个钩画个叉的事,但也是重复收集了数据,这样的地方多了,数据收集的效率自然就降下来了。

再比如这种:

这里,只需提供一个提示即可,或者干脆去掉,无需收集是否发生AE、是否有合并有药。正常的情况下,有AE发生就应记录在AE记录中,AE记录中没有的,那就应该是没有发生,同理合并用药的情况。

那么,应如何高效地进行CRF的良好设计?

以下有几个大的原则

1. 专业的事让专业的人来做。

CRF应该由DM主导设计,医学人员协助,统计人员审核。

2. CRF设计围绕方案进行(前提是方案设计得够好),以达到方案中统计分析对数据的要求为目标。

CRF中最主要的数据,包括疗效评价数据(方案中主要终点、次要终点怎么规定的?)、安全性评价的若干数据(方案中怎么规定的?)、基线的数据(人口学特征、既往史、病情基本情况、以及可能影响终点评价的其它影响因素的信息)、干预的信息(如随机编号、用药量、时间窗、试验期间的合并治疗等)、完成试验与否等。

3. CRF的设计要有模板,并尽可能模块化。

如AE的内容基本固定,合并用药、人口学特征、既往病史等所收集的数据,不同项目上也基本一致。所以对每一部分的内容形成模块化,固定内容与形式,并在此基础上形成不断更新完善的CRF模板。有助于快速地完成CRF设计。

下面的这个PPT是之前在广州的一次培训上用的,其中有CRF设计的一些具体技巧,可供大家参考。

该主题下的所有帖子将 已删除 ?
前一页
下一页
选择 取消选择主题
待审的草稿 ... 点击恢复编辑
放弃草稿