无限总体与有限总体

Finite versus Infinite Populations从概念上,无限总体指总体中的个体数是无限的,当然没有绝对的无限,是相对而言,数量足够大而已;有限总体则是指总体中的个体数是有限的或固定的。区别总体的“无限”或“有限”,除了数量上的定义,也可以从样本角度去考虑:如果抽样研究(非放回)的样本量对于总体的个体数影响很小或几乎无影响,就可以认为总体是“无限”的。在实际应用中,需要区别无限

- 阅读全文 -

SAS报表输出效率 WPS vs WORD

自动生成1000个表格并填充数据,WPS用了35分钟,生成的doc文件将近9M,打开文档进行操作,相当卡顿。同样的代码,用word生成,只要10分钟,生成的doc文件700多k,打开文档进行操作,相比wps好很多。不清楚为什么会这样。WPS想要赶超M$ Office,看来还有很长的路要走... 虽然如此,一般情况下的文档编辑我觉得WPS还是不输给M$的。所以,WPS仍然

- 阅读全文 -

临床试验数据质量的评价

这是今天CDMC学组会议的主要讨论内容。过程“非常热闹”,所以多少有点影响效率。不过,整个过程还是收获不小,毕竟在场的有国内临床试验的监管者,也有不少行业的先行者和大腕专家。其实评价临床试验的数据质量很难,虽然GCP里对数据的要求,只有真实、准确和完整这三项基本的要求,然而,如何通过一套定性、定量的指标体系,去评价它,FDA没有现成的东西,SFDA也没有。临床试验的数据质量,不只涉及DM,因为数据

- 阅读全文 -

实验室检查的名称要编码吗?

首先,根据我的了解,目前没有这样的编码系统。其次,编码的目的是什么?当然是标准化。标准化之后,可以准确地识别这些信息。而实验室检查的名称是否有必要标准化?个人觉得必要性不大,毕竟现在临床上所做的检查,最起码那些基本的,试验中常用到的,没有能混淆的项目。

- 阅读全文 -

哪种EDC系统更好用

会上某位同仁提出的问题。这其实是一个没有答案的问题。因为没有一个客观的标准,可以评价一个EDC系统是否“好用”。我接触的EDC并不多,国外的,OC用过,inform进入系统粗略了解过,Rave看过它的界面和功能,没登入过它的系统。国内几家做EDC的也或使用或见识过,从感受上来讲,我觉得,一个EDC系统,在满足法规及数据管理本身的要求基础上,功能越简单越好,菜单越少越好,页面上的各种线框及表单越简洁

- 阅读全文 -

EDC是否需要双录入

今天会上有人提问,专家们也给出了回答。这里只谈下我的看法。从理论上讲,数据录入的双录入方式,通过最后的一致性核验,来发现录入错误从而保证录入的质量,也即录入后的数据与“数据源”的一致性。很显然,无论是纸质的CRF,还是原始的数据形式,双录入都可以提高录入质量,但不能提高数据记载的准确性。为什么在实践当中,EDC均采用一次录入呢?个人认为,最主要的原因,是基于纸质CRF的数据管理过程,与完全基于ED

- 阅读全文 -

临床试验数据管理中SDV

Source Data Validataion (SDV)DocumentDocumentation of Informed ConsentAdverse event source documentationstudy termination source documentCase Report Form v/s Source DocumentsCRF not intended to replac

- 阅读全文 -

SAS查找数据集中重复值的3种方法

第一种方法:利用sort过程步的dupout和nodupkey,原始的test数据集将输出为_unique和_dups两个数据集。proc sort data = test out=_unique dupout = _dups nodupkey ;by var; run ; 第二种方法:在数据步中利用by和first.var and Last.var。注意:此_dups和上面的_dups得到的结果

- 阅读全文 -

使用plotmath在R的plot中写公式

plotmath中的表达式及其对应的公式如图:例: formula = expression(italic(Prob) == bgroup("(",atop(n, x),")")%%p[1]^x%%(1-p[1])^(n-x)) 把上述formula插入到plot中,显示如下:虽然比不上LaTex中公式那么漂亮,但在R中无需LaTex支持,这也是不错的选择。

- 阅读全文 -