重复试验
# 可重复性
是否引入随机化后,我们就已经解决了临床试验评价方法学的所有问题,可以确保结果的可靠性了?仔细想想,就会发现一个一直没有提及的更大的根本性问题。随机化分组之后进行的比较,得到的是A组和B组患者的疗效差异的结论,但是我们需要的却是A药和B药的疗效差异的结论。
这两者有差别吗?当然,而且区别很大!区别就在于,A组和B组患者,仅仅是服用A药和B药的患者的两组样本,而不等同于服用A药和B药的所有同类患者的总体。
假设我们在临床试验中发现,A组患者的疗效优于B组患者,那么我们就可以得出结论:A组患者的疗效优于B组患者。但是,我们不能得出结论:A药的疗效优于B药。因为,A组患者和B组患者仅仅是服用A药和B药的患者的两组样本,而不等同于服用A药和B药的所有同类患者的总体。
也就是说,即使做到了随机,试验结果的可重复性也不一定必然经得起考验,即从样本试验得到的结果不一定能够反映总体的真实效应。那么,如何避免或者降低结果的偶然性,从而真实地反映总体的真正效应呢?办法是有的,就是增大样本量。
# 样本量
在临床试验中,样本量的大小是由试验的设计者根据试验的目的和研究的假设来确定的。样本量的大小直接影响到试验结果的可靠性,也就是说,样本量越大,试验结果的可靠性越高。那么,如何确定样本量呢?这就需要用到统计学的知识了。
首先,如果要证明A药的疗效优于B药,我们需要首先针对每一个研究案例进行明确的界定:优效的标准是什么?比如,治疗糖尿病的A药和B药,到底两者在降低血糖的效果上差距达到多少才算是优或者劣?这个疗效指标值的差距需要明确的量化,通常由临床专家来界定。
再则,我们已经知道频率与概念之间永远不能画上绝对的等号,也就是说,重复试验(多个样本)的结果,仍然一定有犯错误的可能性。比如,本来A药和B药的疗效没有差异,而我们的试验结果却有差异;或者反之。
因此,在每一个具体的临床试验设计中,需要预先决定我们可以容忍的结果犯错的概率,这需要统计学专家的参与。在以上参数设定了的基础上,我们就可以通过公式来计算样本量了。这个样本量,就是在我们设定的参数前提条件下,临床试验中需要的最小样本量
。