临床试验简史
方法论发展史

对照试验

# 早期的“临床试验”

由于科学发展的原始性，古人这种对观察对象的主观认知有时候是很荒谬的。比如，他们常常通过类比联想来对很多观察对象的功效进行推断，从而做出很多轻率的“假设”。如《本草纲目》里提到：孕妇若吃了兔肉，生的儿子则会得“兔唇”；如吃蟹，“令子横生”；吃姜，“令儿盈指”；吃鳖，“令子项短”；吃雀肉，则“令子心淫情乱，不畏羞耻”；吃泥鳅和黄鳝会导致“滑胎”，等等。今天看起来，这些联想无不令人匪夷所思。

这种随机的观察性研究有其先天的局限性，即观察者无法排除无处不在的各种干扰因素。因此，也就无法解决以下两个问题：

问题

某个患者的病症向好不一定与药物的应用有关；

某个患者的病症未见好转，也不一定就是药物本身没有疗效

# 最早的对照试验

阿维森纳是与希波克拉底和盖伦比肩的古典医学三巨匠之一，其巨著《医典》集希波克拉底和盖伦之大成。虽然，在今天来看，《医典》的医学理论绝大部分是错误的，但直到17世纪，它一直是西方国家的医学教科书。

阿维森纳做了一个试验，仅凭这一试验的光芒，就足以让他流芳千古。阿维森纳把两只体质相同、喂养方式也相同的小羊放在两个完全不同的环境里圈养。一只小羊的生活环境平静而安逸，另一只小羊却邻狼笼而居。不久以后，与狼为邻的小羊逐渐消瘦而死去。这一试验有力地证明了不良环境对生命状态的影响。这一证明之所以是“有力”的，是因为它明确地做到了两点。

第一，设立了对照。通过设立对照，把施加和未施加某干预措施（如本试验中的“与狼为邻”）对两只小羊进行比较，从而能够识别出干预措施是否真正发挥了作用。

第二，强调了受试对象间的可比性。除了环境不同，两只小羊的体质和喂养等条件均同质可比。因此，最后的结果差异可以判断是环境因素所致。

走出无知的第一步是认识并承认自己的无知。为了认识到进行对照试验的必要性，就必须对旧的理论和实践提出怀疑，并且承认无知。医师必须承认自己不知道是新疗法好，还是旧疗法好，并且愿意接受任何的试验结论。然而，专家和医生们往往为了维护自己的权威，不断地在捍卫这些“真理”的地位，并且不愿怀疑自己，不愿承认无知。

另外，这也涉及伦理和技术的问题。医生认为必须用最好的方法治疗患者，这是理所当然的。如果对部分患者停用可能有益的旧疗法，而针对新的疗法展开试验，医患双方都会认为这是不道德的，并且存在很大的安全风险。而这里面的伦理和安全风险问题，远远不是那时候的伦理学发展以及技术发展水平可以解决的。

于是，万古如长夜，在等待一盏明灯。

# 伟大的坏血病试验

1519年，葡萄牙航海家麦哲伦（Magallanes）率船队开始了首次环球航海。这一壮举的意义，不亚于20世纪的阿波罗登月之旅。这一次航海行动历时3年，出发时共270人，回到西班牙的时候，只剩下了18个人。这里面除了小部分人是在航海中发生冲突而丧命（包括麦哲伦自己）外，多数船员死于一种可怕的怪病，这种怪病就是现在所谓的“坏血病”。之后200多年的大航海时代，坏血病成为远洋海员所恐惧的“夺命瘟神”。

1747年，詹姆斯·林德（James Lind）在这个问题上取得了重大进展。

1747年5月20日，林德再次随船出海。这一次，他有机会实施了其亲自设计的试验，这一试验也使他的名字永垂史册。

试验是在出海两个月之后开始的，彼时坏血病患者开始在船上大量出现。林德选择了12个严重的病例，他们的牙齿已经开始发臭，皮肤出现瘀斑，疲乏无力，双膝软弱。林德把他们分成6组，每组2人。这12个人每天吃的正餐都相同，但每组添加的辅食则不同。这些辅食正是当时流传的治疗坏血病的民间方法，分别如下。

第一组：每日喝四分之一磅（约200ml）苹果汁。
第二组：每日三餐前服25滴芳香性硫酸，并用强酸性漱口剂含漱。
第三组：每日三次空腹服两茶匙醋。
第四组：把腿浸在流动的海水中（另类的治疗方法）。
第五组：每日吃两个橘子和一只柠檬。
第六组：每日三次服一种用大蒜、芥末、秘鲁香油等制成的配剂。

试验进行到第6天的时候，因为水果被吃光而被迫中止，然而这并不影响效果的显著性。吃橘子和柠檬的两位患者，其中一位已经恢复工作能力，另一位也基本康复。而其他组的患者则病情依旧甚至发生恶化。试验结果说明，橘子和柠檬有可能治好坏血病。

这项试验的开拓之处、伟大之处在于

第一，设立对照组。林德将试验对象分成若干组，用以对比治疗效果。林德设立的对照组包括了5组之多，囊括了当时主要的坏血病治疗手段。对照的理念在林德设计的试验里得到了强化和确认。

第二，在林德的试验中同时纳入了12个患者，每组2人。这虽然还远远谈不上大样本，更不要说样本量确定的科学性，但是林德表现出了通过增大样本量，减少意外因素的干扰，保证结果可重复性的伟大意识。

第三，注意了组间齐同可比性。林德的试验里的6组共计12人，病情基本相似，主食基本一致，唯一不一样的就是每天所提供的辅食。因此，林德的坏血病试验是人类历史上第一次系统的、有对照的临床试验，真正意义上走出了神农尝百草时代证实药物疗效的困境。

对照试验方法从此站稳了脚步，并且在后来的发展中，逐渐成为了临床试验的基本方法。而林德的试验也被认为是临床试验的开山之作。

提示

正因为这一试验的意义非凡，每年的5月20日，也就是林德随船出海的那一天，被定为“国际临床试验日”。

对照的思维非常伟大，犹如照妖镜，能够去伪存真。特别是对于一些自限性疾病（不需要治疗便可以自愈），到底是治愈的，抑或自愈的，一对照（也就是空白对照组）就可能真相大白。

# 安慰剂效应

18世纪，英国名医威廉·库伦（William Cullen）提出了“神经症”的概念。库伦甚至认为所有疾病都可以看作某种神经紊乱所致。医生则应该根据患者的情况，选择特定的药物治疗患者的紊乱；而对那些无药可治的患者，他主张用一些没有治疗作用的药物来安抚他们的紊乱。库伦给这些没有治疗作用的药物使用的名称就是placebo，也就近似于今天的“安慰剂”的含义了。

库伦历史性地将placebo这个词语引入医学实践，并且赋予了其褒义的内涵。由于库伦在医学界的崇高地位和影响力，这个词语的医学内涵被逐渐推广。1785年，再版的英国《新医学词典》正式将placebo一词收录进新医学词汇，并将其定义为“无特定疗效的方法或药物”。

从此，库伦彻底转换了placebo的词义，将它从一个宗教词汇转义为医学术语——安慰剂。也就是说，库伦所定义的安慰剂，是一些本身没有任何治疗作用的药物。但因为患者对医生的信任、患者的自我暗示以及对某种药物疗效的期望等，故而起到一定镇痛、镇静或缓解症状的作用。对安慰剂内涵的范畴，不限于药物，还包含了一切基于此原理的药物和其他的治疗方法（安慰疗法）。

伊莱沙·珀金斯（Elisha Perkins）是英国在北美康乃狄克殖民地的一名医生。美国独立后，珀金斯于1796年获得一项发明专利：一种命名为珀金斯牵引器的治疗仪——两根3英寸（约7.5cm）的长铁铜合金棒。珀金斯声称该治疗仪可治疗头部和脸部的炎症以及风湿和疼痛。治疗方法很简单，用治疗仪在患病部位按压20分钟，就可以把有害的致病电子液引出体外。珀金斯宣布他的珀金斯牵引器治愈了5000人，并且在欧洲受到热烈追捧。他更是争取到了欧美多位著名医生以及社会名人的支持，连美国第一任总统乔治·华盛顿也买了一套。

1799年，英国名医约翰·海加斯（John Haygarth）着手研究珀金斯牵引器的真实效果。他设计了一个对照试验。第一天，他使用木头仿制的帕金斯金属棒，给5位风湿病患者进行治疗，其中4位患者表示疼痛得到缓解。第二天，他用珀金斯牵引器对他们进行治疗，同样有4位患者报告了病情缓解。海加斯的结论是：这两种干预措施缓解症状的效果并没什么差别，根本就用不着使用这么昂贵的金属棒。更可贵的是，海金斯进一步认识到：心灵的热情和由想象引起的期待可能会对身体状态和疾病进程产生神奇而强大的效应。

这就是安慰剂效应的由来。

因为有了安慰剂效应的概念，在与空白组比较的情景下，我们则会面临一个新的困境：无法判断是新的治疗措施在发挥作用，还是安慰剂效应在起作用。而海加斯天才般地通过木头来模拟治疗仪，人为地设置了一个“安慰剂对照组”，从而解决了空白对照组不能检验安慰剂效应的难题。

此后，与安慰剂组对照成为新药临床试验的不二法则。也就是说，要证明一个新药的临床有效性，不但要看该药物是否对患者有疗效，还要看是否比安慰剂更有效。所谓“更有效”，意指满足以下2项或至少其中1项条件：

该药物比安慰剂能影响更多的患者。
该药物比安慰剂能引起更强的治疗效果。

但是，事实并不是这样简单，在对照组中使用安慰剂，存在着科学和伦理问题。

首先，由于安慰剂效应的不稳定性，安慰剂组能否在整体上表现出安慰剂效应，这是一个疑问。如果安慰剂组实质上并未表现出安慰剂效应，那么研究药物组即使发现了治疗效应，也可能是安慰剂效应，而不是研究药物本身的效应。因此，有必要对安慰剂本身在试验中的真实效应做研究。比如，在安慰剂对照的临床试验中，再加设一个不接受任何治疗的空白对照组，这样就能真正排除安慰剂效应了。然而，事实上目前基于安慰剂对照的临床试验设计基本上没有考虑这个问题。

另外，在伦理上，使用安慰剂至今仍然是一个纠缠不休的貌似无解的问题。安慰剂的使用存在科学上的必要性，但是又在客观上剥夺了一部分受试者接受最有希望的有效治疗手段的机会，这是违反伦理的。而关于在临床试验中被迫使用安慰剂对照的看似苛刻的条件限定，有时候又是那么苍白无力而且无法落实。

总之，始于18世纪末的安慰剂，从其历史浮沉中得到的结论就是：安慰剂不是万能的，但是安慰剂效应是真实存在的。所以在对照临床试验中，增加一个安慰剂对照组从而排除安慰剂效应的干扰，是非常有必要的。

上次更新: 2023/06/02, 14:41:40

← 前言盲法试验→