点击标题下「蓝色微信名」可快速关注
文章来源: 中华结核和呼吸杂志, 2016,39(06): 488-491
作者:黄琳娜 夏金根 詹庆元
随机对照研究(randomized controlled trial,RCT)是一种常用的临床研究方法,主要用于评价某项临床干预措施与其他干预措施的疗效差异。RCT研究设计的核心理念是"随机化",即入组的不可预见性。通常在RCT研究方案制定时,即要求对研究目的进行假设,再根据研究假设限定入组病例数和统计方案,待研究完成后,利用相应的研究方法对结果进行统计分析。
一、重症医学领域RCT研究现状RCT作为循证医学中证据级别最高的临床证据逐渐得到临床医生的认可和重视。通常,不是所有的RCT研究都会出现阳性结果。2008年Critical Care Medicine发表的一篇综述对重症医学领域的RCT进行了总结[1],结果显示72项RCT中,只有10项干预措施能够显著降低患者病死率,55项研究未能发现病死率有任何改变,所占比例高达76%,而另外7项研究甚至报告干预措施显著增加了病死率;6年后的一篇综述[2]对146项RCT研究进行了分析,结果显示仅54项(37%)研究得到了阳性结果。
近期,《新英格兰医学杂志》发表的有关严重全身性感染和脓毒症休克的3项RCT研究同样得到了阴性结果,即早期目标指导治疗[3]、维持更高的平均动脉压目标[4]以及纠正低白蛋白血症[5]均不能降低患者的病死率。据此,我们发出感慨"难道重症医学领域评估病死率的多中心RCT注定要失败?"
关于ARDS的RCT研究结果也同样令人沮丧,ALVEOLI[6]、EXPRESS[7]及LOV研究[8]提示,与低呼气末正压(PEEP)相比,高PEEP并不降低ARDS患者的病死率;OSCAR研究[9]提示高频振荡通气不能降低ARDS患者的病死率,OSCILATE研究[10]甚至得到了有害的结果;此外,关于ARDS患者应用β2受体激动剂[11]、应用糖皮质激素[12]、早期肠内营养[13]的研究也均未得到阳性结果;仅有的几项结果阳性的RCT,如针对小潮气量的ARMA研究[14],针对俯卧位通气的PROSEVA研究[15]及针对体外膜肺氧合的CESAR研究[16],也从未得到重复验证。
面对现实,我们应何去何从?RCT结果理应受到重视,并在一定程度上影响和指导临床决策和行为,但在将其结果应用于临床实践时需谨慎分析研究可能存在的问题。
二、RCT研究存在的问题
任何RCT研究都可能存在一定的偏倚风险[17],偏倚风险也称为内在真实性,是评价一项研究的核心与前提,没有内在真实性,更无需谈及研究的临床价值大小和实用性。一项研究是否对研究对象进行了严格的随机化分配,是否对研究对象、研究实施者及结果评价者采用了盲法,结果的分析是否包含了全部纳入的研究对象,是否进行了严格随访追踪,结果报告时是否仅选择了阳性结果报告等一系列的问题,可分别归结为选择偏倚、实施偏倚、随访偏倚、测量偏倚及报告偏倚[17,18]。
三、RCT研究的解读(PICO原则)
解读一篇RCT的研究结果除了考虑到研究本身的问题外,还需要考虑到以下因素:(1)研究对象的选择(participants,P),(2)干预措施的实施(intervention,I),(3)对照组的选择(comparison,C),(4)临床结局的选择(outcome,O),可简称为PICO原则。
1.研究对象的选择(P):
RCT的研究对象多经过严格的挑选,与临床实际患者或许具有显著差别,可能抹杀了患者的个体差异。
2012年柏林标准[19]对ARDS的定义包括:(1)具有明确高危因素,1周内急性起病;(2)影像学表现为双肺弥漫浸润影;(3)除外心源性因素引起的呼吸衰竭;(4)符合特定的氧合指数要求。此标准存在一定的局限性,其诊断主要依靠临床症状、影像学表现及病理生理学指标,并非病因或病理学诊断。肺部浸润影可见于多种疾病,包括感染性及非感染性疾病;心源性肺水肿的除外需借助肺动脉导管、脉搏波导向的持续心排监测(PiCCO)及超声等相关检查,单纯依靠临床症状及影像学表现除外心源性因素较为困难,因此,临床诊断ARDS患者合并心源性肺水肿的情况并不少见。此外,一项针对临床诊断ARDS患者开胸肺活检的研究[20]提示:临床诊断ARDS的患者病理学可表现为典型的弥漫性肺泡损伤(diffuse alveolar damage,DAD),也可表现为特异性感染、弥漫性肺泡出血或机化性肺炎等,因此部分临床诊断ARDS患者实则并非为真正的ARDS患者。由此可见,临床诊断ARDS的患者可能具有不同的病因,甚至并非为真正的符合病理学意义的ARDS。
ARDS可囊括一组高度异质性的疾病群,因病因及病情严重程度不同,其肺泡可复张性不同,ARDS越重,肺泡可复张性越大[21],而氧合指数可在一定程度上反映患者的病情严重程度;此外,ARDS最大的特点即肺部病变的不均一性,即基本正常、完全实变及吸气相开放而呼气相塌陷的肺泡共存。因此,我们不难解释3项关于高PEEP能否降低ARDS病死率的RCT研究[6,7,8]得到阴性结果的原因:由于研究对象病情严重程度的异质性较高,因此肺泡可复张性的差异较大,高水平PEEP可维持呼气相陷闭的肺泡开放,但可导致相对正常的肺泡过度充气造成肺损伤。一项Meta分析[22]将ARDS患者按照氧合指数是否>200 mmHg(1 mmHg=0.133 kPa)分为2组,发现高PEEP可使氧合指数<200 mmHg的患者获益,由于此类患者病情较重,具有较高的肺泡可复张性。因此,如果进行RCT研究前评估患者的肺泡可复张性,入选可复张性较大的患者,则高PEEP很可能降低ARDS患者的病死率。
此外,研究对象样本量的大小也会影响研究结果,过小的样本量难以达到对病死率的统计学差异[2]。
2.干预措施的实施(I):
2013年,《新英格兰医学杂志》发表了2篇针对高频振荡通气(high-frequency oscillatory ventilation,HFOV)的研究[9,10],即OSCAR及OSCILATE研究,结果为阴性甚至有害结果。两项研究均为大样本量RCT研究,研究对象基本情况相似,且中心均有丰富的HFOV经验,两项研究结果差异较大的原因可能在于两项研究的干预措施不同:OSCILATE研究实施HFOV前常规行肺复张,实施HFOV过程中采用较高的平均气道压,研究中初始的平均气道压为30 cmH2O(1 cmH2O=0.098 kPa),且常常增加到38 cmH2O,肺复张及过高的平均气道压带来的风险包括:(1)导致肺泡过度充气,可能增加气压伤风险;(2)影响循环,导致血管活*药性**物及镇静(或肌肉松弛)药物用量增加;(3)过量的镇静(或肌肉松弛)药物造成痰液引流障碍,增加呼吸机相关肺炎的发生率。因此,可解释OSCILATE研究得到了HFOV有害的结果。
另一项关于干预措施影响最终研究结果的例子为针对体外膜肺氧合(extracorporeal membrane oxygenation,ECMO)治疗成人ARDS的3项RCT研究。1979年[23]及1994年[24]的两项ECMO治疗成人ARDS的研究结果均为阴性,2009年CESAR研究[16]得到了阳性结果,即ECMO可降低成人重症ARDS的病死率,分析研究结果差异的原因可归结为3点:(1)CESAR研究中心具有丰富的ECMO经验;(2)ECMO过程中机械通气支持水平较低,采用了"肺休息策略"(Ppeak为20~25 cmH2O,PEEP为10~15 cmH2O,呼吸频率为10次/min,FiO2为0.3);(3)ECMO前行机械通气间短(分别为35 h和8.6 d);(4)出血及血栓并发症风险发生率低。
综上,一项干预措施的选择首先应符合生理学及病理生理学常识,干预时机的选择、干预时间及干预强度是否足够,研究团队经验是否丰富均为影响研究结果的重要因素。一项好的干预措施可充分发挥治疗效果,并最大程度地降低不良反应。
3.对照组的选择(C):
对照组的选择可直接影响RCT结果。选择对照组时需要考虑以下几个问题:(1)对照组与试验组间基线资料是否匹配,不匹配时是否进行了校正;(2)对照组与实验组间干预措施的差异程度是否合适,差异过大或过小均会影响实验结果;(3)对照组的病死率是否与同时期、同类人群的病死率一致,是否存在某些混杂因素导致对照组病死率升高或降低。
2000年ARDSnet的研究结果表明[14],ARDS患者应用小潮气量通气策略可改善病死率。该研究纳入了53例患者,常规通气组采用12 ml/kg潮气量,而保护性通气组采用≤6 ml/kg的潮气量,结果表明,接受保护性通气者的28 d病死率显著低于接受常规通气者(分别为38%和71%),这是对照组的选择可能影响最终实验结果的较为经典的案例。同期的3项小规模的关于ARDS患者应用小潮气量通气策略的RCT研究[25,26,27]并没有得出阳性结果,仔细分析原因可以看到:ARDSnet的研究与同期研究入选及排除标准相似,但关于试验组及对照组潮气量的选择差异较大,ARDSnet中试验组及对照组的潮气量分别为(6.2±0.8)ml/kg和(11.8±0.8)ml/kg,同期研究中试验组及对照组的潮气量分别为(7.0±0.7)ml/kg和(10.7±1.4)ml/kg。当患者的功能残气量(functional residual capacity,FRC)相似时,VT/FRC反映形变(即应变)的大小,故较小的潮气量引起的应变较小,产生的应力较小。与同期研究相比,ARDSnet的研究中试验组中选择了相对小的潮气量,而对照组选择了相对大的潮气量,导致两组间应变差异大,因此产生的肺损伤程度更明显,导致结果出现显著性差异。
4.临床结局的选择(O):
研究结果表明,结局的选择会影响RCT是否出现阳性结果。
一项关于146例RCT的研究[2]中,以病死率为主要结局指标的40例,以感染相关结局为主要结局指标的33例,以呼吸机相关结局为主要结局指标的30例,主要结局指标为阳性结果的百分比分别为10%、58%及43%。2009年Huh等[28]针对ARDS患者PEEP选择方法的研究中,试验组进行肺复张后用递减法选择PEEP,对照组应用表格法选择PEEP,该研究以氧合改善情况为主要临床结局指标,以28及60 d病死率为次要临床结局指标,尽管与对照组相比,递减法设定PEEP并不能降低病死率,但可明显改善氧合情况,而对于伴有危及生命的严重低氧的ARDS患者而言,氧合的改善可能使患者获益。可见,研究结果的阴性或阳性取决于主要结局指标的选择,以病死率为判断标准,则阳性结果比例低。临床实践中,病死率受到多方面因素的影响,单纯以病死率判断一项干预措施的有效性可能并不科学,一些替代指标,如无机械通气时间、ICU住院时间、总住院时间、肺外脏器衰竭数目及生理学相关指标可能更能真实地反映干预措施的疗效。
5.PICO原则的应用举例——PROSEVA研究结果的解读:
俯卧位通气(prone position ventilation, PPV)可显著改善通气-血流比,直接改善氧合,并减轻重力依赖区肺组织的压迫,包括心脏对下肺的压迫及上肺对下肺的压迫,从而改善了重力依赖区的通气,使病变更加均一[29]。早期研究[30]表明ARDS患者行俯卧位通气并不降低病死率,2010年针对早期研究的Meta分析结果[31]显示:对于病变较轻(氧合指数>100 mmHg)的患者,PPV无改善病死率的作用,但对于病变较重(氧合指数≤100 mmHg)的患者,PPV可降低病死率,可能的原因在于重度ARDS较轻中度ARDS不均一性更明显,PPV效果可能更好。
针对上述矛盾的研究结果,国内外进行了一系前瞻性随机对照研究。一项多中心RCT[32]将466例严重ARDS患者随机分为俯卧位组(维持俯卧位至少16 h/d)和仰卧位组(半卧位)。严重ARDS的定义为:在FiO2至少为0.6,PEEP至少为5 cmH2O,VT潮气量接近6 ml/kg预计体重时,氧合指数低于150 mmHg。最终结论为:在严重ARDS患者中,早期施行延长时间的俯卧位通气可显著降低28和90 d病死率。2013年的PROSEVA研究[15]在具有丰富俯卧位通气经验的单位中入选了466例重度ARDS患者,所有患者均实施肺保护性通气策略且俯卧位通气时间至少16 h/d,结果显示无论28、90 d病死率还是28、90 d无机械通气时间均得到明显改善,提示重症ARDS患者行PPV不仅显著改善生理学指标且可改善预后。按照PICO原则分析仔细分析这一研究可发现:(1)对研究对象(P)进行了严格的要求:所有入选患者必须为重度ARDS患者,必须满足氧合指数< 150 mmHg(PEEP ≥5 cmH2O, FiO2≥0.6时),而其余几项大型RCT研究,如2001年Gattinoni等[30]及2004年Guerin等[33]的研究,入选患者的平均氧合指数虽然也低于150 mmHg,但仍纳入了氧合指数200~300 mmHg的轻度ARDS患者;(2)对干预措施(I)进行了严格的规定:①PPV开始时间早:于机械通气12~24 h后,而2001年Gattinoni等[30]的研究并未交代PPV开始时机,2004年Guerin等[33]的研究中,PPV均开始于机械通气12~24 h后,2009年Taccone等[34]的研究中PPV开始于机械通气72 h内;②PPV持续时间长:俯卧位通气时间至少16 h/d,而2001年Gattinoni等[30]及2004年Guerin等[33]的研究中平均PPV时间约为7 h/d及9 h/d;③PPV必须在肺保护性通气策略基础上进行;④参研单位需具有5年以上的俯卧位通气经验;(3)对照组的选择(C)存在一定的问题:①对照组与PPV组基线特征不匹配,对照组患者病情更加危重,表现在SOFA评分以及升压药物的需求高于PPV组,使得研究结果可能更有利于PPV组;②PPV组患者更多使用神经肌肉阻滞剂,这可能放大了PPV疗效,因为已有研究证实神经肌肉阻滞剂可降低ARDS患者病死率;③对照组病死率高达32%,显著高于同期ARDS研究报告的病死率,可能进一步导致研究结果向PPV组倾斜;(4)临床结局的选择(O):研究不仅选择了病死率等较为客观的指标,也选择了诸如氧合指数、无机械通气时间等替代指标,全面、客观地评估了PPV的疗效。
因此,对于PROSEVA得出的阳性结果,我们既应学习其对于研究对象及干预措施的严格选择和规定,也应考虑到由于对照组选择过程中存在的问题对结果造成的影响,从而更加准确地解读研究结果。
四、RCT阴性结果的意义
很多"没有统计学意义"的临床研究结果是研究者所不愿意看到的,但一项设计严谨的RCT得出的阴性结果在临床实践中具有重要的价值。我们知道,临床医疗的原则在于"首先,不应对患者造成危害",阴性结果至少代表一项干预措施可能不会对患者造成不利影响,且可减少不必要的干预措施,进而减少对患者的过度治疗并降低治疗费用;其二,可增强临床医生对患者及干预措施的认识,促使我们按照患者的病情严重程度,制定个体化地治疗方案,并对干预措施的时间和强度进行更加规范化地规定,从而使得某项干预措施可以在最合适的患者中发挥最大的治疗效果;其三,一些阴性研究结果可能与我们的临床经验相悖,促使我们进行更加深入的关于发病及治疗机制的研究;其四,RCT的研究对象多经过严格的筛选,可能不符合临床实践中真实患者的情况,此外,入选的患者间可能存在基础疾病、病情严重程度间的差异,异质性较大,一项治疗措施可能并不适用于所有患者,从而导致结果的不准确。RCT阴性结果的频繁出现不仅为设计更完善的RCT研究提供了宝贵经验,也促使更多"符合临床实际"的研究,如非干预性观察性研究(Real-life研究)的开展,期望在重视群体共性的同时,强调个体间差异使得研究结果更加真实、实用。
参考文献(略)
尊敬的读者:
若您新收到的纸质杂志有破损等情况,请在微信中发送破损杂志照片+您的个人信息后,拨打电话010-85158299,找宋老师调换 。

