钟敬泉

山东大学齐鲁医院青岛院区

用统计慧眼看新型口服抗凝药研究

    卒中和全身性栓塞是房颤致死致残的主要原因,因此抗凝治疗是房颤患者综合管理策略的重要组成部分。早在上世纪,AFASAK、BAATAF、SPAFⅠ、CAFA、SPINAF五大房颤抗栓循证试验就奠定了房颤华法林抗凝治疗的重要地位;ACTIVE-W研究1以及非瓣膜性房颤抗栓治疗预防卒中的荟萃分析2的发表,则一举确定了华法林是抗凝治疗的金标准。近年来,一系列新型口服抗凝药物(NOAC)的大型III期临床研究陆续完成,并促使达比加群等NOAC成功上市。毫无疑问,这些临床研究均以华法林作为阳性对照药物,并且采用了非劣效性研究设计,从统计学视觉对这些临床研究进行解读,有助于临床医生全面认识和比较NOAC的临床疗效。
1.  临床试验中常用的统计学问题
    基于研究目的不同,药品临床试验采用非劣效性、等效性或优效性假设检验,以确证某种药物的疗效与对照药物的差异。通常采用区间假设检验的方法,通过既定的检验水准以临床意义的差异Δ来进行假设检验。在非劣效性、等效性和优效性假设之间,即存在本质的区别,又具有一定的联系,见图1。采用哪种试验应在试验开始前预先设定,在某种特定条件下,非劣效性与优效性试验可以相互转换。当非劣效性试验的无效假设被拒绝,可以推断A不劣于B时,还可进一步检验A的优效性,此时从非劣效性试验向优效性试验转换是可行的,但需要一定的条件,包括试验最大限度地强调按照ITT原理分析。

    ITT(意向性治疗分析)的基本原则是主要分析应包括所有随机化的受试者。依据这一原则需要完整随访所有随机入组病例的研究结果,但现实中这种情况难以达到,常采用特定的人群进行统计学分析,主要包括以下三种:FAS人群(全分析集)、PP人群(符合方案集)和安全性分析人群(安全集)3。FAS人群是指尽可能接近符合ITT原则的理想受试者人群;该数据集是从所有随机化的受试者中,以最少和合理的方法剔除受试者后得出的。PP人群定义为所有按照方案要求完成相关观察并符合下列条件的人群:1). 依从性在80%-200%者;2).试验期间未服任何禁止药物;3). 符合入选标准不具有任何一项排除指标;4).完成全部计划随访且完成CRF规定填写内容。安全性分析人群指所有经随机化入组,至少服用过一次研究药物的人群,主要用于安全性评估。从以上定义可以看出,FAS人群理论上是最大的最接近所有随机入组患者的人群;PP人群是FAS人群的一个子集,较FAS人群更小,这两者都用于评价治疗的疗效;而安全性分析人群主要用于评价治疗的安全性,一般而言,该人群小于FAS人群大于PP人群,三者之间的区别见图2。不同分析人群在不同假设检验中的作用不尽相同,在优效性试验中,主要分析应该采用FAS人群,因为它可以避免由于采用PP人群所致的结果的最优化;当FAS人群和PP人群得出实质上是相同的结论时,试验结果的可信性大大增加。

2. 从统计学看RE-LY和ROCKET-AF研究
    目前新上市的NOAC包括两类:直接凝血酶抑制剂达比加群和Xa因子直接抑制剂如利伐沙班等。III期临床研究显示,达比加群和利伐沙班预防房颤卒中的疗效不劣于或者优于华法林,为临床医生和患者提供了更多的抗凝治疗选择。接下来,我们试着从统计学视角了解RE-LY4和ROCKET-AF5研究的相关内容。
    RE-LY4是一项采用PROBE设计的研究,旨在检验两种剂量的达比加群预防房颤卒中的疗效是否非劣于华法林,使用Cox比例风险模型进行评估,所有分析均基于ITT原则,在达比加群2种剂量的非劣效性都被确立后进行优效性检验。结果发现,达比加群150 mg bid 的疗效优于华法林(非劣效性检验p < 0.001;优效性检验p < 0.001),达比加群110mg bid的疗效不劣于华法林(非劣效检验p < 0.001;优效性检验p=0.34)。ROCKET-AF5是一项随机、双盲对照研究,旨在检验利伐沙班预防房颤卒中的疗效是否非劣于华法林,采用接受治疗期间PP人群对主要疗效指标进行检验分析,如果达到了非劣效性标准,将在接受治疗期间安全性人群中进行优效性分析;对次要疗效终点和安全性终点同样采用实际服用药物的安全性人群分析。最后,也在ITT人群中进行了非劣效性和优效性的检验分析。对治疗期间PP人群的分析发现,利伐沙班治疗组188例患者出现主要终点事件(1.7%/年),华法林组有241例患者(2.2%/年),利伐沙班不劣于华法林(非劣效性检验p < 0.001)。ITT分析也得出了相似的结果,利伐沙班组269例患者出现终点事件(2.1%/年),华法林组306例(2.4%/年),非劣效性检验p < 0.001,优效性检验p < 0.12。
    对两项研究的统计学进行对比可发现两点不同:1). RE-LY研究的所有分析均基于意向性治疗原则(采用FAS人群),而ROCKET-AF研究的主要疗效终点先后采用多种人群数据集(PP人群、安全性分析人群和FAS人群)进行分析;2).另外,ROCKET-AF研究中统计分析还使用了“接受治疗期间(during treatment)”的安全性人群以及“实际服用药物(as-treated)”的安全性人群。“接受治疗期间”是指仅仅包含患者接受治疗期间的信息,治疗后的信息未被计入,使得被纳入的天数较短,可能使某些终点事件被排除在外;“实际服用药物”的安全性人群是基于患者实际药物服用情况进行的,无论患者随机化的入组情况,通常用于安全性分析。尽管在几种不同的人群中均得出利伐沙班非劣于华法林的一致结论,但在不同的分析中,由于人群(观察时间)的定义不同,终点事件发生数(发生率)以及据此得出的优检验结果并不一致,见图3。因此,ROCKET-AF研究结果发表后几个月,对该研究的评论6指出,与ITT人群相比,“实际服用药物”人群中的终点事件数分别减少了81例(利伐沙班组)和66例(华法林组),提示采用“实际服用药物”治疗人群分析时存在着非随机效应的丢失,作者应说明这种差异是否主要由初始治疗分配所导致;另外,对于次要疗效终点也应采用ITT分析,以进一步表明是否存在偏倚。 

    临床试验应严格按照ICH规范设计并实施,选用不同的统计学方法可能会倾向于对某种治疗有利。RE-LY研究对所有终点均采用ITT分析,在达到既定的非劣效性检验后,进一步采用步进法进行优效性分析,最后得出了一致的结果。ROCKET-AF对主要疗效的分析采用了多种不同人群,得出的结论也并不一致,对于其中原因的探讨和解释众说纷纭;仅从统计学视角看,该研究可能存在一些瑕疵,至于这些瑕疵是否影响临床医生对研究结果及其临床意义的解读,目前仍然是仁者见仁智者见智。
References
1. Lancet. 2006; 367: 1903-1912
2. Hart RG et al. Ann Intern Med. 2007;146: 857-867
3. 国家食品药品监督管理局. 化学药物和生物制品临床试验生物统计学技术指导原则[S]. 2005-3
4. Connolly SJ, et al . N Engl J Med. 2009;361:1139-51.
5. Patel M, et al. N Engl J Med. 2011;365(10):883-91.
6. Pearson S, et al. N Eng J Med.2011; 365(24): 2334-2335.
        以上内容和观点不代表本网站立场,如有侵权,请您告知,我们将及时处理。
91 转载请注明:内容转载自365医学网
分享到
评论

以下网友留言只代表会员个人观点,不代表365医学网观点

{{one.coment_name}} {{one.time1}}前

{{one.content_info}}

作者 回复

{{one.re_content_info}}

查看全部评论