您好,欢迎您

统计知识系列讲座(七)——肿瘤临床研究中的生存分析概述

05月21日
作者:褚嘉栋
来源:研值圈

在肿瘤III期临床研究中,无论是新药还是新的干预措施,最终目的是让患者获得更长、更优的生存获益。因此,一般设置如OS/PFS/DFS等生存时间类指标作为研究的主要终点。对于这类研究终点的分析,通常称为生存分析(survival analysis)或事件时间分析(time-to-event analysis)。从统计角度,生存分析已经形成一个较为完善的流程,内容包括:生存时间的统计描述,多组生存时间的比较以及探讨影响生存时间的Cox回归分析。        

在肿瘤临床研究中,常规的生存分析流程:1)采用 Kaplan-Meier曲线进行生存描述;2)采用Log-rank检验方法进行组间生存曲线的比较;3)采用Cox 比例风险模型进行效应量(风险比HR及95%置信区间)的估计。        

一 、生存数据的基本特征 

  1、结局事件是否发生。                               

 结局事件通常需要进行事先进行定义,例如OS终点以发生死亡作为结局事件、PFS终点以发生疾病进展或死亡作为结局事件。                            

 2、发生结局事件所经历的时间长短。                       在临床研究中,通常将受试者随机化入组的时间点作为测量生存时间的起点,直至随访发生结局事件或失访。(在观察性临床研究中可能为受试者入组的时间节点)。                             

  二、生存删失介绍                          

1、什么是生存删失                       

一般情况下,生存时间被定义为从测量时间节点开始直至发生特定结局事件之间所经历的整个时间跨度。然而,在真实临床研究中,由于各种原因并不是每一个受试者都能随访到最后。因此,这部分未能观察到结局事件发生的受试者数据,也被称为删失或截尾(censoring)。              

   图1 生存完全数据与删失数据示意图             

从统计角度来说,生存删失数据可以进一步被分为三种类型,包括右删失、左删失和区间删失,详见表1。一般在肿瘤临床研究中,以OS、PFS、DFS、EFS等为研究终点的生存数据为右删失类型。           

 表1 关于生存删失数据的基本类型 

 图2 右删失的三种细分类型示意图 

2、生存删失的潜在原因                      

(1)直至研究随访结束,预期结局事件仍然没有发生。              

(2)在随访过程中,由于各种原因失访(研究对象更换联系方式、拒绝治疗、退出研究等),无法明确研究对象是否发生预期结局事件以及发生的具体时间。            

3、删失数据对研究结果的影响                       

在实际中,无论开展任何临床研究,删失数据的出现总是不可避免的。对于临床研究中的生存删失数据可以从以下三个方面来考量:            

(1)整体删失比例            

一般情况下,生存数据删失比例越高,对疗效估计偏差的可能性也越大;较高的删失比例也反映出受试者依从性不佳以及整个临床研究质控问题。此外,较高的删失比例会降低检验效能,影响疗效估计的可靠性。            

(2)组间删失比例的均衡性            

一般情况下,对研究结果进行统计分析时,需要假设删失数据是随机发生的,即发生删失的比例在组间应该是均衡。如果两组的删失比例有所失衡,可能提示这部分删失的受试者存在某些特征上的差异,从而对最终疗效估计可能带来偏倚。            

(3)组间删失的分布情况            

针对删失部分的分布情况,在组间是否均衡也需要关注。删失原因的分布不均衡,可能反映开展研究过程中的部分质控问题。            

三、基于生存数据的KM曲线分析     

由于删失数据也带有部分生存信息,因此不能简单地剔除这些删失数据。事实上,对于含有删失的生存数据进行分析,常见的分析策略是借助Kaplan-Meier法(简称K-M)。K-M法是一种单因素的生存分析方法,可以对组间受试者的生存情况进行比较分析并以生存曲线图的形式进行直观展示。(其生存率的计算基于乘积极限法;删失数据本质属于缺失数据,K-M法基于EM算法对缺失数据进行处理,即用未失访受试者的生存时间代表失访受试者的生存时间)。

 图3. K-M生存曲线示意图              
        (统计软件R.4.2.3 基于survival包中的Lung数据集)    

 1、中位生存时间(Median survival time)         即在50%生存率下所对应的生存时间,反映了恰有50%的个体存活的时间节点(不等同于生存时间的中位数),也被称为半数生存期。中位生存时间为点估计,不同组别对应的中位生存时间不同,可以一定程度上反应出组间死亡风险的差异。中位生存时间越长,提示其生存获益越大。然而,中位生存时间不一定每次都能获得,依赖于数据成熟度。                   

另一个相近但意义不同的概念是中位随访时间(Median follow-up time):即50%的受试者被随访到所对应的随访期,且不完全等于随访时间的中位数。中位随访时间的估计通常用Reverse Kaplan-Meier分析法得到(将发生结局事件作为删失处理)。中位随访时间越长,发生目标事件数越多,数据成熟度也就越高,从而保证有足够的检验效能进行疗效比较。                  

2、生存曲线的形态                               

即直观描述两组生存情况的变化。K-M曲线图中,横轴为时间,纵轴为生存率,每一次“台阶式”下降表示发生一例结局事件。理论上来说,当随访时间足够长,任一生存曲线最终都会与x轴相交。

3、生存曲线的95%置信区间 

即生存曲线周围的条带,反映每个结局事件发生时对应生存率估计的95%置信区间。其95%置信区间条带越宽或者两组间95%置信区间重合度越高,反映两组生存差异可能越不明显。                   

4、风险比值及95%置信区间                               

即用于估计治疗组和对照组导致结局事件发生风险的变化程度的指标,即风险比(Hazard Ratio,HR)。与中位生存时间相比,HR值及其95%置信区间可以反映两组生存曲线的整体状况比较。当HR<1时,提示治疗组相比对照组的疗效获益可能更好。然而,由于HR值基于Cox比例风险模型衍生出来,因此需要满足相应的前提假设,即比例风险恒定,不随时间变化而变化:①从KM曲线图中直观来看两组生存曲线没有明显交叉;②基于统计学检验,通过P值判断。                  

当比例风险假设不能满足时,HR值估计可能是有偏的。此时,可以从以下两个方面进行考虑:①基于分层Cox进行分析,即将重要协变量作为分层变量;②基于时变协变量,采用含时变协变量的Cox回归进行分析。                  

  图4. 中位生存时间与风险比HR的比较示意图 

四、组间生存检验 

无论从图中两组生存曲线形态还是从中位生存时间或HR值来看,这种组间的差异仅仅是描述性的,而想要得出组间生存状况具有统计学意义上的获益差异,需要进行假设检验。最常用的统计方法为Log-rank检验(也称对数秩检验)。特点:①用于检验两组或多组整体生存时间分布是否相同;②属于非参数检验方法之一,不受原生存时间分布影响。

另一种非参数检验法——Wilcoxon 检验(也称Breslow-Gehan检验),可用于比较两组或多组生存时间分布情况。两者区别在于权重设置不同:①Log-rank检验对各观察时点的风险人数设置的权重均为1,即相比Wilcoxon检验,对远期结局事件发生的权重相对更大。因此,该方法更易发现两组受试者的远期疗效差异;②Wilcoxon检验以各观察时点的风险人数作为权重,即相比Log-rank检验,对近期结局事件发生的权重相对更大。因此,该方法更易发现两组受试者的近期疗效差异。

  • 当Log-rank检验显著而Wilcoxon检验不显著时,提示两组受试者生存状态的远期疗效具有差异,但近期疗效可能不明显。            

  • 当Log-rank检验不显著而Wilcoxon检验显著时,提示两组受试者生存状态的早期疗效具有差异,但远期疗效可能不明显。            

        此外,还有一种非参数检验法——Tarone-Ware检验,效果介于Log-rank检验与Wilcoxon检验之间。              

作者.png   

评论
05月21日
颜昕
漳州市医院 | 乳腺外科
是新药还是新的干预措施,最终目的是让患者获