您好,欢迎您

中位OS、中位PFS和HR...临床研究数据众多,如何正确解读?

2023年08月17日
整理:肿瘤资讯
来源:肿瘤资讯

近年来,肿瘤免疫、靶向治疗新药频出,然而由于缺乏头对头的研究直接比较,因此难以明确判定不同药物的疗效高低。在此情况下,临床医生进行临床决策时,则需借助中位值(PFS/OS)、风险比(HR)等指标进行间接比较。

中位值(PFS/OS)、p值、HR是临床医生最常关注的3个指标,背后分别是不同的统计学方法:K-M曲线、Log-rank检验和Cox模型。
 
K-M曲线把无进展生存期(PFS)和总生存期(OS)图形化,通过K-M曲线可以估计每个点的生存率、12个月/24个月的OS/PFS率、中位PFS/OS等。但如果要比较两个曲线之间是否存在统计学差异,则需要采用Log-rank检验计算p值。但因为两组差异和样本量也有关系,为量化差异大小,就需要Cox模型计算出HR及其可信区间。

那么,临床研究中的两个关键疗效指标,中位值(PFS/OS)和HR值,如何正确解读呢?

K-M曲线变化受多因素影响,临床解读存在多种误解

中位PFS一般理解为一半的患者无进展生存或者存活的时间。实际上临床研究分析的过程中,是根据KM曲线与生存率50%的交叉点来决定,在极端的情况下只需要一个患者进展和死亡,中位的PFS跟OS就能估计出来。所以用中位PFS来衡量临床获益的大小,存在两个问题:第一,中位PFS、OS只是暂时的估计值,会随着随访时间的变化而改变;第二,中位PFS、OS受到基线情况影响比较大,在患者筛选基线好而药物效果一般的时候,也可能获得理想的数值。

以KEYNOTE-021G研究为例,第一次报告是随访时间达到10.6个月时,中位PFS 13个月vs 8.9个月,HR是0.53,p值是0.010。中位随访时间达14.5个月时,中位PFS变成无法预估(NR),因为PFS曲线跟生存率50%的线没有交叉点。随访23.9个月时,中位PFS变成24个月。可以看到3次结果中位PFS发生了非常明显的变化。作为KEYNOTE-021G研究的确证性研究,KEYNOTE-189研究的中位PFS只有8.8个月,差距非常明显。其中的原因除了随访时间不同外,还与基线密切相关。

另外一个例子是, PACIFIC研究中位PFS达到了16.8个月,对照组是5.6个月。在PACIFIC模式基础上再加上新的药物,能不能继续提高PFS?今年JCO上发表的COAST研究中度伐利尤单抗单药中位PFS只有6.3个月,与PACIFIC研究有很大差距。可以看出基线因素对中位PFS具有明显的影响。

在KEYNOTE-021G研究中,中位值随着随访时间不断变化,涉及到K-M曲线的基本原理。在生存分析中的数据包含两个维度:时间和状态。状态分为两类:事件和删失。所有在数据截止日期未发生事件的患者都定义为删失,它对于K-M曲线的稳定性和结果的可信性有非常明显的影响。K-M曲线的基本原理是时间为0时生存率100%,随着随访时间的延长,事件发生导致曲线不断下降。而删失不会改变K-M曲线的形态,只会留下一个标记。K-M曲线的下降幅度取决于PFS率(N/Number at risk),N代表这个时间点发生的事件数,Number at risk代表真正随访的时间点而没有进展的患者数。在K-M曲线的后半段经常出现断崖式下降的现象,实际上是因为Number at risk太少,不代表大量的患者进展和死亡。

HR结果更加全面,更适合不同研究的间接比较

HR代表整个随访时间内试验组和对照组单位时间的相对死亡风险比。HR小于1代表单位时间内死亡风险降低,HR大于1代表单位时间内死亡风险增加。HR等于0.5,可以认为是单位时间内死亡风险降低50%,但这是单位时间内速率的比值不是概率的比值,并不代表死亡的概率降低50%,而是每单位时间的速率降低了50%,即所有患者从100%的这个点向0%奔跑速度的变化。

HR的优点在于受到数据结构、成熟度的影响相对比较小,是相对的指标,是整条曲线全程的差异。所以计算样本量基于HR,而非中位值。HR的结果更全面,它会用到截止数据分析时所有产生的数据。另外,HR均衡了试验组和对照组之间的差异,更适合不同研究之间的间接比较。

在一定前提下,中位值和HR可以换算,HR=对照组中位值/试验组中位值。但中位值说到底只是点的数据,并不能反应临床获益的全部情况,可能夸大或者低估临床获益。

在LUX-Lung7研究中,试验组的中位PFS只提高了0.1个月,但是p值是0.017,HR是0.73。出现这种情况的原因,就是试验组和对照组两条曲线过了50%之后才慢慢分开,但是后面分开的情况对中位值不产生任何影响。相反,在某些情况下中位值可能夸大获益。如中位OS从25个月提高到75个月,在任何领域都是划时代的突破,而HR等于0.78,差强人意。两者很可能描述了同一个研究结果。

为了量化抗肿瘤药物的临床价值,近几年ASCO和ESMO分别开发了临床获益量表,代表了ESMO和ASCO对于各个疗效评价指标的认可程度。ASCO的Value Framework与ESMO有差异,临床获益只看HR,基本上HR是ASCO的Value Framework的唯一决定性的指标,另外还有额外的毒性得分、长期生存率的得分。

由此可见,HR值更适合不同研究之间的间接对比,可以在一定程度上反映不同抗肿瘤药物的疗效差异。

在GEMSTONE-302研究中,整体的HR是0.48,降低了52%的疾病进展和死亡风险,获益非常突出,中位PFS也提高了4个多月。在鳞癌亚组中的HR是0.34,获益更加突出。通过将HR进行跨研究比较,可以发现目前在所有的免疫治疗药物中,舒格利单抗的鳞癌HR值最低,预示舒格利单抗治疗肺鳞癌的疗效可能最佳。

总结

中位PFS和OS是临床医生非常关注的,但它和随访时间、研究成熟度有很大关系,需要谨慎看待。

在满足等比例风险假设的情况下,HR是更加全面和稳定的评价指标,也是ESMO和ASCO评价量表中更加看重的指标。



责任编辑:Echo
排版编辑:YJK



               
版权声明
本文专供医学专业人士参考。同时,欢迎个人转发分享,其他任何媒体、网站如需转载或引用本网版权所有内容,须获得授权,且在醒目位置处注明“转自:良医汇-肿瘤医生APP”。