您好,欢迎您

亚组分析到底靠谱吗?从FLAURA研究谈起

2020年11月13日

在上一期中我们谈到,对于主要研究终点为阴性的临床试验,通过合理的亚组分析,并进一步在特定的人群中进行确证性试验,完全有可能使研究药物“咸鱼翻身”。今天,我们则要谈一谈这一话题的对立面——亚组分析不靠谱的一方面。


一、何为亚组分析?

亚组分析的概念临床医生肯定不会陌生,它是指基于某些临床病理特点,如性别、年龄、吸烟状态及分子类型等,将研究人群分为若干子集,并在这些子集中进行数据分析。亚组分析包括了事先设定的亚组分析和非设定的亚组分析(即事后分析),其主要目的是:当研究为阳性结果时,判断疗效在某些人群中是否更好;当研究为阴性时,判断是否存在获益的特殊人群。

 

二、亚组分析到底靠谱吗?

首先需要说明的是,对于一项临床研究,其研究设计、样本含量计算等均是围绕主要研究终点进行,亚组分析的本质是探索性的,只能提供提示性的结论,其在临床试验中的地位绝不可过分解读,甚至超过对主要研究终点的关注。对于亚组分析的结论是否可靠,不仅仅关注统计分析的显著性水准,更要结合专业背景,才能做出全面的判断。有学者曾经提出判断亚组分析可靠性的9条标准,其中有几条非常重要和关键。下面,笔者结合FLAURA研究的亚组分析1 (注:FLAURA研究探索的是对于携带EGFR19del或21L858R突变的患者,三代EGFR-TKI是否优于一代EGFR-TKI,最终OS显示,三代EGFR-TKI和一代EGFR-TKI的OS分别为38.6个月和31.8个月,HR=0.80,P=0.046,但其亚组分析显示,亚裔人群不能从三代TKI的治疗中获益,HR=1.0)及自己粗浅的理解,进行简单分析:

图片 1.png

FLAURA研究的OS数据及部分亚组分析结果

1、是否存在生物学机制可以解释亚组分析结果。对于一个生物标志物,如果没有合理的理论解释,那么这种差异只能是统计学的差异,可信度会打折扣。回到FLAURA研究来看,虽然EGFR突变频率在亚裔人群和高加索人群中存在差异,但目前,并无确证性的数据证实,两者之间接受TKI类药物治疗的疗效存在本质不同,因此,理论上这一结果似乎有些牵强。

2、主要研究终点和次要研究终点是否稳定存在这一亚组效应。如果主要研究终点和次要研究终点结果互相支持和印证,那么结果的可信度会大大提高。如果亚组分析结果在主要研究终点和次要研究终点的分析中均可以稳定重现,说明可信度较高。在FLAURA研究的PFS分析中,并未发现亚裔人群和高加索人群在接受奥希替尼治疗时存在疗效差异。

图片 2.png

FLAURA研究的PFS(上)和OS(下)的部分亚组分析

 3、亚组分析的发现能否在不同的研究中重现。如果亚组分析的结果能稳定的在不同的研究中重复出现,同样提示这一结果的可信度高。目前,奥希替尼在晚期NSCLC中的前瞻性大型临床研究有2个,除了FLAURA外,另外是聚焦于二线治疗T790M突变患者的AURA3研究2,而AURA3研究同样未发现亚裔人群和高加索人群接受奥希替尼治疗存在疗效差异,甚至在数值上,亚裔人群还要更好(HR分别为0.32和0.48),这与FLAURA研究的结果并不吻合。

图片 3.png

AURA3研究的亚组分析

4、亚组分析因素是否是预设的或分层变量。如果是分层变量,就意味着两组之间的基线特点均衡可比,由此排除其他因素引入的偏倚,结果自然更可信。在FLAURA研究中,种族是预设的亚组分析变量,因此,组间应当是均衡可比的。这使得需要对这一结果引起重视。 

5、亚组分析数目是否有限(<5)。过多的亚组分析,由于多重性比较的问题,会使得假阳性结果的可能大大增加。FLAURA研究预设了10个亚组分析,最终共报告了9个亚组结果(性别、年龄、种族、吸烟状态、CNS转移、PS评分、突变类型、外周血DNA结果及中心确认的EGFR检测结果)。如果显著性水准设定为0.05,理论上来讲,FLAURA研究发现亚组效应的概率大概为40%,这是一个非常高的比例。

既往一项研究发现,12项基于II期研究的亚组分析开展的III期确证性临床试验(这些临床试验均是在II期临床研究失败后或疗效不突出,基于亚组分析得到某一阳性亚组,并在这部分亚组人群中进一步开展确证性III期临床研究),结果只有1项被重复出来,阳性率不足10%3。这一结果强烈提示,多数情况下,亚组分析提供的数据需要审慎解读。

整体上来讲,FLAURA研究的种族亚组的分析结果并没有稳定的重现出来,但考虑到亚裔亚组的样本含量还是比较大(347例患者)且这是预设的亚组分析,交互检验时P<0.05,因此,这一结论还是要引起一定的重视。但笔者认为,如果把一个临床研究比作后宫大戏,主要研究终点才是正宫皇后,次要研究终点则是各宫的妃妾,妃子无论再怎么得宠,也不可能超越正宫娘娘的地位;亚组分析的数据在漂亮,也不宜做过分解读,甚至超过主要研究终点的地位。

 

参考文献

1、Ramalingam SS et al. N Engl J Med. 2020 Jan 2;382(1):41-50.

2、Mok TS et al. N Engl J Med 376:629-640, 2017

3、Liang F et al. Eur J Cancer 121:19-28, 2019


评论
2020年11月15日
王迦南
威海市中心医院 | 肿瘤科
学习