您好,欢迎您

梁师授课 斐然成章 | 梁斐教授:亚组分析不可只关注可信区间上限,可信度分析需关注多个因素

2023年04月27日
整理:肿瘤资讯
来源:肿瘤资讯

临床研究离不开数据统计,为解决临床医生困惑,帮助临床医生更好地理解临床研究中的数据,【肿瘤资讯】邀请邀请复旦大学附属中山医院梁斐教授开设“梁师授课 斐然成章”系列课程,以著名临床研究为例,深入浅出地讲解统计学要点。这一期主要内容为大家讲解亚组分析的可信度判断。

               
梁斐
教授

复旦附属中山医院 生物统计室 统计师
上海抗癌协会癌症预防与筛查委员会委员
CSCO青年委员会统计小组成员
以第一作者或通讯作者在JCO, JNCI, Annals of Oncology, European Journal of Cancer 等杂志发表SCI论著11篇,累计影响因子超过100
以第一作者在NEJM, Lancet, Lancet Oncology, JCO 发表Letter 8篇
JNCI, Clinical Cancer Research, Theranostics审稿人
主要研究方向:临床试验设计及统计,临床研究方法学

亚组分析结果不应只关注可信区间上限,多项因素影响亚组分析结果

临床研究亚组分析的结果通常以森林图的形式展示。每个亚组一个横线,两端是可信区间,中间是点估计。临床医生看的时候通常会非常关注可信区间上限是否超过1,一旦超过就会认为该亚组是不获益或获益有限的。这是一种非常常见的理解方式,但有一定偏差。

以某课题组开展的一个全国多中心的随机对照临床研究为例,主要终点DFS取得了阳性结果,根据不同分期进行亚组分析后,看到III期人群试验组和对照组有显著性差异,而II期人群试验组和对照组则没有显著性差异,因此得出了该干预只在III期人群中有效的结论。这篇文章投稿JCO后,统计学审稿人提出了非常重要的问题:III期人群和II期人群的疗效非常接近,II期人群中没有看到差异的原因是其样本量和生存数据有限,并非没有获益。

通常来讲,亚组分析是探索性的,而不是确证性的。亚组HR可信区间超过1、p值大于0.05并不代表该亚组治疗无效。因为结果的得出不仅取决于疗效,还取决于亚组的人数和事件数。亚组通常是没有预先计算样本量的,所以不能要求可信区间上限不超过1,应该更加要关注它的HR是否小于1,以及不同组之间的差异性。交互检验是真正的比较两个不同亚组之间的HR是否相等的手段。在模型中,Factor乘以Treatment有统计学意义(P<0.05),就认为两者存在交互作用,也就是该因素有亚组效应。

回到刚才的例子当中,我指导该研究的相关人员进行了交互检验,p值为0.927,于是将结果回复JCO审稿人,说明这个干预在不同亚组之间是没有差异的,将结论修改为干预在整体人群中是有效的。

亚组效应分为2种,可信度判断需综合多种因素

亚组分析的关键首先要做交互检验。交互检验p值小于0.05时,说明出现了亚组效应。也就是该亚组分层可以作为筛选患者的依据。亚组效应分为两种,一种是程度差别的亚组效应,一种是性质差别的亚组效应。程度差别即干预整体有效,但亚组2比亚组1明显更好。性质差别即干预整体无效,但A药对亚组1有效,而B药对亚组2有效。通常我们更加关注性质差别的亚组效应,但程度差别的亚组效应可以帮助我们更好地筛选患者。

亚组效应的金标准是新的RCT,其次是Meta分析,在缺少金标准的情况下,可以借助其他手段对亚组分析的可信度进行判断。首先,可以从研究设计的角度分析,亚组分析应该是事先设定的(Pre-specified),而不是事后进行的(Post-hoc)。很多情况是根据有没有因为安全性事件终止用药进行亚组分析,这种研究过程中出现的亚组可信度是比较低的。亚组分析也应该根据基线变量和分层变量进行,可以增加结果的说服力。

另外如刚才所说,应该在亚组分析的时候进行交互检验,p值小于0.05才具有亚组效应。亚组分析的数量也有影响,数量过多时偶然因素的权重会加大,因此亚组分析数量越多可信度越低。另外如果类似研究的干预在不同亚组之间有同样差异、同个研究不同研究结果有一致性差异、有相关的生物学合理解释的差异也可以增强说服力。

以GEMSTONE-302研究为例,讲解亚组分析可信度分析

以培美曲塞的亚组分析为例,首先培美曲塞是在所有的人群里面进行的亚组分析,研究人群将鳞癌和非鳞癌作为基线变量和分层因素,进行了预设亚组分析。虽然亚组分析的个数超过5个,但交互检验P值是0.001。而且培美曲塞当时做了两个研究,一个单药一个联合,这两个研究都提示在非鳞癌人群中培美曲塞获益非常突出,而且不同研究终点都存在亚组效应,也就是OS、PFS结果都提示非鳞癌获益是更加突出的。间接证据方面,胸苷酸合酶表达水平可以解释亚组获益。该研究基本满足了所有增加亚组分析可信度的条件,交互检验p值非常小,所以日后培美曲塞在非鳞癌非小细胞肺癌治疗方面成为了标准的化疗方案。

按照同样的方式来看GEMSTONE-302研究,亚组分析显示鳞癌人群获益更加突出,这个结果可信度如何?鳞癌和非鳞癌同样作为基线变量和随机分层因素,并且是预设亚组分析,虽然亚组分析的数量同样大于5个,但PFS、OS获益趋势一致,交互检验的p值小于0.05。另外间接证据方面舒格利单抗可以同时诱导T细胞和巨噬细胞杀伤肿瘤细胞,而鳞癌巨噬细胞是高浸润的,可以解释舒格利单抗在鳞癌人群获益更加突出的原因。总体看来,GEMSTONE-302研究的亚组分析结果是可信的。

内容小结

  • 亚组分析时不要求每个亚组可信区间上限小于1

  • 交互检验p值小于0.05时提示可能存在亚组效应,还应基于其他指标判断其可信度

  • GEMSTONE-302研究亚组分析可信度高,舒格利单抗在鳞癌人群中获益更加突出


择捷美.png

择捷美说明书二维码


PP-CEJ-CHN-0628
到期日:2025-3-3

辉瑞logo.png


责任编辑:肿瘤资讯-CY
排版编辑:肿瘤资讯-LSL


               
版权声明
版权归肿瘤资讯所有。欢迎个人转发分享,其他任何媒体、网站如需转载或引用本网版权所有内容,须获得授权,且在醒目位置处注明“转自:良医汇-肿瘤医生APP”。