您好,欢迎您

GI有约丨康德英教授述评ESMO:晚期实体瘤一线治疗III期临床研究终点的设定和统计学考量

2023年11月03日
整理:肿瘤资讯
来源:肿瘤资讯

随着多项大型三期临床研究(RCT)数据披露,HER2阳性/阴性胃癌基于免疫治疗的联合方案的循证医学证据不断丰富,临床治疗格局不断被改写。比如在本届欧洲肿瘤内科学会(ESMO)中,KEYNOTE-811的最终PFS(第二次期中分析,IA2)和期中OS(第三次期中分析,IA3)结果,更新结果显示,帕博利珠单抗加入曲妥珠单抗联合化疗一线治疗HER2阳性晚期胃癌的PFS和ORR改善具有临床意义,尤其是对于HER2阳性且PD-L1 CPS≥1的患者。从统计学角度,如何理解不同随机临床研究结果?在不同类型的肿瘤临床研究设计中,如何避免在研究设计上踩坑,最终获得更准确、真实的研究结果?为了回答上述问题,【肿瘤资讯】特别邀请到华西医院统计办循证医学中心康德英教授做客“GI有约”,以经典的胃癌免疫联合化疗的RCT范例 ——KEYNOTE-062、KEYNOTE-811和CheckMate649研究为例,阐释肿瘤临床研究设计的意义和思路,传授统计设计“Tips”。

点击观看康德英教授完整采访视频

专家简历

康德英
华西医院循证医学中心研究员,研究生导师

华西医院方案设计与统计办公室主任
中华医学会临床流行病学与循证医学分会副主任委员
中华医学会临床流行病学与循证医学分会方法学组组长
世界中医药联合会临床疗效评价分会副会长
四川省医学会临床流行病学专委会候任主任委员
中华医学会结核病分会临床流行病学与循证医学委员
四川省预防医学会妇科肿瘤预防与控制专委会常委
医学八年制规划教材《循证医学》第一主编

KEYNOTE-062和KEYNOTE-811研究设计与结果分析

KEYNOTE-062研究设计与结果分析

KEYNOTE-062研究[1]是一项经典的双终点、三臂三期临床研究,旨在评估帕博利珠单抗联合或不联合化疗对比单独化疗治疗PD-L1阳性(CPS≥1)的晚期胃或胃食管交界处(G/GEJ)腺癌患者的疗效和安全性。

研究双主要终点为总生存期(OS)和无进展生存期(PFS),次要终点为客观缓解率(ORR)和安全性。最终研究方案共规定了7个假设,总Ⅰ型错误率(α)水平控制在单侧2.5%,采取α先分配后传导的统计设计。7个假设检验中,第一梯队的4个平行假设检验共同分配α(2.5%),包括P+C vs C组的PFS-PD-L1 CPS 1≥ (H1) α=0.001、OS-PD-L1 CPS 1≥(H2)α=0.0125、OS-PD-L1 CPS10≥(H3)α=0.75%和P vs C组的PD-L1 CPS1≥(H4)α=0.4%;第二梯队的3个假设检验α分配为0。当第一梯队的假设检验通过了统计学显著意义后,α再向第二梯队传导。整体上,KEYNOTE-062研究研究设计非常严谨,整个过程透明,实施规范。研究两组间的患者基线可比,再次说明试验的随机化是成功的。

k1.png

最终结果中,第一梯队的4个分配α值的平行假设检验中仅H4成立,也就是P vs C 组的OS(PD-L1 CPS≥1,H4)的非劣效性成立:帕博利珠单抗单药治疗CPS≥1的G/GEJ腺癌的OS非劣效于化疗(10.6个月vs 11.1个月,HR=0.91,99.2%CI 0.69~1.18<预设非劣效边界值=1.2)。但H4成立后α向下传导时,第二梯队的P vs C 组的OS(PD-L1 CPS≥1,H5)的优效性假设未成立。同时第一梯队的H2、H3和H1均未成立。

由于第一梯队的4个平行假设检验中仅H4成立;其他3个假设检验都是阴性结果,α被完全消耗,向第二梯队传导的α均为0,且H4传导的H5也是阴性结果,整体上,第二梯队的假设检验都是阴性结果。

KEYNOTE-811研究设计与结果分析

第二项研究,三期KEYNOTE-811研究也是一个经典范例,旨在评估帕博利珠单抗+曲妥珠单抗+化疗对比曲妥珠单抗+化疗治疗HER2+转移性胃/胃食管结合部(G/GEJ)腺癌患者的疗效和安全性。先前数据显示,帕博利珠单抗+曲妥珠单抗+化疗的ORR可达74.4%并具有统计学意义,与安慰剂+曲妥珠单抗+化疗相比,ORR具有临床意义的改善22.7%[2],基于这一数据该三联四药方案获FDA批准上市。此次ESMO会议中,披露了KEYNOTE-811的最终PFS(第二次期中分析IA2)和期中OS(第三次期中分析IA3)结果[3]

最初的研究设计上,KEYNOTE-811研究采取了双终点、双臂、三假设、少中期的设计,主要终点(OS和PFS)和关键次要终点(ORR)的α严格控制在单侧2.5%,最初的0.2%分配给ORR,0.3%分配给PFS,2%分配给OS,早期成熟的ORR数据P值非常小,P<0.00006<α(0.002)[2],研究取得了较好的成功。

k2.png

根据此次ESMO披露数据[3],研究在第一次期中分析(IA1)ORR成熟并取得阳性结果后,ORR的α向下传导给IA2时的PFS(α=0.004)和OS(α=0.021),IA2时PFS假设检验阳性时其α再分配给IA3的OS进行检验假设,而此时对PFS仅做描述性分析;在最终分析(FA)时用剩余的α对OS进行再次检验。

k3.png

根据本届ESMO数据,IA2时帕博利珠单抗组和安慰剂组的PFS分别为10.0个月和8.1个月(HR=0.72),PFS达到预设统计学显著性P= 0.0002<α=0.004, PFS具有临床及统计学意义的改善。IA3时帕博利珠单抗组和安慰剂组的PFS分别为10.0个月和8.1个月(HR=0.73);OS分别为20.0个月和16.8个月(HR=0.84,95%CI 0.7~1.01),OS具有临床意义的改善,当CPS≥1时临床改善更佳。

从当前数据看,帕博利珠单抗加入曲妥珠单抗联合化疗对HER2阳性晚期胃癌一线治疗的PFS和ORR改善具有意义,而对于HER2阳性且PD-L1 CPS≥1的患者的改善更优(mPFS 10.9个月vs 7.3个月,HR=0.71;ORR 73% vs 58%;mOS 20个月vs 15.7个月,HR=0.81),目前KEYNOTE-811研究仍在继续,一起期待最终的OS分析。

CheckMate 649研究设计与结果分析

CheckMate 649研究[4]评估了一线纳武单抗联合化疗对比单独化疗治疗晚期G/GEJ腺癌的疗效与安全性。终点分析中主要评估了纳武利尤单抗联合化疗组和单纯化疗组的疗效。

k4.png

CheckMate 649研究是一项随机、开放标签、三期研究,是经典的双终点、双中期、三臂和5假设试验,研究设计非常巧妙,采取了多重检验下的α分配后传导,总α为0.05首先分配给两个主要终点:PD-L1 CPS≥5 PFS的α为0.02,PD-L1 CPS≥5 OS的α0.03。最终PFS实际P值<0.0001,OS实际P值<0.0001,都达到了统计学意义。而从亚组分析看,无论在CPS≥5、≥1还是全人群中,纳武利尤单抗联合化疗的PFS和OS优于单纯的化疗,取得了全面获益。基于这一角度,CheckMate 649研究的统计设计简单高效。

如何避免研究设计“陷阱”?优化假设检验设计和终点选择

统计设计Tips:单终点、少中期、简化设计

实际上,在假设检验中,总Ⅰ型错误率(α)会在多重检验下会发生变化,每增加一次假设检验次数,α就会扩增。也就是,当m为假设检验次数时,α=1-(1-0.05)m,m的增加会伴随α就会扩增。而在肿瘤临床研究中有多种情形会导致多重性检验的发生,比如设立多个相似终点指标(PFS、OS)、多组重复比较(CPS不同表达/剂量组人群)、多次临床试验中期分析、Post HOC事后分析等。再次回顾KEYNOTE-062研究,研究按照CPS多种表达水平、不同组别进行多重对比,同时设计多次中期分析,实际上无形中增加了假设检验次数,最终导致研究整体假设检验设计复杂(7个检验,先分配了主要的4个假设检验后,其余3个通过传导,但α总体水平控制在单侧2.5%)造成α扩增,仅收获1个非劣效结果。

因此临床研究统计设计时建议采取单终点、少中期、简化设计为原则,将α固定,严格控制每个假设检验的α消耗,避免统计设计“陷阱”的出现,影响研究真实结果的产生。

不同类型临床研究的终点选择

研究设计中除了统计学假设检验设计,研究终点的设计也影响着研究结果的准确性。

肿瘤临床研究主要终点主要分为五类:1. OS是迄今为止评价抗肿瘤药物最可靠的临床试验终点,当研究能充分评价生存期时,它通常是首选终点。2. 除了OS还包括基于影像组学的肿瘤测量终点如无病生存期(DFS)、无进展生存期(PFS)、疾病进展时间(TTP)和治疗失败时间(TTF)、客观缓解率(ORR)、疾病控制率(DCR)等。3. 基于症状评价终点如肿瘤症状进展时间(TTPCS)、生存质量(QOL)、复合症状终点(PRO)。4. 基于血液或体液生物标志如CA-125/PSA等。5. 以及一些新兴指标如无转移生存(MFS)、微小残留病灶(MRD)、进展生存期(PPS,OS-PFS)二次无进展生存期(PFS2)等。

其中使用频率最高的是基于肿瘤影像组学测量测量的临床终点指标。它们是基于RICST标准,将肿瘤变化情况分为四种:完全缓解(CR)、部分缓解(PR)、疾病稳定(SD)、疾病进展(PD),然后组成不同的指标。但这类时间依赖性终点的数据收集和处理均基于间接评价、计算或估算(如肿瘤测量),强调对该终点在抗肿瘤药物临床获益评价中不确定性和偏倚进行评估。尤其是肿瘤测量指标本身具有间接性、替代性、精确度、主观性和差异性这“五性”,为了避免测量偏差的出现,建议选用第三方盲评。

很多情况下,PFS和OS结果不一致,PFS获益并不能转变为OS获益。通常首选OS,但后续的治疗方案可能会混淆一线治疗对OS的影响。在转移癌临床试验中,更合适的终点选PFS抑或OS仍存在争议,并且PFS 与OS获益不一致的现象广泛存在于多瘤种临床研究之中。著名的“肿瘤微环境偃塞湖现象”曾以靶向治疗为例解释过这一现象,即靶向治疗中OS和PFS不一致可能是靶向药物治疗会改变肿瘤的生物学行为,药物治疗延缓了疾病进展,但是却导致肿瘤的恶性程度增加,进展后病人迅速死亡而抵消了之前的PFS获益。

为此,设置主要临床终点可基于“3看”减少偏倚风险。首先是“看瘤种”,如果是长生存瘤种首推PFS,如果是短生存瘤种OS是不二之选;第二是“看设计方案”,如果是Ⅱ期探索性研究则选用PFS或ORR,Ⅲ期确证性研究则OS为首选,真实世界研究选用OS。第三是“看盲法还是开放标签”,如果是开放标签则OS是首选,如果非要采用PFS时则强烈建议使用盲法来避免测量偏差。这其中开放标签三期ALEX研究的自评PFS比盲评的PFS多9.1个月[5]就是典型案例,再次强调利用独立评审委员会评估的数据可降低测量风险。

注:帕博利珠单抗暂未在中国大陆获批胃癌适应症。

参考文献

[1] Shitara K, Van Cutsem E, Bang YJ, et al. Efficacy and Safety of Pembrolizumab or Pembrolizumab Plus Chemotherapy vs Chemotherapy Alone for Patients With First-line, Advanced Gastric Cancer: The KEYNOTE-062 Phase 3 Randomized Clinical Trial. JAMA Oncol. 2020;6(10):1571-1580.

[2]  Janjigian YY,Kawazoe A,Yañez P,et al.The KEYNOTE-811 trial of dual PD-1 and HER-2 blockade in HER-2-positive gastric cancer[J].Nature,2021,600(7890):727-730.

[3] Y.Y. Janjigian, et al. Pembrolizumab plus trastuzumab and chemotherapy for HER2+ metastatic gastric or gastroesophageal junction (mG/ GEJ) adenocarcinoma: Survival results from the phase III, randomized, double-blind, placebo-controlled KEYNOTE-811 study.2023 ESMO,1511O.

[4] Janjigian YY, Shitara K, Moehler M, et al. First-line nivolumab plus chemotherapy versus chemotherapy alone for advanced gastric, gastro-oesophageal junction, and oesophageal adenocarcinoma (CheckMate 649): a randomised, open-label, phase 3 trial. Lancet. 2021;398(10294):27-40. doi:10.1016/S0140-6736(21)00797-2

[5] Peters S, Camidge DR, Shaw AT, et al. ALEX Trial Investigators. Alectinib versus Crizotinib in Untreated ALK-Positive Non-Small-Cell Lung Cancer. N Engl J Med. 2017 Aug 31;377(9):829-838.


审批编号:MI-PD1-5185-CN

过期日期:30/6/2024


仅供医药学专业人士作为参考,请勿分发或转发。

本资讯由默沙东医学团队提供,旨在用于医学专业人士间的学术交流,请勿随意转发或转载。文中相关内容不能以任何方式取代专业的医疗指导,也不应被视为治疗建议。医学专业人士对文中提到的任何药品进行处方时,请严格遵循该药品在中国批准使用的说明书。默沙东不承担相应的有关责任。



医学编辑:MSD-辜星婷、陈萌
排版编辑:肿瘤资讯-Tracy