您好,欢迎您

默读经典|梁斐教授:吹尽黄沙始到金——从统计学角度解读KEYNOTE-859研究数据

2023年02月24日
整理:肿瘤资讯
来源:肿瘤资讯

在近期的ESMO Virtual Plenary会议上,帕博利珠单抗联合化疗一线治疗HER2阴性局部晚期不可切除或转移性胃或胃食管连接部腺癌(GC/GEJC)患者的关键性Ⅲ期KEYNOTE-859研究公布研究结果。

KEYNOTE-859研究共纳入1579例患者,按1:1随机接受帕博利珠单抗(200mg,Q3W)+FP/CAPOX方案化疗或安慰剂+FP/CAPOX治疗。主要终点为总生存(OS),次要终点包括无进展生存期(PFS)、客观缓解率(ORR)、缓解持续时间(DoR)和安全性。所有研究终点均取得阳性结果。

  • 帕博利珠单抗加入化疗较仅化疗显著延长患者总生存并降低22%的死亡风险,中位OS分别为12.9个月 vs  11.5个月(HR=0.78,P<0.0001)。

  • 帕博利珠单抗联合组 vs 化疗组:中位PFS :6.9个月 vs 5.6个月(HR=0.76,P<0.0001);客观缓解率(ORR):51.3% vs 42.0%(P=0.00009);中位DoR:8.0个月 vs 5.7个月。

【肿瘤资讯】特别邀请到复旦大学附属中山医院生物统计室梁斐教授从统计学角度出发,结合帕博利珠单抗在KYENOTE-062中的研究探索,分析KEYNOTE-859研究取得成功的原因,希望能给各位临床同道在临床研究设计上带来些许启发。

专家简介

梁斐 教授

复旦大学附属中山医院生物统计室统计师
复旦大学循证医学中心成员
上海抗癌协会癌症预防与筛查委员会委员
CSCO青年委员会统计小组成员
以第一作者(含共一)或通讯作者在JCO,  Annals of Oncology, JNCI, European Journal of Cancer 等杂志发表SCI论著15篇,累计影响因子超过150
以第一作者在NEJM, Lancet, Lancet Oncology, JCO 发表Letter 8篇
JNCI, Clinical Cancer Research, Theranostics审稿人
作为统计师参与数十项研究者发起的临床研究,相关成果发表于JCO, Annals of Surgery等杂志
主要研究方向:临床试验设计及统计,临床研究方法学

点击观看梁斐教授讲课视频

KEYNOTE-859研究全人群OS显著获益,

长期随访显示免疫长生存特点

梁斐教授:KEYNOTE-859研究是一项随机对照双盲的Ⅲ期研究,对比了帕博利珠单抗联合FP/CAPOX方案和安慰剂联合FP/CAPOX方案一线治疗GC/GEJC的安全性和疗效,主要终点为OS。虽然研究仅设有一个主要终点OS,但实际目标人群有多个,α分配方案包括了意向治疗(ITT)人群(α=0.8%)和PD-L1 CPS≥10的人群(α=1.7%)。

研究在主要终点上,即意向治疗(ITT)人群OS上取得了阳性结果:HR=0.78,与同类其他研究的HR结果相当,P值远小于0.0001;且两组的曲线随着随访时间延长慢慢分开,2年随访时OS率达到约10%的差异,进一步体现了免疫治疗的长期生存的特点。

惩前毖后,鉴往知来:深度剖析

KEYNOTE-062研究设计

梁斐教授:回顾KEYNOTE-062可以发现其研究设计远复杂于KEYNOTE-859研究。复杂的因素包括:一、KEYNOTE-062研究设有两个研究组,即帕博利珠单抗单药组和帕博利珠单抗联合化疗组,和一个单纯化疗对照组。二、KEYNOTE-062主要终点设计也较为复杂,设有OS和PFS两个研究终点,想要回答问题较多,使α分配策略复杂。α分配上既有单药组,也有单药联合组,既包括PD-L1 CPS≥1人群,也包括CPS≥10人群。

具有多个研究假设的临床研究有其好处,如研究假设中有任何一个假设取得阳性都适用于统计学上的阳性结果,但这类研究设计的要求相对较高。研究假设不限制个数,但不同研究假设之间需要合理分配α,确保研究α控制在双侧的0.05或单侧的0.025。即研究中可以有多次校验的机会,但总的校验机会加起来的假阳性率不能超过5%或单侧2.5%;且需要对不同研究假设分别计算样本量。

KEYNOTE-062有7个研究组假设参与了α分配。首先按照单药和联合组拆分,单药组α分得0.004,联合组分得0.021。其中联合治疗的CPS≥10人群OS分得0.0075,CPS≥1人群OS分得0.0125,PFS分得0.001;单药组OS是非劣效检验后进行优效检验,分得0.004。

KEYNOTE-062并不是完全阴性的结果,它在帕博利珠单抗单药组CPS≥1人群中的非劣效研究终点是达成的。单药组非劣效界值为1.2,计算99.2%可信区间。为什么是99.2%的可信区间?这是由于该终点分到的是0.004的单侧α,相当于双侧的0.008,对应在可信区间即为99.2%的可信区间。最终研究结果HR值为0.91(0.69-1.18),其可信区间上限是1.18,未超过非劣效界值1.2。因此非劣效角度,KEYNOTE-062研究中帕博利珠单抗单药在CPS≥1人群的非劣效终点达到了,从严格的统计学意义角度上来看,这一研究取得了阳性结果。

但KEYNOTE-062的联合组CPS≥1的人群中,OS HR值是0.85,P值为0.046,有获益趋势,但由于α分配较小,仅为0.0125,未达到统计学差异;CPS≥10的人群同理。

总体而言,KEYNOTE-062研究假设较多导致结果分散,未聚焦到重要的研究假设上,是导致结果失败的重要原因之一。

千淘万漉虽辛苦,吹尽黄沙始到金:

KEYNOTE-859深刻反省,载誉归来

梁斐教授:KEYNOTE-859研究,则在KEYNOTE-062研究上吸取了一些教训。除了化疗方案的不同,KEYNOTE-859研究聚焦于帕博利珠单抗联合化疗,主要终点从PFS和OS双终点变为OS单终点。

KEYNOTE-859研究与KEYNOTE-062研究具有明显区别,整体上表现为研究设计更为简洁、聚焦:首先是研究组的变化,KEYNOTE-859是双臂设计,KEYNOTE-062是3臂设计,研究组减少可以简化α分配。第二是样本量增加带来把握度的增加,在研究组间检测出差异的可能性越大。KEYNOTE-859研究有1579例患者,而KEYNOTE-062仅有763例患者。第三是主要研究终点简化,KEYNOTE-859主要研究终点仅为OS单终点。实际上,胃癌的一线研究中,PFS仅是锦上添花,不足以支持获批适应证;OS阳性才能获得适应证的审批。

与KEYNOTE-062最初有4个终点参与α分配不同,KEYNOTE-859最初仅有2个终点参与α的分配,α分配更为聚焦,即ITT人群的OS(α=0.8%)和PD-L1 CPS≥10人群的OS(α=1.7%),当CPS≥10人群OS的终点取得阳性后传递给CPS≥1的人群。这其中,PFS不参与最开始的α分配。虽然仅有2个终点参与初始α分配,但2个OS达到阳性后也可将α值传递至次要终点PFS、ORR,最终依然可得出确证性结论。

KEYNOTE-859研究最终ITT人群的OS 的HR为0.78,P值远小于0.001,疗效较KEYNOTE-062提高。远小于0.001的P值可能得益于其研究设计更为聚焦、样本量更大,使其有足够的把握度下确证性结论。从亚组分析也可发现,PD-L1 CPS≥1和≥10人群都达到了预设的统计学显著性终点。从统计学角度,PD-L1 CPS≥1和≥10,以及ITT人群的OS均取得了阳性结果。

3个OS取得阳性结果后,PFS虽未进行第一步α分配,但α传递下去后也可以对其进行正式的统计分析。只要关键次要终点参加α值的分配,最终达到预设界值也是可以认为其具有统计学差异的。因此可以说,KEYNOTE-859研究ITT人群的PFS(HR=0.76,P<0.001)取得了阳性结果,其对应级别与双终点的PFS、OS双终点的结果证据等级相同。因此,KEYNOTE-859研究的PFS和OS都具有统计学上的阳性意义。

小结可得,KEYNOTE-062研究之所以没能在联合治疗OS上获得阳性的结果,重要的原因由于设计过于复杂,想回答的问题过多,多个研究组和研究终点共享α,导致α值被过度稀释,每个终点都没能分得足够多的α。相较下,KEYNOTE-859研究更为聚焦,且样本量大增加了研究取得阳性结果的可能性。且KEYNOTE-859研究虽然只有两个OS参加α值第一次分配,但其全人群的OS、PFS、ORR都参与了α后续传递的分配,最终的结果是所有的终点上都达到了统计学差异。

审批编号:MI-PD1-4197-CN

过期日期:2/28/2024

本资讯由默沙东医学团队提供,旨在用于医学专业人士间的学术交流,请勿随意转发或转载。文中相关内容不能以任何方式取代专业的医疗指导,也不应被视为治疗建议。医学专业人士对文中提到的任何药品进行处方时,请严格遵循该药品在中国批准使用的说明书。默沙东不承担相应的有关责任。

责任编辑:肿瘤资讯-Marie
排版编辑:肿瘤资讯-Phoebe