传统的临床试验,是以人体(患者或健康志愿者)作为研究对象的生物医学研究,以揭示新药、新器械等新的诊疗手段对人体的效果、作用和不良反应,或探索药物在人体内的吸收、分布、代谢和排泄规律等作为研究内容,目的是为了确认所研究的新药、新器械等的有效性与安全性。
传统临床试验往往只针对特定的疾病、特定的药物来开展,虽能有效地验证药物性质,但也存在局限性和挑战。为加快抗肿瘤药物和生物制品开发,提高研究效率,监管机构和医药行业展开深入讨论并尝试创新了一种高效的新型临床试验模式——主方案(master protocol)试验设计,能够在一个总体框架下对多种药物和/或多种疾病进行评估。
一、主方案设计的定义
主方案设计的定义为由多项平行的可能有不同研究目的的子试验组成,在同一试验结构下研究一种或多种干预措施治疗一种或多种疾病亚型的临床试验设计,一般应用于临床II期和III期试验。与传统试验设计不同,主方案允许多个子研究共用对照组、临床终点、数据收集和统计方法,加速研究进度、节省资金和资源。总之,主方案设计具有两个关键的属性,一是要由在一个试验框架下的多个子研究组成;二是研究的类型一定是干预性的研究,诊断性研究、多个终点的观察性研究(如队列研究等)不属于主方案设计。
二、主方案设计的类型
在一个共同的基础框架下,主方案设计包括但不限于篮式试验(basket trial)、伞式试验(umbrella trial)、平台试验(platform trial)或相互结合的试验设计方法。
1、篮式试验
(1)篮式试验定义
篮式试验的定义为评价一种干预措施或干预措施组合在不同疾病人群中的疗效,基于干预措施的作用原理确定统一的生物标志物并根据一定的筛选方案,将生物标志物改变相同的不同类型疾病的患者纳入同一试验(不同疾病人群可以是具有同种或同类基因变异的不同组织学类型、疾病的不同阶段、不同人口学特征等),均给予相应的靶向治疗,主要评估某种靶向治疗对带有某种特定生物标志物改变的不同类型的疾病是否有效。
图1 简要的篮式试验设计流程模式
(2)篮式试验案例
篮式试验的一个具有代表性的例子:Hyman等设计的多中心、两阶段设计的篮式试验,以评估BRAF V600抑制剂——维莫非尼对除黑色素瘤之外的带有BRAF V600阳性突变的其他类型的肿瘤患者的作用疗效,共计选择122例BRAF V600阳性突变的晚期肿瘤患者进入预先设定的不同类型肿瘤的队列,所有患者入组时均无标准方案可选,给予维莫非尼治疗(如图2所示)。
帕博利珠单抗(K药)是FDA批准的首个广谱抗肿瘤药物,基于一项包括15个瘤种共149例受试者的篮式试验研究结果批准了K药用于治疗所有带有MSI-H或dMMR分子生物学标记物的所有实体瘤患者,体现了篮式试验高效灵活的优势。
(3)篮式试验的特点
篮式设计的两个关键属性其一为只评价一种干预措施或干预措施组合,其二为具有多个疾病人群。足够多的病例数才能保证试验结果的可靠性,所以传统的临床试验往往无法在少见肿瘤人群中开展,篮式试验以基因型划分组的研究方法挣脱了传统的束缚,许多少见肿瘤患者能够与其它常见肿瘤一样因具有相同的基因突变纳入至篮子试验中,体现其最大的优势——兼顾一些罕见病患者群体。
篮子试验存在一些局限性:① 在一些篮子试验中,样本量有可能相对较小。虽然这些患者可以提供非常重要的生物以及临床信息,但因为样本量过少,导致没有足够的统计学证据证明该药物对大样本量的广泛适用性。② 第二个缺点是缺乏对照组。篮式试验同时研究多种类型疾病,且疾病之间建立的标准治疗可能不尽相同,设定单一对照组较为困难,因此大部分篮式试验常以无对照组设计为主。在没有安慰剂/标准治疗对照组的情况下,单臂研究在美国是很难通过监管部门的审核,也很难从公共卫生的角度做出任何结论。③ 篮式试验设计时,疾病适应证的初步选择必须基于重要的科学和临床证据,若纳入无效疾病队列可能会稀释整体治疗效果,对试验结果造成较大的偏差,降低试验成功率。
2、伞式试验
伞式试验是指对同一类型疾病的患者根据其不同的生物标志物分配相应的靶向治疗,同时评估多种靶向治疗效果的临床试验;是一种针对分层为多个亚组(基于预测性生物标志物或其他预测性患者危险因素)的单一疾病评估多种靶向治疗的前瞻性临床试验。伞式试验中的子研究可包括剂量测定或安全性先导部分,以确定研究药物组合的安全剂量,然后再进行活性估计部分。
图3 简要的伞式试验设计流程模式
(2)伞式试验案例
2014年开始的Lung-MAP试验的原始版本是首个真正意义的伞式试验,主要针对化疗耐药晚期鳞状非小细胞肺癌的二线治疗,共包括5个子研究,其中多西他赛是4个子研究的共用对照组。符合条件的受试者根据其生物标志物被分配到子研究,或不符合生物标志物特定子研究条件的受试者被分配到非匹配治疗子研究。在子研究中,受试者被随机分配到生物标志物驱动的靶点或SOC治疗。LungMAP试验伞式设计主方案见图4。
图4 肺鳞状细胞癌患者的Lung - map试验
(3)伞式试验的特点
伞式试验的两个属性其一为具有多种干预措施;其二为伞式试验只针对一种疾病,是一种多种干预对单一疾病的设计。
伞式试验干预分配可能是也可能不是随机决定的,由于仅研究一种类型的疾病,挑选对照组较为容易,因此通常采用随机对照设计,各亚组间使用共同的对照组,对照组一般为安慰剂或标准治疗。伞式试验在给定的试验群组中不易出现肿瘤异质性;其最大的优势是将罕见的疾病类型患者集中起来为药物研发提供更有说服力的证据;这无论对加速少见疾病的临床试验还是对于某一个个体获得精准治疗的机会,都具有特别的意义。但同时在罕见的疾病类型中,根据生物标志物改变再进一步划分亚组,可能很难招募到足够的患者,延缓整个试验的进度。
3、平台试验
(1)平台试验定义
平台试验是指一种在单一疾病背景下,永久性地研究多种靶向治疗的疗效,与伞式试验不同的是,平台试验可以根据决策算法使研究药物动态退出或进入试验。平台试验是随着时间的推移而进行的没有固定的停止日期。
图5展示了较为常规的平台试验设计思路,在试验开始时,招募的患者接受筛查,根据筛查结果将患者随机分配到常规治疗组、药物1组和药物2组。以常规治疗组作为对照,评估两种药物的疗效。在试验进程中研究人员按照原定计划进行两次期中分析和一次最终分析。在第一次期中分析中,药物1满足事先设定的试验“成功”或“失败”的标准,该组终止,药物2进行既定计划的最终分析。当有证据表明药物3与药物4具有潜在疗效时,研究人员分别在第一次和第二次期中分析过程中将其引入平台,与之前纳入的患者共享同一个对照组,重复上述试验过程。
图5 常规平台试验设计示意图
图6展示了涉及生物标志物的平台试验设计思路。试验初期对患者进行生物标志物的筛选,随后进入各自的标志组,标志组内再随机进入不同的靶向药物治疗组。药物若达到预期标准则停止入组或也可成为新的对照组,若未获得收益则终止并退出平台。在试验中也会有新的药物治疗组或新的标志组进人平台试验。平台试验的重点是找到有效的治疗方法,而不仅仅是针对单个药物的评价。
图6 生物标志物平台试验设计示意图
(2)平台试验案例
NRG-GI002研究的目的是为检验直肠癌新辅助治疗中的新药物或假设提供一个平台。在正式审查后,将通过方案修正考虑加入其他试验组,包括该组的具体信息以及与对照组比较的统计分析计划。任一试验组的成功取决于是否达到NAR评分降低等病理终点,这有助于提高之后的确证性随机对照试验成功的可能性。
该研究在设计时先1∶1引入对照组与Veliparib试验组,后进行方案修正增加帕博利珠单抗试验组,若两组试验组招募时间有重叠,则进行1∶1∶1随机分组,未重叠部分仍进行1∶1随机分配到对照组与相应试验组。平台试验除了可在后续引入新的试验组外,还设置期中分析判断试验组是否满足事先设定的试验“成功”或“失败”的标准,以终止某试验组。本研究设置中期无效性分析,若试验组NAR评分高于对照组,则暂停该试验组。
图7 NRG-GI002研究流程图
(3)平台试验的特点
平台试验从整体形式和运行看,是一种动态设计模式,更像是适应性设计的扩展,允许在试验过程中根据前期试验获得的信息和累计数据对关键因素进行修改。平台试验可以同时评价多种药物,加速了对有效药物的识别,同时还可评价联合治疗以及确定对亚组患者的个体化疗法。然而,由于其自身“平台”属性的特征性,该方法的实现更需要持久的团队合作,更依赖创新性统计学方法以及在研究过程中更完善的组织和协调。同时,平台试验的设计初衷一定是将找到有效的治疗作为优先目标,而不只关注于对单个药物的评价。
其主要特征如下:
1. 具有多种干预措施;评估多种药物在某一疾病异质群体中的疗效;明确假设治疗效果可能具有异质性。
2. 研究耗时长,只要有潜在的适合被评估的药物,则试验继续。
3. 试验包含多个治疗组,治疗组数量或某种特定药物可能会随着时间而改变。
4. 试验持续的时间是长期的,确证了有效、无效或是风险大于获益的药物将会从试验中移出,而新的药物可以加入,试验继续。
5. 采用响应-自适应随机化设计,该方法利用试验中已经得到的信息,通过不断调整分组概率而将更多的受试者分配到处理效果更好的治疗组。
三、主方案设计需要考虑的关键因素
1、生物学考虑
生物学合理性:评估生物标志物定义人群的主方案,应解释为什么使用生物标志物是合适的,并用于体外诊断试验,无论是作为单一生物标志物试验,还是作为评估多个生物标志物的平台,都是经过分析验证的。合理的假设能为推导靶向干预策略提供关键的作用机制信息,需要仔细评估已有的临床证据和潜在的生物学假设,以确保有针对性干预的生物学合理性。
生物标志物相关考虑:在试验计划阶段就应将检测的不准确性纳入考虑,以免影响试验结果。在涉及多种肿瘤类型时,应保证不同瘤种之间的生物标志物检测的准确性相似。生物样本采集时需达到相对一致的高质量及可及性,特别是对于纳入多癌种的篮式试验。试验设计时还应考虑生物标志物的患病率,其将会影响携带这些生物标志物的患者的招募,进而影响患者库的规模。
基于生物标志物的亚组:在篮式或复杂设计的主方案试验中,会根据受试者的生物标志物来分配治疗组。当一个受试者具有多个生物标志物,同时符合多个治疗组的入选标准时,方案中需要应当明确这一类受试者的分配方法。FDA推荐两种方法进行分配,一是按照生物标记物的预测价值提前设置优先级,将患者优先分配到更具预测价值的治疗组中,如果该患者在接受某一治疗组后出现了疾病进展,也可以重新将其分配到其他治疗组;二是通过预先指定的随机化的比率来进行随机分配,例如Lung-MAP试验使用了患病率的反向比率,这样可以将试验中具有低患病率生物标记物的肿瘤患者,更有可能被分配到低患病率人群的亚组研究中。
2、对照组的选择
对于同时评价多种药物对一种疾病类型疗效的主方案设计,FDA建议使用当前的标准治疗作为共同对照组,提高主方案的效率。需要注意的是,由于试验的长期性,如果作为对照的标准治疗发生变化,应暂停受试者入组,试验的对照也应当随之调整,直到对方案和知情同意书进行修改。在对数据任何分析之前,也应尽快修改SAP。 涉及多个疾病类型的主方案试验中由于难以为多个疾病类型的患者确定统一的标准治疗、治疗组和对照组的患者数量在试验中难以平衡,多不设置对照。对照组的缺失可能会导致对于疗效的高估或低估,影响疗效的评价。
3、样本量及假设
随机篮式试验和伞式试验的样本量通常比单臂设计的样本量大。在随机设计中,可以对篮式试验中的子队列或伞式试验中的每个子组进行样本量计算。伞式试验的招募难度更大,因为它只能从一个患者库的一个子集中进行。
4、Ⅰ类错误控制
由于存在多个研究目的,主方案设计的试验往往面临多重检验的问题,需要控制试验的总体Ⅰ类错误率。
篮式试验由于是评价一种药物同时治疗多种疾病类型的患者,在统计分析时也最容易出现假阳性的结果。篮式试验的每项子试验通常采用独立的Simon两阶段设计,通过期中分析来评价药物对各个患者亚组的有效性,提前停止治疗效果不佳的子试验。 对于以确证性为目的的伞式试验,其涵盖多种药物,若同时开展多个子研究,可能涉及多重性问题。如果这些子研究是独立的研究且回答特定的临床问题,如适用疾病、目标人群等,因为监管机构可以同时独立评估用于相同适应证的不同药品的上市许可申请,故一般不会导致总Ⅰ类错误率膨胀。但对于子研究的复杂设计,如果目标人群之间有较大重叠,或对于多个子研究使用同一个对照组,可能会导致FWER膨胀,在这种情况下,应该根据具体情况来判断是否需要进行多重性调整,并建议申办方与监管机构进行充分沟通。
浙江省肿瘤医院
临床研究部
统计师