您好,欢迎您

药物研发中,如何选择一个合适的“研究终点”

04月20日
来源:张波教授

新药研发过程中,如何选择合适的终点以客观、全面的评估药物疗效是非常核心的一个环节,ORR、中位PFS、中位OS、HR等均可以反映药物疗效,而OS更被认为是衡量疗效的“金标准”。本文中,上海交通大学医学院附属胸科医院张波教授

将结合具体研究例子,分析各个指标的利弊,同时讨论一个有些“叛逆”的话题:OS可以被称为“金标准”吗?

ORR:即客观缓解率(objective response rate,ORR)

指所有纳入分析的患者中,肿瘤出现客观缓解(靶病灶之和较基线缩小超过30%)的患者占比。

在单臂临床研究中,ORR是最常见的主要研究终点。既往笔者推送中,也曾经详细分析基于单臂研究批准药物上市的几个临床考量。作为主要研究终点,患者入组后3个月左右,即可拿到ORR数据,非常快速。但是,ORR有几个缺陷首先,无法反映缓解质量,包括肿瘤的缓解深度及缓解持续时间。比如,靶病灶缩小32%和92%,按照RECIST评估标准,均为客观缓解,评估为PR,但两者的缓解质量显然不同;其次,ORR和患者长期获益之间无直接关系。以小细胞肺癌为例,广泛期小细胞肺癌患者一线接受含铂双药化疗的ORR可以达到75%左右,这一比例几乎和靶向治疗类似,远远高于非小细胞肺癌患者一线接受含铂双药治疗30%-40%的ORR,但小细胞肺癌患者的预后却是最差的;最后,在药物研发过程中,为了追求较高的ORR,可能会给予较高的治疗剂量,由此带来的另一个问题——安全性及不良反应,尤其是严重不良反应发生率的升高,有可能会抵消药物获益。这一点在PI3K抑制剂治疗血液系统肿瘤的药物研发过程,体现的最为明显。在血液系统肿瘤中,很多PI3K抑制剂均是基于单臂临床研究获批上市,但安全性问题及由此导致的较高死亡率使得患者最终获益并不明显。2023年4 月 21 日,FDA 召开了针对 PI3K 抑制剂的肿瘤咨询委员会(ODAC)会议,以讨论 PI3K 抑制剂的毒性问题,以及是否需要随机对照试验来支持该类药物在血液恶性肿瘤领域的批准。最终,专家组以16票赞成、1票弃权的压倒性优势,支持了随机对照试验的必要性,PI3K 抑制剂基于单臂试验获得加速批准的大门被关上。

因此,虽然ORR很好的衡量了药物的抗肿瘤活性,但是,这一指标和PFS及最终的生存没有必然联系,且不能反应缓解质量等,而为了追求较高的ORR给予较高的剂量,因为安全性原因导致患者最终获益被抵消也是需要考虑的问题之一。

PFS:无进展生存时间(progression-free survival,PFS)

通常是指从随机开始至疾病进展或死亡的时间。

笔者个人认为,对于随机对照而言,PFS最客观的反应了药物本身的疗效数据,这是该指标的优势,但是,PFS本身也存在众多缺陷首先,PFS的衡量不够精准。按照目前国际广泛接受的定义,如果靶病灶之和较最大疗效增大超过20%,则认为疾病进展。通常,临床试验进行过程中,患者每6-9周进行一次疗效评估,因此,这一指标的估计与随访间隔有很大的关系,虽然PFS最客观的反应了药物本身的疗效数据,但只是“大概”反应了疗效数据;其次,对于单臂临床研究而言,PFS可能略微夸大药物疗效。因为临床上少部分肿瘤呈现惰性过程,即使不给予治疗,肿瘤也可能在一段时间内保持稳定。此外,“中位”的呈现形式不够稳定。对于时间依赖性变量(PFS、OS、DOR等),临床研究中通常以“中位”的形式进行展示,而所谓“中位生存时间”,简单而言就是在纵轴50%累计生存率这一点,做一条与X轴平行的直线,该直线与生存曲线的交点所对应时间轴上时间,就是中位生存时间,因此,所谓“中位生存时间”,实际是用生存曲线上的一点,代替了整条生存曲线,这就会产生一个有意思的现象:有时中位数据差异很大,但是差异无统计学意义(图1);或者有时中位数值差异很小,甚至完全相等,但是差异有统计学意义(图2);或者少数样本含量的变化,即可导致中位数值的估算出现巨大差异(图3)。最后,不能全面反映起效较慢的药物的疗效。由于中位PFS反映的是整个药物研发过程中相对早期的药物疗效,因此,对于免疫治疗等起效较慢的药物、或者部分患者长期获益的情况,可能中位PFS未必能较好的反应药物的临床获益(图4)。

图片4.png

OS:总生存时间(overall survival,OS)

指从随机化开始至患者出现全因死亡的时间。

OS一直被认为是药物研发过程中的金标准,且该指标衡量准确,较少受到其他因此因素的影响。但是,对于药物研发而言,研究者通常关心的是药物或者治疗方案本身带来的疗效,而OS则不仅仅包含了新药本身的疗效,同时还包含了患者疾病进展后,接受后线治疗带来的获益,此时,即使得到OS的阳性结果,这一OS阳性结果在多大程度上归功于新药带来的获益则很难讲的清楚,尤其是反应治疗方案本身带来获益的PFS为阴性结果的时候,得到OS的阳性结果就更加难以解释(LUNAR研究)。

图片5.png

此外,我们通常所说的OS阴性,是指同一个临床试验中,研究组和对照组比较,OS差异不具有显著性。但此时的OS阴性,已经是与历史对照相比,“高水平”上的阴性结果。例如,一代靶向治疗药物与化疗头对头比较的8项临床研究中,由于对照组可以交叉或者患者可以通过自行购买服药,试验组前线的获益可迅速通过对照组的交叉被稀释,因此,研究均未能实现OS的阳性结果,但此时,两组的中位OS已经达到20-25个月,相较于没有靶向药物时12个月左右的历史对照数据而言,已经有了很大的提高。因此,虽然最终OS是阴性结果,但是药物均获批相应适应症。

HR:风险比(hazard ratio,HR)

HR反映了整个临床试验过程中,疗效之间的差异情况,一定程度上避免了“中位”这一概念的估算带来的不稳定。但是HR存在的问题是该指标反应的是“整体”,而无法知道“局部”的情况。例如,在药物研发过程中,少部分患者可能并不能从新药的治疗中获益,甚至治疗有害,而表现为前一小段曲线中,生存时间快速“掉下来”,但由于多数患者可以获益,因此整体人群表现出了阳性结果,但实际上,小部分患者接受的治疗可能是有害的,但并不能反应出来(CheckMate-057研究)。

图片6.png


小  结


主要研究终点的选择和解读是临床试验的核心和关键之一,虽然OS被普遍认为是“金标准”,但是这一“金标准”还存在许多缺陷,因此,需要结合ORR、PFS、DOR、缓解深度及缓解质量、HR值及生存曲线等,进行综合评估。



责任编辑:肿瘤资讯-Nydia
排版编辑:肿瘤资讯-Nydia


版权声明
本文专供医学专业人士参考,未经著作人许可,不可出版发行。同时,欢迎个人转发分享,其他任何媒体、网站如需转载或引用本网版权所有内容,须获得授权,且在醒目位置处注明“转自:良医汇-肿瘤医生APP”。

评论
05月26日
滕欣丽
佳木斯市肿瘤结核医院 | 放疗科
虽然OS被普遍认为是“金标准”,但是这一“金标准”还存在许多缺陷,因此,需要结合ORR、PFS、DOR、缓解深度及缓解质量、HR值及生存曲线等,进行综合评估。
04月23日
雷昕奕
永州市中心医院 | 胃肠外科
药物研发中,合适的研究终点。
04月22日
李娟
六安市人民医院 | 病理科
OS一直被认为是药物研发过程中的金标准,且该指标衡量准确,较少受到其他因此因素的影响。