首页 > 文章详情

统计知识系列讲座（二）—— 研究设计比较的类型

2024年02月04日

作者：楼丽姝

来源：医统江湖

研究设计比较的类型

根据研究目的，临床试验中比较的类型分为优效性试验、等效性试验和非劣效试验。本文将围绕优效性/等效性/非劣效试验，重点介绍试验设计和统计分析的相关事宜。

一

比较的类型

1、什么是临床优效性试验？

评价试验药物的有效性一般采用优效性试验设计，其目的是显示试验药的治疗效果优于对照药，且两者之间的效应指标的差异具有实际的临床意义，多采用安慰剂对照、空白对照、剂量组间对照或阳性药物对照。

2、什么是临床非劣效性试验？

优效性试验设计中安慰剂对照是最直接和高效的对照方式，但在某些临床实践中直接采用安慰剂对照存在伦理问题，如已经有治疗某适应证的有效药物，且可预知由于延误治疗可能导致受试者死亡、病情进展、残疾或不可逆的医学损伤发生则不宜单纯采用安慰剂对照。采用阳性对照药物避免了此类伦理学风险，但是通过临床试验评价试验药优于公认的阳性对照药（尤其是对照药物的疗效已经很好时）往往有一定难度。

基于此，临床试验中提出了采用阳性对照的非劣效试验设计，用于说明试验药物非劣效于对照药物，即试验药物疗效不比对照药物的疗效差，或试验药的效果比对照药效果略差一些，但其差异也是在临床可接受范围内。

3、什么是生物等效性试验？

生物等效性是指同一药物的不同制剂或不同的药物产品其效用相当，以试验品与参比品作比较，两药物的生物利用度（吸收率与吸收度）在生物体内相同，这往往通过AUC、Cmax、Tmax等药代动力学参数来表示。

生物等效性试验多用于仿制药与专利药的评价。仿制药的评价基于的假设是：如果仿制药与参比药具有生物等效性则其临床效果是相同的。因此，仿制药的评价如果能够说明其与参比药具有生物等效性，则无需进行额外的临床试验，即可以获得上市批准。如果没有办法说明具有生物等效性，则可以通过临床试验来确证。

4、什么是临床等效性试验？

临床等效性是指同一药物的不同制剂或不同的药物产品其临床效果相同，包括有效性和安全性。有些药物或其代谢产物在血液的浓度不容易测量，或局部给药时不能充分入血，无法测定其体内代谢情况；有些新药有着不同的使用途径或作用机制。对这些药品的等效性评价是生物等效性所不能解决的。此时需要借助于临床试验来评价，确证两种或多种治疗的效果差别大小在临床上并无实际意义，即试验药与阳性对照药在疗效上相当。

5、临床等效与生物等效有何区别？

二

假设检验

以高优指标为例，各试验的假设检验如下：

优效性及非劣效性试验为单侧检验，等效性试验为双单侧检验。

*T代表试验组效应，C代表对照组效应；绝对度量Δ＞0，相对度量Δ＞1。

高优绝对度量指标示意图：

三

界值的确定

等效或非劣效在临床上应有一个范围，用Δ(Δ>0)表示这种界值，并以-Δ表示劣侧界值，以Δ表示优侧界值。显然，非劣效性试验仅用-Δ一个界值，而等效性试验要用-Δ和Δ两个界值。Δ应不超过临床上能接受的最大差别范围，Δ选大了，可能会将疗效达不到要求的药物判断为非劣效或等效而推向市场；若Δ选小了，则可能会埋没一些本可推广使用的药物。因此，Δ值应由临床医学专家及统计学专家依据行业标准、实际需要、可操作性等方面来选定，必要时还可事先与监管部门协商，并在试验方案中说明界值确定的依据。

非劣效界值M2一般采用两步法进行确定， 即在本试验阳性对照药的既往优效性试验中获取疗效差异（M1），并在此基础上回撤不超过50%。

M1一般借助Meta分析给出其可信区间。考虑历史试验间的变异后确定模型，如果历史试验间同质性较好，可信区间的构建可采用固定效应模型，否则采用随机效应模型以考虑试验间的变异对阳性对照效应估计的影响。考虑到疗效一致性的问题或历史数据的质量，一般取M1小于疗效差异的95%CI下限。

界值M2要结合临床具体情况、考虑保留阳性对照疗效的适当比例f后确定，M2需在M1基础上回撤1-f倍。由于f 取的太小会使得试验所需样本量大到试验无法进行，所以临床试验中一般取0.5≤f≤0.8，即回撤比例不超过50%。

非劣效界值确定过程示意图：

有了非劣效界值的确定原理和方法，等效性界值的确定则不难理解，可考虑先借助非劣效界值的确定方法获得一侧的界值，然后再参考该界值大小确定另一侧的界值。理论上，等效性界值的下界和上界两个界值是可以不等距的，但实际中一般取等距数值，只是代数符相反而已。

四

统计推断

除依据假设检验计算检验统计量进行统计推断外，置信区间方法亦可用于优效性/等效性/非劣效性的判定，该方法通过构建效应量参数置信区间与界值进行比较作为评价的决策准则。以CL表示置信区间的下限，以CU表示置信区间的上限。

以风险比HR=Thazard rate/Chazard rate推断为例：

CU＜Δ，则认为试验药物非劣于对照药物；

1/Δ＜CL＜CU＜Δ，则认为两药物等效；

CU＜1/Δ，则认为试验药物临床上优于对照药物。

图中实线代表两组风险率一致的情况 HR =1，右侧虚线为劣侧界值Δ，左侧虚线为优侧界值1/Δ（Δ>1）。

五

正确应用

1、 非劣效性与优效性之间的转换

非劣效→优效性的转换√

在对试验药疗效的优势把握不大，不敢贸然设计为优效性试验时，可在非劣效试验方案中预先定义非劣效与优效检验的转换，即先进行非劣效检验，如果非劣效结论成立，可进一步进行优效检验，如果优效结论成立，则研究结论为优效；如果优效结论不成立，则研究结论为非劣效；此种转换用到顺序检验的思想。因不考虑α校正，这一设计转换机制仅适用于只有一个主要疗效指标，且受试药为单剂量的情况。

优效性→非劣效的转换×

当非劣效结论不成立时，研究结论不支持非劣效，也不应再进行优效检验。因为在优效性试验设计时一般不考虑非劣效界值的问题，事后确定非劣效界值会引入偏倚。因此，若计划在采用阳性对照药的优效检验不成立时进行非劣效检验，则须在试验方案中预先考虑优效与非劣效检验的转换，包括事先定义非劣效检验假设、非劣效界值，以及多重性校正的策略等。

2、三臂非劣效性试验是不是最优的非劣效性试验设计？

在符合伦理要求的情况下，是的。此类设计具有较好的灵敏度，不需要依赖外部试验就能进行非劣效统计学推断。通过试验药组与安慰剂组相比，可以说明试验药是否有效；通过阳性对照药组与安慰剂组相比，可以评价试验本身的灵敏性，即阳性对照药物是否仍然有效，同时阳性对照药与安慰剂组的疗效差别为非劣效界值的确定提供了依据；通过试验药组与阳性对照药组相比可以判断试验药物是否非劣效于阳性对照药，甚至可以进一步判断试验药物是否优于阳性对照药。

3、什么是非劣效试验中的生物爬行现象？

疗效略差但非劣效的新药成为后续试验的对照药，多次试验后得到的非劣效结论的新药疗效已于安慰剂无异。为避免生物爬行现象出现，需要确保检定的灵敏度，具体如何保证见下一问。

4、要保证临床非劣效/等效的检定灵敏度，试验设计需要考虑什么？

（ 1 ）阳性对照有效性的既有证据；

阳性对照效应来源于文献报道的、精心设计并有良好质控的试验结果，这些历史试验已明确显示本次等效性/非劣效试验中所采用的阳性对照优于安慰剂，且随时间迁移，阳性对照的疗效基本维持稳定这就是所谓的阳性对照有效性的既有证据。根据这些试验结果可以可靠地估计出阳性对照的效应大小。

（ 2 ）阳性对照药物效应的稳定性（恒定假设）；

设计等效性/非劣效试验进行阳性对照的选择时，除了要有证据支持阳性对照的有效性之外，还要有证据表明当前试验中所采用的阳性对照能保持原来的疗效。如果当前的试验环境和历史研究保持一致，这时的阳性对照药物效应应该和历史研究的药物效应一致，这就是阳性对照药物效应的稳定性假设。

（ 3 ）良好的试验质量。

良好的试验质量是非劣效/等效临床试验具有鉴定灵敏度的基础。

5、 不同研究设计类型下，分析数据集如何选择？

意向性分析原则(intention-to-treat principle)：这种原则认为应以意向性治疗（即计划好的治疗）为基础进行评价，而不应以实际给予的治疗为基础进行评价。其结果是分到某一处理组的受试者即应作为该组的成员被随访、评价和分析，不论是否依从计划。

ITT 集：按照意向性治疗的原则分析的数据集。ITT集通常包含的是所有进行随机化的受试者。

全分析集（ FAS 集）： 尽可能接近按意向性原则的理想的受试者分析集。是在所有随机化受试者中以合理的方法，经少量剔除后的受试者分析集。

符合方案集（ PP 集）： 由充分依从于方案保证数据会按科学模型而表现出治疗效果的受试者子集所产生的数据集。依从性包括以下事项，如接受治疗、测量有效且对试验方案没有大的违背等。

在进行统计推断时，应分析不同数据集对结果的影响。一般来说，主要变量的结果对不同分析集不敏感是有利的。在确证性试验中，建议同时用ITT集及PP集进行分析，并对它们之间的任何差异进行详细讨论和解释。在有些情况下最好能用不同的分析集进行结论的敏感性探索，当ITT集和PP集得出实质相同的结论时，就增加了试验结果的可信性。但是如PP集中剔除了相当大的比例的受试者时，试验的整体有效性就值得怀疑了。

由于一些试验质量问题多倾向于疗效不佳，如依从性差、脱落率高、主要终点错误分类等，可能会掩盖试验组和对照组之间的治疗差异，两组实际观察到的差异由Δ缩小到Δ’。优效性设计中，如果Δ’被检验出差异有统计学意义，那么实际差异Δ必然有统计学意义；等效/非劣效设计中，由于组间差异缩小后更有利于支持非劣效，相比实际差异Δ，缩小的Δ’被检验出差异无统计学意义或非劣效成立时存在假阳性的可能性。