您好,欢迎您

不同预后模型的比较方法(1) ——深度解读《第八版食管癌分期到底好在哪?》

2017年07月25日
作者:袁联雄 中山大学附属第三医院  (微信号:boy_for_)
来源:微信公众号“郑正有词”
在上一个帖子《第八版食管癌分期到底好在哪?》中,我们介绍了一篇关于第七版和第八版食管癌病理分期系统预后预测能力的比较的文章,文章中除常规通过K-M生存曲线比较了两种分期系统不同分期生存状况的区分度外,主要通过比较AIC,C-index和Log-rank χ2的大小来评估两种分期系统的优劣。本贴旨在说明这些指标是什么,有什么意义。

实际上这三个指标中AIC是用来评价回归或者预测模型拟合原始数据优劣的常用指标,与AIC“同一个家族”的指标还有BIC,AICC等,在生存分析中,AIC=-2ln(L)+2k,其中L为模型的最大似然函数值,代表的是模型拟合原始数据的能力(-2ln(L)越小,表示模型拟合越好,平均来说模型预测值与原始值越接近),k与预测变量个数有关,预测变量越多,k越大。AIC越小越好,因此以AIC作为模型评价指标是寻找包含较少变量但可以较好地解释数据的模型。第七版和第八版的分期数目一致,因此k相同,AIC较小的一方模型拟合较好,模型预测的生存时间可能更接近与实际生存时间。

C-index与ROC曲线下面积AUC可当作是“同一个家族”的指标,均代表了模型准确性和区分能力的高低,如AUC高,一般来说模型具有较高的灵敏度和特异度(当然对于不平衡的数据,这个结论可能是错误的,关于不平衡数据有关问题以后有机会再专门介绍),在生存分析中,由于同时关心结局事件是否发生,以及结局事件发生的时间,此时ROC曲线不再适用(当然也有针对生存数据的ROC曲线,但实际上也是探讨某个特定时间点下的生存情况,如3年生存情况的ROC曲线,已变成类似二分类数据的ROC曲线问题),C-index就很好的解决了这个问题,它是通过将所有患者随机两两组成对子,计算所有对子中预测生存概率高的患者实际生存时间也较长的对子占全部对子的比例,可表示模型预测的准确性,更重要的是表示模型正确区分不同生存情况的患者的能力。C-index越高,表示模型预测准确度越高,对于两类具有不同临床特征的患者,预测生存概率较高的患者平均来说生存时间会长于预测生存概率较低的患者。C-index常与calibration curve配合使用,calibration curve评价模型预测值与实际值的一致性,二者相结合可以较为全面的评估模型预测的准确性。

Log-rank χ2与其它χ2值一样,可用于评价不同组间结局分布是否存在差异,Log-rank χ2越大,一般来说模型中不同亚组间(分期系统中不同分期间)的生存情况差异可能较大,生存曲线分开的也较为明显,因此Log-rank χ2较大,一定程度上代表模型预测能力较好。如下图中左侧是第七版分期系统,右侧是第八版分期系统,可以看到不管是全部分期,还是TxN0M0、TxN1-3M0,第七版的Log-rank χ2均要低于第八版,同时K-M生存曲线上:第七版不同分期的生存曲线存在不同程度的交叉,而第八版分期生存曲线分开较为明显,基本没有交叉,尤其是中远期生存情况。
2.jpg

附图来自《第八版食管癌分期到底好在哪?

本文仅对上述指标的意义做了简单介绍,具体如何计算出这些指标,如何在统计软件中实现,将在以后地帖子中陆续介绍,欢迎大家继续关注!

袁老师小记。

1.AIC较小的一方模型拟合较好,模型预测的生存时间可能更接近与实际生存时间。
2.C-index越高,表示模型预测准确度越高;C-index常与calibration curve配合使用,calibration curve评价模型预测值与实际值的一致性,二者相结合可以较为全面的评估模型预测的准确性。
3. Log-rank χ2越大,一般来说模型中不同亚组间的生存情况差异可能较大,生存曲线分开的也较为明显,因此Log-rank χ2较大,一定程度上代表模型预测能力较好。

参考文献

1. Zhang DR, Zheng YZ, Wang Z, Huang QY, Cao X, Wang F, Liu SY. Comparison of the 7th and propsed 8th editions of the AJCC/UICC TNM staging system for esophageal squamous cell carcinoma underwent radical surgery. EJSO 2017.