您好,欢迎您

不同预后模型的比较方法(2) ——软件实施篇

2017年07月25日
作者:袁联雄  中山大学附属第三医院 (微信号:boy_for_)
来源:微信公众号“郑正有词”
前几期的帖子我们介绍了如果以不同分期/预后模型比较为主题撰写论文以及不同分期/预后模型比较的统计学方法和指标,了解了思路和方法,那怎么才能得到这些结果呢,下面袁老师就通过R软件带领大家一步一步把结果分析出来。本文尽量行文直白,让及时没有接触过R软件的朋友读完本文也能独立完成分析。

当然,首先你要安装一个R软件….
软件下载网址:https://www.r-project.org/

在安装完软件后,我们开始第一步工作——数据准备
getwd():首先找到R软件的工作目录,然后将要分析的数据放到该目录下面
> getwd()
[1] "C:/Users/Yoga/Documents"
袁老师的电脑工作目录是在C盘的“我的文档”。将要分析的数据另存为csv格式存放到工作目录,再读取到R软件中。如下所示:把要读取得csv数据命名为comparision,header=T是告诉软件第一行是变量名,读取到软件后的数据集命名为compare。

2.jpg

第二步:建模,获取各个指标值

2.1 加载函数包:由于本研究采用的是生存分析,因此需要先加载生存分析的函数包。在软件中运行library(survival)即可。

2.2 构建模型:首先运行一下语句
TNM7<-coxph(Surv(time,status==1)~factor(TNM7th),data=compare)
我们就构建好了一个叫做TNM7的模型
注意:因为TNM分期是有序分类变量,因此需要用factor来告诉软件TNM7th这个变量不能当作连续变量处理。

然后采用summary函数读取模型的详细结果。如下图所示:
3.jpg

在图中中部可以看到回归系数(coef)和RR值(exp(coef)),Z值和P值等等,模型的底部就是我们想要得到的部分指标了:

1)最后一行就是Log-rank χ2值,它与上面两行的Wald test χ2值(Trend χ2), 以及likelihood ratio test χ2值属于同一个家族。

2)Concordance就是我们说的C-index,有人会说怎么没有95%置信区间啊,不用着急,注意到后面括号里的se=0.011了吗,这是C-index的标准误,95%置信区间的上下限分别等于C-index ± 1.96*se。

细心的读者会发现:没有看到AIC呀!是的,想要得到AIC我们需要借助另外一个函数,那就是AIC(),在软件中运行AIC(TNM7),结果如下
AIC(TNM7)
[1] 11553.44

到这里我们就得到了文献中所有的指标了,重复上面的步骤我们可以继续得到第八版分期的结果。
4.jpg

这样我们就可以通过比较不同分期版本的AIC和C-index得到哪个分期系统更好的结论了,怎样,是不是很简单,很容易实现呢?

参考文献

1. Zhang DR, Zheng YZ, Wang Z, Huang QY, Cao X, Wang F, Liu SY. Comparison of the 7th and propsed 8th editions of the AJCC/UICC TNM staging system for esophageal squamous cell carcinoma underwent radical surgery. EJSO 2017.