您好,欢迎您

CpG甲基化情况能预测早期肝癌是否复发

2017年01月25日

编译:马辰凯

来源:肿瘤资讯

早期肝细胞癌(E-HCC)患者有一半将会复发,因此,急需确定复发相关标志物。我们调查CpG甲基化在预测E-HCC患者复发的有效性。Qiu等人通过对576例E-HCC进行甲基化测序,并应用不同的机器学习方法,筛选出三种与E-HCC复发相关的高危标志物。其结果发表在《Journal of Clinical Oncology》。

引言

肝细胞癌(HCC)是癌症相关死亡的主要原因之一,每年有超过50万人死亡。在过去几十年,由于技术的进步,早期肝癌(E-HCC)患者的诊断有所增加。然而,一半的E-HCC患者在切除后会出现复发,5年生存率<30%。传统的预后因素无助于预测哪些E-HCC患者会发生复发。而E-HCC的分子研究则可以提供预测复发的信息和对可能需要并受益于辅助治疗的患者进行分类。

 

为了寻找HCC患者的预测分子,以前的研究发现了有价值的生物标志物。然而,这些研究有局限性。此外,大多数研究没有解决生物标志物在不同疾病阶段的有效性,并未能在独立中心验证其发现。因此,几乎没有生物标志物被采用到临床实践中。

 

DNA甲基化是调节基因表达的表观遗传修饰,并且在早期癌症中经常发生异常甲基化。最近,异常甲基化已经获得相当大的关注,因为这些改变是相对稳定的并且潜在可逆的。在结肠直肠癌中SEPTIN9和胶质母细胞瘤中的O6-甲基鸟嘌呤-DNA-甲基转移酶的甲基化是广泛应用的例子。然而,很少有甲基化标记被广泛应用到HCC。因此,需要更全面的研究来确定甲基化在E-HCC复发中的具体作用。

 

本研究旨在确定和验证E-HCC中复发相关的CpG。我们最初对66名患者进行基因组谱分析,然后在140名训练集中选择候选CpG,并在436多中心患者中验证这些CpGs。我们还验证了癌症基因组图谱(TCGA)数据库中的发现。


方法

患者人群

作者将早期HCC定义为孤立性肿瘤直径<5厘米和无术前成像和术后病理诊断的血管浸润。我们在中山大学癌症中心(SYSUCC)获得347个E-HCC样本,在三个独立中心获得295个样本,如下:来自中山大学第一附属医院的191个样本,来自广州医科大学的57个样本中心(GZMUCC),安徽医科大学第一附属医院(AHMUFH)47例。所有患者均于2002年9月至2009年12月入组。没有接受肝移植,消融,经动脉化疗栓塞术(TACE)或切除术前放疗。

 

学习规划

在这项研究中,有三个阶段来识别和确认E-HCC患者的复发相关的CpG。在发现阶段,使用芯片测定筛选,随后是两种算法选择显著的CpG。在训练阶段,使用Cox回归进一步缩小CpG。在验证阶段,在多中心样品中验证候选CpG(图1)。

图1:研究流程图。

为了使得能在临床上广泛应用,作者在训练和验证阶段中使用FFPE样品。将来自SYSUCC的281个E-HCC随机分成训练(140个样品)和内部验证(141个样品)组。为了验证发现,作者还对来自三个独立中心的295个样本进行了外部验证。此外,我们的发现在TCGA数据库中进行验证。

 

甲基化阵列

所有发现期样品都通过质量控制测试,并根据Illumina的说明使用Methylation 450K Beadchip进行分析。使用范围从0(未甲基化)至1(全甲基化)的β值对甲基化水平进行评分。甲基化微阵列数据可在Gene Expression Omnibus(GSE75041)获得。

 

处理微阵列数据

作者排除了含有单核苷酸多态性和位于性染色体上的探针。接下来分别使用K最近邻和Beta混合分位数扩张方法进行插补和归一化。随后使用每个组中的平均β的阈值为0.15用于过滤,其中基于假发现率的P值<0.01。

 在初次过滤之后,构建具有通过10倍交叉验证进行的罚分参数调整的最小绝对收缩和选择器操作(LASSO)算法,以选择候选CpG。同时,支持向量机-递归特征消除(SVM-RFE),也用于CpG选择。最后,我们将来自LASSO或SVM-RFE算法的CpG进行组合。


结果

患者特征

患者的特征在图2中给出。 576例E-HCC患者的中位随访时间为55.6个月(范围为8〜136个月)。在随访期间,52.6%的患者(576例中的303例)发生复发,38.9%的患者(576例中有224例)死亡。在303例复发患者中,38例(12.5%)接受了切除术,49例(16.2%)接受了消融,139例(45.9%)接受了TACE,77例(25.4%对于整个队列,1年和5年RFS率分别为78.8%和46.6%,1年和5年OS率分别为93.9%和66.6%。

图2:在四个队列中临床病理特征与无复发生存期的关联。

 

候选CpG的选择

使用在患者和方法部分中提及的主要排除标准,作者得出了2550个差异CpG的列表。接下来,使用两种不同的算法来选择最重要的CpG用于区分高风险和低风险复发患者。首先,使用LASSO算法鉴定出了一组30个CpG。然后,用SVM-RFE算法并选择一组30个CpG。

 

构建预测特征性标志物

在组合通过LASSO和SVM-RFE算法选择的CpG之后,鉴定了46个CpG,两个算法同时选择了14个CpG。使用46个CpG,作者将66个发现期样品分类为复发和非复发簇(图3C)。然后使用Cox回归模型进一步缩小训练队列中患有E-HCC(MSEH)的患者。结果,鉴定出三个CpG(cg20657849,cg19406367和cg19931348)。

图3:两种算法用于特征选择。 (A)LASSO和(B)SVM-RFE算法。

 

验证特征性标志物

为了证实MSEH的稳定性,在内部验证队列和两个外部验证队列中进行验证分析。对于内部验证队列,MSEH根据RFS成功将68名患者(48.2%)分入高危组,将73名(51.8%)患者分为低危组(HR,3.59; 95%CI,2.24- 5.75; P <0.001;图4B)。对于整个队列的576例患者,与低危患者相比,高危患者与早期复发相关(中位数为17.5个月,范围为1.5至117.6个月)(中位数为53.0个月,范围为1.8至128.2个月; P <0.001)。时间依赖性受试者工作特征曲线分析显示,与三种单一CpG相比,MSEH是更好的复发预测因子。

图4:MSEH预测复发的情况

 

此外,MSEH对于在2年内显示复发的患者(HR,2.14; 95%CI,1.58至2.83; P <0.001)以及显示2年以上复发的患者能维持其辨别能力(HR,3.39; 95%CI ,2.16至5.12; P <0.001)。低危和高危组的复发模式明显不同。对于低风险患者,在整个随访期间的风险持续低。相比之下,高危患者的风险在切除后急剧增加,达到1〜4年的峰值,之后迅速下降。

 

作者还评估了MSEH预测E-HCC患者OS的表现。 MSEH可以在所有四个队列中鉴别高风险患者(训练队列:HR,4.87; 95%CI,2.75至8.61; P <0.001;内部验证队列:HR,3.01; 95%CI,1.75至5.171 ; P = 0.001;外部验证群组1:HR,2.81; 95%CI,1.12-4.41; P <0.001;外部验证群组2:HR,2.91; 95%CI,1.48-5.71)。另外,在TCGA数据中也进一步验证MSEH的预测值。 MSEH在RFS和OS方面成功地将125名TNM I期患者分为高风险和低风险组(P <.001,P =0 .043)。

参考文献:

参考文献

Qiu et al. CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study. J Clin Oncol. 2017 Jan 9:JCO2016682153. [Epub ahead of print]

编辑:肿瘤资讯-小编