您好,欢迎您

【中国好声音】【Nature】移植后严重急性移植物抗宿主病的动态预测模型

2022年04月14日
编译:肿瘤资讯
来源:肿瘤资讯

移植后严重急性移植物抗宿主病(aGVHD)的现有预测模型,由于受到不均匀数据采样的影响,大多难以实现对风险的精准提示。为探索更优化的预测方法,近期中国医学科学院血液病医院(中国医学科学院血液学研究所)信息与资源中心首席技术专家陈俊仁、干细胞移植中心主任姜尔烈和儿童血液病诊疗中心主任竺晓凡团队联合发表在《自然·计算科学》(Nature Computational Science)上题为Dynamic forecasting of severe acute graft-versus-host disease after transplantation的研究,基于大样本的动态数据建立了daGOAT算法该算法适用于时间序列较短、事件生成机制平滑、多维、数据丢失频繁且不规则的情境,有望为aGVHD的预测及更多临床实践中未满足的预测需求提供全新方案。

2.JPG

研究背景

异源造血干细胞移植(allo-HSCT)是许多血液疾病依赖的最后治疗手段。然而,术后100天内移植相关的死亡率高达30%。严重(III-IV级)急性移植物抗宿主病(aGVHD)是异源造血干细胞移植后死亡的重要原因,为尽可能预防aGVHD的发生,学界提出了多种预测算法及模型。

既往预测严重aGVHD的算法通常基于围移植期的特征(包括受体、供体和移植程序参数)或特定时间点的生物标志物分析(如移植后的血浆生物标志物分析)。现有预测模型的接受者操作特征曲线下面积(AUROC)值大多不够理想:基于围移植期特征的模型AUROC值仅有0.62左右;基于肿瘤发生因子2(ST2)、再生胰岛衍生因子3α(Reg3α)的MAGIC评分可以预测6个月的非复发死亡率,但AUROC值也只有0.68。此外,MAGIC评分所预测的非复发死亡率并不等同于严重的aGVHD,根据MAGIC评分区别的“高风险”和“低风险”患者,在发生aGVHD的比例上并无具有统计学意义的分别。

针对allo-HSCT的建模面临样本量小、特征维数高和数据采样不一致等多重挑战。既往鲜有研究使用所有可用患者信息的时间序列来预测严重的aGVHD。近期有一项研究对患者移植后10天内持续记录的生命体征(体温、心率等)作了logistic回归统计,用以预测II-IV级aGVHD,该回归模型的AUROC值达到0.66。因此,本研究尝试收集和整理更多患者移植后的多维时间序列数据,以建立更佳的预测模型。

研究方法

研究纳入的患者均在2012年至2021年期间接受移植,所使用的干细胞均来自中国医学科学院培养的外周血和(或)骨髓,所有数据构成“aGVHD发病预测天津数据集”(aGOAT数据集)。daGOAT数据集包含584例成人和45例儿童,其中16%的成年人群和24%的儿童群体患有严重的aGVHD。在成年人群中,严重aGVHD病例和其他病人在总体存活率上有很大差异。aGOAT数据集的成人队列包含194个动态变量,儿童队列包含159个动态变量。并非所有患者都测量了全部动态变量;15种围移植期变量也被包含在了aGOAT数据集中。基于aGOAT数据集,该研究整合了多维时间序列数据来计算严重aGVHD的风险,并与现存的预测模型进行了比较。

 1.png

图1 aGOAT数据集基本特征

研究结果

在成人队列中,67例患者在6-8天的血浆生物标志物数据可用。对于6个月的NRM和严重的aGVHD, MAGIC评分的AUROC分别为0.86和0.49,Ann Arbor评分的AUROC分别为0.59和0.50。儿科队列的生物标志物数据太少,无法用于检测生物标志物模型。

为评估daGOAT模型与现有PeriHSCT-NB、PeriHSCT-RF和XGBoost模型的优劣,本研究将2020年12月1日前接受移植的患者指定为训练集,其余患者指定为测试集。然后对训练集进行内部验证,并对测试集进行拒绝验证。结果显示,成人队列发病的Q1(第25百分位)、Q2(中位)和Q3(第75百分位)时间点分别是第24、29和39天。在内部验证(n = 519)中,daGOAT的精度-召回曲线下面积(AUPRC)的峰值均值为0.42,优于其他所有模型;AUROC峰值均值达到0.78。在第23天,daGOAT的AUPRC和AUROC分别达到0.82和0.94的峰值,优于其他所有模型。此外值得注意的是,PeriHSCT模型在移植后的前两周优于daGOAT模型。



2.png

3.png

图2 比较daGOAT模型与现有三种模型(成人队列)

在儿童队列中,疾病发病的Q1、Q2和Q3时间点分别为第15、17和21天。在内部验证中(n = 39), daGOAT的AUPRC峰值均值为0.75,优于所有其他模型;AUROC峰值均值为0.87,与AUPRC趋势一致。在拒绝验证(n = 6)中,daGOAT模型的AUPRC和AUROC值在第10天达到1.00,远优于XGBoost和PeriHSCT模型。然而需要注意的是,在儿童病例中,XGBoost的AUPRC和AUROC值在时间上比daGOAT更稳定。

 4.png



5.png

图3 比较daGOAT模型与现有三种模型(儿童队列)

该研究还评估了个体动态特征对aGVHD预测模型的差异贡献。如果从第1天到第100天该特征被完全忽略,则该特征在给定时间点的重要性分数被认为是该时间点AUPRC的下降值。结果发现许多动态特征的重要性分数随时间的变化是平稳的。使用daGOAT模型进行消融实验,去除其平滑分量并测试模型的截断版本,结果显示没有平滑处理的daGOAT模型在成人和儿科队列中均表现更差。因此,8-30天内所有动态特征被按照重要性得分进行排序,纳入模型。

6.png

图4 成人及儿童队列个体动态特征

特征重要性和数据密度之间的Spearman秩相关系数在成人和儿童队列中分别为0.51和0.72。虽然数据密度对动态特征的排名有明显的影响,但也有一些排名靠前的特征具有较低的数据密度,这一点在成人队列中更加显著。最终构建的daGOAT模型预测严重aGVHD的能力依赖于利用这些多维数据。

此外,尽管本研究的重点是预测HSCT后的疾病,但该模型也被测试用于推广到其他多变量时间序列动态事件预测的情景。例如,daGOAT是否能够利用腰部安装的智能手机惯性传感器数据,预测人类的姿势变化。基于包含30名受试者、涵盖561个特征的时间序列数据,daGOAT模型同样体现了其预测价值,AUPRC和AUROC峰值分别为0.29和0.73,优于Naïve Bayes、Random Forest和XGBoost三种现有模型。

研究讨论

移植后严重急性移植物抗宿主病(aGVHD)的预测是一个具有挑战性的问题,它受到不均匀数据采样的影响,通常在统计时呈现出“大p小n”的结果。为解决这一问题,该研究提出了一种动态概率算法daGOAT。这种算法适应了采样的异质性,整合了多维临床数据,并在两周移动窗口内持续更新严重aGVHD发病的每日风险评分。

该研究纳入的受试者在接受移植后,daGOAT交互验证模型的曲线下面积(AUROC)稳步上升,并在成人和儿童队列均达到≥0.78的峰值,优于基于两种生物标志物的MAGIC评分、基于两种生物标志物的Ann Arbor评分、基于围移植期功能的各类模型,以及XGBoost。模拟实验表明,daGOAT算法适用于时间序列较短、事件生成机制平滑、多维、数据丢失频繁且不规则的情境。因此,daGOAT有望实现更广泛的用途,通过对远程不同指标的性能检测来进行评估,即基于智能手机惯性传感器的时间序列数据,预测人类机体即将发生的动态变化。

当然,目前的模拟实验和智能手机数据分析远未涵盖所有可能的现实场景,如需理解daGOAT在严重aGVHD预测中的相对优势,以及其更广阔的潜在机制,还需要进一步探索人工智能及“不稳定的数据”在现实世界医疗环境中的应用。机器学习研究时常受到样本容量较小的阻碍,不进行单一变量选择的daGOAT或为这种困境提供了可行的解决方案。

鉴于这项研究的数据局限于中国的一个血液中心,因此还需要其他医院作进一步验证。如需实现daGOAT模型在临床中的真正应用,还应开展前瞻性试验,评估daGOAT模型预测的严重aGVHD高风险移植患者,在接受预防性治疗后能否降低移植后的早期死亡。


参考文献

Liu, X., Cao, Y., Guo, Y. et al. Dynamic forecasting of severe acute graft-versus-host disease after transplantation. Nat Comput Sci 2, 153–159 (2022). https://doi.org/10.1038/s43588-022-00213-4



责任编辑:肿瘤资讯
排版编辑:肿瘤资讯



相关阅读
评论
2022年04月15日
小胡
余姚市人民医院 | 肿瘤内科
好好学习天天向上
2022年04月14日
张歌
广东祈福医院 | 肿瘤内科
移植后严重急性移植物抗宿主病(aGVHD)的预测是一个具有挑战性的问题
2022年04月14日
刘阳
费县人民医院 | 胸部肿瘤科
感谢分享,获益良多!