您好,欢迎您

【智能肿瘤学】人工智能检测结直肠癌微卫星不稳定性——临床初筛工具的多中心分析

2022年05月09日
编译:裴裴
来源:肿瘤资讯

近日发表在ESMO Open上的一篇题为Artificial intelligence for detection of microsatellite instability in colorectal cancer-a multicentric analysis of a pre-screening tool for clinical application的文章,发布了研究者利用人工智能技术作为一种初筛工具直接从病理切片识别结直肠癌微卫星不稳定的方法

微信截图_20220509203425.png

研究背景

微卫星不稳定性(MSI)是结直肠癌(CRC)中关键的生物标志物。一般通过聚合酶链反应(PCR)或二代测序的方法检测临床样本MSI。错配修复缺陷(dMMR)是MSI的同义词,其通过免疫组织化学(IHC)检测,并显示出与MSI的高度一致性。MSI/dMMR[与之相反的是微卫星稳定性(MSS)或无错配修复(pMMR)]是决定患者术后是否应接受辅助化疗的因素之一。指南规定每例结直肠癌(CRC)患者都应进行检测。人工智能(AI)方法可以直接在常规病理切片中检测MSI/dMMR,但目前尚缺乏通过预设测试阈值对测试性能进行系统研究。本研究收集了9组大肠癌手术标本和1组大肠癌内镜活检标本,对此进行了系统研究。

 

研究队列

收集了9个队列,共8343例结直肠癌患者的H&E组织切片,分别来自Darmkrebs:Chancen der Verhu-tung durch Screening(DACHS)、荷兰队列研究(NLCS)、曼海姆大学医学中心(UMM)等不同中心的研究队列。在各个中心对病理切片进行分散扫描。

 

实验设计

采用了在交叉验证中排除1个队列的这种新方法,以评估9个队列中每个队列基于AI的MSI/dMMR检测的可靠性。先训练出一个神经网络,用于检测9个队列中的8个队列所有患者的MSI/dMMR状态,并在第9个队列中的患者进行测试。每个队列只被用作1个测试队列。因此,研究者训练出了9个不同的深层神经网络(用于外部验证),并训练了额外的网络用于内部交叉验证,从而确保MSI/dMMR检测可用于每个患者。通过这种方式,分析和比较9种不同外部验证集中基于深度学习(DL)的MSI/dMMR的检测性能。

 

研究结果

深度学习系统检测MSI/dMMR效果稳健

研究者采用了“排除1个研究队列”的新方法(图1B),DL系统可从CRC的H&E组织切片(图1A)中检测MSI/dMMR状态。MSI/dMMR状态可以通过组织学切片来确定,效果良好:9个队列中有八个达到患者水平AUROC>0.85(表1)。在YCR-BCIP队列中,MSI\/dMMR检测AUROC为0.96。只有MECC队列的结果较低,AUROC为0.74。在外部验证队列中的表现与内部验证效果相当,说明在多中心环境中训练分类器具有稳定性(表1)

1.png

图1.研究概况

表1.所有队列中MSI检测网络的外部验证结果

2.png


根据队列特异性阈值排除患者

对于每个数据集,从模型预测中得出队列特异性阈值,该阈值灵敏度设置为95%,从而最小化FN预测分数。在此阈值下,所有队列的阴性预测值均>93%(表1),这表明了人工智能系统作为预筛查工具的潜力。真阴性分数或排除分数(多少患者可以安全排除在验证性试验之外)的范围从MECC的12.6%到YCR-BCIP的78.8%,而“FN分数”始终<0.3%(表1,图2)。

3.png

图2.筛选工具的测试统计数据


分类预定义阈值的性能

使用固定阈值替代队列特异阈值对患者进行MSI/dMMR分类。使用最低阈值(0.25),2128(25.5%)例患者被正确分类为MSS/pMMR,而只有22例患者(0.26%)被错误分类为MSS\/pMMR(假阴性),即可将25.5%的患者排除在后续进一步分子检测之外,而如果在最终金标准测试(图2B)之前将其用作筛选测试,则仅遗漏0.26%的患者,不需要使用针对特定队列定制的固定阈值。回顾DL分类器生成的空间检测图(图3),进一步分析高分类性能的原因,在MSS/pMMR肿瘤中,分类器在大多数病例中均匀检测肿瘤组织和相邻非肿瘤组织为MSS/pMMR,而在大约一半的分析病例中,检测到肿瘤浸润边缘为MSI/dMMR,这可能是由于肿瘤邻近的淋巴细胞影响所致(图3A)。在真正的MSI/dMMR肿瘤中,肿瘤组织通常被检测为MSI/dMMR(图3B)。

4.png图3.代表性的苏木精红(H&E)组织切片


学习阈值提高分类性能

队列特异性阈值会导致过度拟合,固定的阈值可能导致性能不佳,因此在训练队列中建立额外“学习阈值”。将其应用于每个测试队列,9个队列的学习阈值的平均值为0.29,为所有队列的最佳阈值


活检样本的诊断性能

在约克郡地区1530例结直肠癌患者的内镜活检中使用该系统发现,尽管该系统经过手术切除样本训练,但其AUROC高达0.89。用队列特异性阈值评估MSS\/pMMR患者,44.12%的患者可以正确识别为MSS\/pMMR。0.25的固定阈值在外科标本中始终实现了良好的分类能力,使用DL系统在外科样本中诊断性能优于活检样本


总结

本项研究基于DL的MSI/dMMR检测在多中心的独立研究队列中进行了测试量化,为未来基于AI的技术改进和诊断程序中的系统评估提供了定量基准



责任编辑:肿瘤资讯-Bree
排版编辑:肿瘤资讯-Bree

相关阅读
评论
2022年05月09日
刘杰
丹东市第一医院 | 肿瘤内科
研究者利用人工智能技术作为一种初筛工具直接从病理切片识别结直肠癌微卫星不稳定的方法。
2022年05月09日
杨雪
西安医学院附属宝鸡医院 | 放疗科
本项研究基于DL的MSI/dMMR检测在多中心的独立研究队列中进行了测试量化,为未来基于AI的技术改进和诊断程序中的系统评估提供了定量基准。
2022年05月09日
赵艳秋
沈丘县人民医院 | 肿瘤内科
在外部验证队列中的表现与内部验证效果相当,说明在多中心环境中训练分类器具有稳定性(表1)