您好,欢迎您

前沿分享 | Nature Communications:AI模型剖析循环孤儿非编码RNA助力早期肺癌的精准检测

03月09日

来源:智能肿瘤学

引言

肺癌作为全球致死率较高的癌症之一,早期诊断对提高患者生存率至关重要。然而,传统的诊断方法往往依赖影像学检查或组织活检,存在一定的侵入性和局限性。在Nature Communications上发表的一篇题为“Deep generative AI models analyzing circulating orphan non-coding RNAs enable detection of early-stage lung cancer”的文章提出了利用变分自编码器的生成能力学习血液生物标志物的稳健且可推广的特征,通过分析血清样本中的孤儿非编码RNA(oncRNA),开发了名为Orion的多任务生成式AI模型,旨在提高肺癌检测的性能和泛化能力。


研究背景

非编码 RNA 在细胞内有多种功能,oncRNA 是因癌症特异性基因组重编程产生的非编码 RNA,在肿瘤发生、发展中作用关键,部分具有促转移等功能。肺癌早期,部分 oncRNA 表达异常,可作为潜在生物标志物,但从复杂数据中筛选相关 oncRNA 颇具挑战。


研究对象和数据特征



研究对象

1050名非小细胞肺癌(NSCLC)患者及性别、年龄和BMI匹配的对照个体的血清样本中的oncRNA。



数据来源

使用来自癌症基因组图谱(TCGA)的公开small RNA测序(smRNA-seq)数据识别NSCLC特异性oncRNA,并构建了包含1050个样本的内部数据集,样本来自两个供应商,涵盖不同疾病阶段和组织学亚型,其中NSCLC患者419例,无癌症史者631例。


图1  基于oncRNA的液体活检平台和Orion架构


研究方法

文章中的方法是利用深度生成型AI模型对非编码RNA进行分析。生成型AI是一类能够从数据中学习潜在分布并生成新数据的算法。作者构建了一个基于深度学习的生成模型,通过该模型学习从肺癌患者和健康个体的非编码RNA表达数据中提取潜在特征。

数据预处理:用 bclconvert、cutadapt 等多种工具处理原始测序文件,对 oncRNA 数据标准化和去噪。

AI模型训练:研究者使用深度生成型AI模型对处理后的数据进行训练。通过该模型,AI能够识别出循环非编码RNA中的潜在生物标志物。

早期癌症检测:AI模型根据循环oncRNA的表达模式,判断是否存在早期肺癌的迹象。


结果与讨论



肺癌检测性能

Orion模型在训练数据集上的ROC曲线下面积(AUC)达到0.97(95%CI:0.96-0.98),在90%特异性下总体灵敏度为94%(95%CI:91%-96%),Ⅰ期肺癌灵敏度为90%(95%CI:83%-94%),较小肿瘤(<2 cm)灵敏度为87%(95%CI:74%-94%)。在验证集上也表现出良好的一致性和较高的特异性,优于支持向量机(SVM)、ElasticNet、XGBoost等常用方法。例如,在相同条件下,SVM分类器的AUC为0.87(95%CI:0.84-0.89),总体灵敏度为61%(95%CI:55%-66%)。


图2  模型在训练集和验证集上的性能




肿瘤亚型识别

对于NSCLC中腺癌和鳞状细胞癌两种主要亚型的区分,在后期肿瘤(Ⅲ/Ⅳ期)中,Orion模型的AUC为0.75(95%CI:0.67-0.83),在70%特异性下灵敏度为71%(95%CI:56%-84%)。


图3  Orion 模型对肿瘤亚型的识别能力




模型优势分析

通过消融实验表明,三元组边际损失可减少技术变异影响,生成式采样有助于提高性能和损失收敛。与PCA和Harmony等方法相比,Orion模型能更好地捕捉癌症相关生物学变异性,在不同测序深度和样本稀释实验中表现出稳定性和鲁棒性。例如,在样本稀释实验中,Orion能耐受高达40%的稀释而不影响灵敏度,而其他方法则表现不佳。


图4  Orion组件的消融实验


研究亮点

新型生物标志物:本研究首次将深度生成型AI应用于循环oncRNA的分析,并发现了多个潜在的肺癌早期标志物。

非侵入性诊断:与传统的组织活检相比,基于血液的非编码RNA分析具有显著的优势,提供了一种非侵入性、低成本的早期癌症筛查方法。

AI技术的创新应用:深度生成型AI模型能够自动从复杂的生物数据中提取有用信息,展现了AI在医学研究中的巨大潜力,尤其是在癌症早期诊断中的应用前景。


参考文献

Karimzadeh, M., Momen-Roknabadi, A., Cavazos, T.B. et al. Deep generative AI models analyzing circulating orphan non-coding RNAs enable detection of early-stage lung cancer. Nat Commun 15, 10090 (2024). https://doi.org/10.1038/s41467-024-53851-9

责任编辑:肿瘤资讯-DLF
排版编辑:肿瘤资讯-Z  Y

版权声明

本文仅供专业人士参看,文中内容仅代表智能肿瘤学立场与观点,不代表肿瘤资讯平台意见,且肿瘤资讯并不承担任何连带责任。若有任何侵权问题,请联系删除。

评论
03月10日
马坊
漳州市医院 | 大肠外科
RNA助力早期肺癌的精准检测
03月10日
侯宪民
阳谷县人民医院 | 肿瘤内科
期待学习更多知识
03月09日
武亚东
首都医科大学附属北京友谊医院 | 肿瘤外科
好好学习天天向上