您好,欢迎您

前沿分享 | 癌症突变与核质穿梭:深度学习模型pSAM的分析与发现

04月13日

来源:智能肿瘤学

近日,中山大学Ze-Xian Liu教授团队提出了一种名为pSAM的深度学习模型,用于研究癌症突变如何通过改变蛋白质的核质穿梭来推动肿瘤发生。研究收集了11种癌症类型的突变数据,发现核定位信号(NLS)/核输出信号(NES)区域的突变频率更高且更具危害性。pSAM模型通过结合卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)和注意力机制,准确预测蛋白质核定位并识别关键序列决定因素。研究确定了6.7%的NLS区域突变可能影响蛋白质定位,涉及的蛋白质与多个肿瘤发生相关的信号通路有关联。实验验证了多个核质穿梭攻击突变(SAMs)确实破坏了蛋白质的NLS,影响其功能。该研究为理解蛋白质核质穿梭在癌症中的作用及开发治疗靶点提供了新见解(研究概览见图1)。

11.jpg

图1  研究概览

(A. 数据收集及pSAM模型流程概览;B. TCGA中11种肿瘤靶向肽区和其他区的突变频率分布;C. TCGA中11种癌症类型靶向肽区和其他区域的突变的有害评分分布;D-E. BACH2的NLS区域突变影响其转录底物CLIP1和TXNRD1在TCGA-UCEC队列中的表达)

研究背景

基因变异可以通过驱动异常亚细胞定位来影响蛋白质功能。尽管已有研究探讨了蛋白质核质穿梭对肿瘤进展的影响,但缺乏对癌症突变如何通过影响核定位来促进肿瘤发生的全面分析。本研究通过开发深度学习模型pSAM,系统地表征了癌症中潜在的SAMs,并探讨了其在肿瘤发生中的作用。

研究方法

1.数据收集与预处理:收集了来自癌症基因组图谱(TCGA)的11种癌症类型的癌症突变数据,并整合了多个数据库(如UniProt、SeqNLS、ValidNESs和NESbase)来注释蛋白质中的实验验证NLSs和NESs;
2.模型构建:构建了一个名为pSAM的深度学习模型,基于CNN、BiLSTM和注意力机制,用于预测蛋白质的核定位概率,并通过残差水平贡献分析(RCA)来识别核定位的关键序列决定因素(DNLs)(pSAM流程图见图2);

12.jpg

图2  pSAM模型流程图

3.突变影响分析:比较了已知错义突变在DNLs和其他区域的发生率,并通过模拟突变来评估突变对核定位的影响;
4.功能验证:通过免疫荧光染色、西方印迹和共免疫沉淀等实验方法,验证了选定的SAMs对蛋白质核定位和功能的影响。

研究结果与结论

1.突变富集与危害性:发现NLS/NES靶向肽段区域的突变频率显著更高,且这些突变更具危害性,可能通过破坏蛋白质的核质穿梭来影响其功能;
2.模型性能:pSAM模型在预测蛋白质核定位方面表现出色,优于现有工具(见图3),且能够准确识别关键的核定位序列决定因素(DNLs),这些DNLs与已知的NLSs/NESs高度一致;

13.jpg

图3  对于1000个随机蛋白pSAM和现有工具的预测性比较

3.SAMs的鉴定与影响:确定了约6.7%的NLS区域突变可能影响蛋白质核定位(见图4),这些突变涉及的蛋白质功能群包括酶、转录因子和癌症相关蛋白,且与多个肿瘤发生相关的信号通路富集;

14.jpg

图4  NLS区域可能影响蛋白质核定位的SAMs百分比

4.实验验证:通过实验验证了多个SAMs(如PTEN R14M、CHFR P255L等)确实破坏了蛋白质的核定位信号,影响了其肿瘤抑制功能,并调控了下游信号通路。

本研究通过构建深度学习模型pSAM,系统地识别了癌症中改变蛋白质核质穿梭的突变,揭示了这些突变在肿瘤发生中的重要作用。研究结果不仅增进了对蛋白质核质穿梭及其在癌症中失调机制的理解,还为癌症治疗提供了潜在的靶点和生物标志物。未来可进一步探索SAMs在不同癌症类型中的具体作用机制,并开发针对这些突变的治疗方法。

推动放射学AI转化的云技术创新

  1. 开发了创新的深度学习模型pSAM,能够在无先验知识的情况下预测蛋白质核定位及其关键序列决定因素。

  2. 系统地分析了癌症突变对蛋白质核质穿梭的影响,填补了该领域的研究空白。

  3. 通过实验验证了预测结果的准确性,为模型的应用提供了有力支持。

  4. 构建了iNuLoC数据库和预测工具,方便研究人员使用和进一步研究蛋白质核定位。 

责任编辑:肿瘤资讯-DLF
排版编辑:肿瘤资讯-Z  Y

版权声明

本文仅供专业人士参看,文中内容仅代表智能肿瘤学立场与观点,不代表肿瘤资讯平台意见,且肿瘤资讯并不承担任何连带责任。若有任何侵权问题,请联系删除。

评论
04月14日
苗军程
金乡县人民医院 | 肿瘤内科
癌症突变与核质穿梭:深度学习模型pSAM的分析与发现