您好,欢迎您

【中国好声音】吴一龙教授团队 | ctDNA检测全景图:从生物学本质到AI驱动的技术变革

06月18日
整理:肿瘤资讯
来源:肿瘤资讯

肺癌仍然是全球癌症相关发病率和死亡率的主要原因之一。有效的癌症管理需要进行超越初始表征的纵向分子监测,因为肿瘤生物学在治疗压力下会发生动态变化。循环肿瘤DNA(ctDNA)是血浆中游离DNA(cfDNA)的肿瘤来源部分,它提供了一种微创方法,可以实时评估肿瘤负荷、分子残留病灶、治疗反应和克隆演变。这使得更动态的管理策略成为可能。ctDNA分析具有巨大的临床应用前景,然而其应用受到生物学因素和方法学难题的限制。ctDNA水平低、背景干扰和样本处理不一致都会影响其灵敏度和特异性,从而限制了其应用范围。近日广东省人民医院吴一龙教授团队发表了最新综述,为ctDNA临床应用提供了参考。【肿瘤资讯】整理精华内容。


1.png

图1 循环肿瘤 DNA (ctDNA) 生物学和分析概述

ctDNA的生物学基础

cfDNA和ctDNA的起源

在早期疾病中,ctDNA通常占循环总DNA的不到1%,但在晚期恶性肿瘤中可能上升至百分之几甚至更高。肺癌患者的血浆总cfDNA浓度通常高于健康个体。晚期非小细胞肺癌(NSCLC)患者的中位cfDNA水平通常约为10-30 ng/mL,而健康对照组约为1-10 ng/mL。ctDNA的释放量在不同实体瘤中差异很大,肺癌通常表现出中等至高度的释放。在肺癌中,基线ctDNA的检出率在鳞状细胞癌(约60-80%)和小细胞肺癌(70-90%)中通常高于腺癌(30-50%)。

既往研究数据表明,ctDNA的来源不仅仅是被动凋亡和坏死,肿瘤的存在和大小并不必然导致可测量的全身性ctDNA释放。这意味着还有其他生物学机制控制着肿瘤来源的DNA如何进入(或未能进入)血液循环。目前有几种关于ctDNA主动释放机制的假说,但细胞外囊泡(EV)相关DNA仍然是实验证据最充分的机制。

2.png

图2 ctDNA的释放和清除途径

信号丰度和异质性


信号丰度决定了ctDNA检测的生物学极限,并为确定检测限(LOD)提供了定量基础。在晚期或转移性疾病中,ctDNA的比例通常达到1%或更高,相当于在标准的10-20 mL血液样本中检测到数千个突变基因组当量。相反,早期肿瘤和治疗后ctDNA中的变异等位基因频率(VAF)通常低于0.1%。此外,整个血浆体积中肿瘤来源的DNA片段总数可能仅为几十个分子。在这种情况下,ctDNA的检测本质上受限于采样。一次标准的血液样本仅能捕获cfDNA总量中很小且随机的一部分。因此,当突变分子极其罕见时,阴性结果可能仅仅反映了分析样本中肿瘤来源片段的随机缺失。除了绝对分子数量低之外,ctDNA 还具有快速的生物周转率,其血浆半衰期估计约为 30 分钟至 2 小时。ctDNA 水平代表肿瘤释放和系统清除之间的动态平衡,而非累积肿瘤负荷的直接反映。因此,即使肿瘤脱落、治疗引起的细胞毒性或清除动力学的细微变化也会迅速改变测得的 VAF 值。一些研究支持这一动力学模型,实验性地调节 cfDNA 清除率可以影响循环 ctDNA 的回收率。

ctDNA检测平台和分析策略

基于PCR的方法采用等位基因特异性扩增结合荧光检测,对血浆中极低VAF的预定义变异进行定量。主要平台包括qPCR、ARMS-PCR和COLD-PCR、数字PCR、液滴数字PCR和BEAMing。qPCR通常能检测到VAF约为0.1%–1%的突变,而数字PCR将DNA分成数千个反应,能够检测到VAF约为0.1%的突变,在优化的ddPCR模式下,甚至可以检测到VAF低至0.003%的突变。这使得其在快速监测复发热点突变和耐药相关变异方面具有理想的临床应用价值。

基于NGS的ctDNA分析能够对多个位点的肿瘤来源基因组和表观基因组改变进行高通量并行分析,从而将液体活检扩展至多维肿瘤分析。现有策略包括固定靶向panel、用于微小残留病(MRD)监测的个性化多突变检测、全基因组或全外显子组测序、无需肿瘤组织参考的表观基因组或片段组学方法(例如cfMeDIP-seq)以及用于融合基因检测的DNA+RNA血浆联合检测。临床上,杂交捕获panel适用于初始分子分层和耐药性分析。相比之下,基于肿瘤信息和全基因组测序(WGS)的个性化MRD检测方法在根治性治疗后具有更高的灵敏度,通常可在影像学进展前数月检测到复发。

人工智能(AI)液体活检分析中的新兴作用与未来趋势

从测序深度到测序广度:全基因组突变整合

传统方法依赖于对有限目标集(如常见驱动基因)进行超深度测序,从根本上受到血浆样本中cfDNA片段数量的限制。为克服这一局限性,MRDetect 和 MRD-EDGE 开创了一种广度换深度的策略——利用WGS整合数千个患者特异性突变,以牺牲单个位点的测序深度为代价,换取全基因组覆盖率。通过整合全基因组信号,并采用基于AI的单个测序读段过滤技术来区分真正的肿瘤来源片段和技术伪影,可以实现低至 10⁻⁶ 的检测限——比传统方法提高了 1000 倍。该策略有效地绕过了 cfDNA 输入量的限制,无需匹配的肿瘤组织即可实现超灵敏的MRD监测和治疗反应追踪。

多模态融合:互补信号实现稳健检测

除了突变整合之外,AI还实现了多种正交cfDNA信号的融合,从而增强了检测的稳健性。比如Fate-AI不依赖单一数据类型,而是将片段组学与甲基化谱或拷贝数变异(CNA)相结合。这种多模态方法利用了癌症相关异常在多个分子层面均有体现这一事实,使AI模型能够捕获互补信号。

从特征工程→端到端学习:Transformer 和 LLM 架构

第三个趋势是从手动设计的统计特征转向AI直接从原始测序数据中学习模式的方法(端到端表征学习)。例如,EMIT采用了一种BERT风格的Transformer模型,在多种癌症类型中实现了0.895-0.996的AUROC值。DECIDIA将Transformer自回归语言模型与注意力机制相结合,该机制能够自动识别并加权信息量最大的测序读段,无需比对或甲基化定量即可处理原始的亚硫酸氢盐测序读段。iLLMAC在末端基序谱上微调LLaMA-7B模型,并将其转换为用于分类的自然语言语。这些端到端方法消除了繁琐的预处理步骤,减少了累积误差,并展现出卓越的跨癌症泛化能力。

读取级错误抑制:在单分子水平上区分信号和噪声

在低肿瘤比例的情况下(例如微小残留病灶检测或早期癌症),一个关键挑战是特定突变可能仅存在于整个血浆样本中的单个DNA片段上。在这种情况下,噪声不仅来自文库构建和测序过程中引入的技术误差,还来自与肿瘤无关的生物学混杂因素。传统的变异检测方法依赖于位点水平的统计数据,但当覆盖度较低时,这些方法无法有效发挥作用。为解决这一问题,cfTrack采用随机森林模型进行读段级错误抑制,整合片段长度和序列上下文特征,在单个读段对水平上区分真实变异和测序伪影。这种以读段为中心的策略即使只有单个支持读段也能实现灵敏的检测。类似地,Fragle通过直接从片段长度密度分布中学习,完全绕过了突变检测的瓶颈,避免了变异检出阶段的错误累积。GALYFRE利用片段末端位置及其周围核苷酸频率来识别异常片段,通过富集肿瘤来源的信号来间接抑制噪声。在靶向测序的背景下,MetaCH整合了自监督的变异和基因嵌入,以区分克隆性造血和肿瘤来源的突变,从而作为有效的检出后错误过滤器。

以上四大技术趋势——广度与深度相结合的突变整合、多模态信号融合、端到端表征学习和读段级错误抑制——标志着从特征级检测到表征级推理的范式转变。

3.png

图3 AI驱动的 ctDNA 分析进展的关键维度

结语

尽管ctDNA分析技术取得了显著进步——从分析前标准化到分子误差抑制——但MRD检测的临床敏感性仍然受限于生物信号的丰度和维持特异性所需的统计阈值。未来基于ctDNA的监测进展可能更多地依赖于整合和解读微弱且异质的分子信号,而不是进一步降低分析检测限。AI方法通过整合不同模式下的相关分子证据,并减轻超低输入环境下与采样相关的变异性,可以提高复发风险估计的准确性。

参考文献

Zhang JT, Lin BX, Zhao XG, Zhong WZ, Wu YL. Circulating tumor DNA analysis in lung cancer: from molecular origins to analytical boundaries. Lung Cancer. 2026 Jul;217:109473. doi: 10.1016/j.lungcan.2026.109473. Epub 2026 May 29. PMID: 42217421.

责任编辑:肿瘤资讯-Yuno
排版编辑:肿瘤资讯-Yuno

版权声明
本文专供医学专业人士参考,未经著作人许可,不可出版发行。同时,欢迎个人转发分享,其他任何媒体、网站如需转载或引用本网版权所有内容,须获得授权,且在醒目位置处注明"转自:良医汇-肿瘤医生APP"。