首页 > 文章详情

柳叶刀子刊｜TAILORx 加持下的乳腺癌病理AI：能否用常规 H&E 切片替代部分 Oncotype DX 决策场景？

03月30日

编译：肿瘤资讯

来源：Lancet Oncol.

2026年3月11日，The Lancet Oncology在线发表了一项乳腺癌病理人工智能研究。该研究基于TAILORx试验数据，构建了一种融合常规HE病理图像与临床病理特征的多模态深度学习模型，用于估算HR阳性、HER2阴性早期乳腺癌患者的Oncotype DX 21基因复发评分，并在6个独立外部队列中完成验证。结果显示，该模型对高基因组风险疾病具有较好的判别能力，在TAILORx测试集中的AUC达到0.898，并在多队列中表现出稳定的泛化能力。这提示，病理AI有望为乳腺癌辅助治疗决策提供一种更具可及性的数字化风险评估路径，但其临床应用价值仍需进一步前瞻性验证。

乳腺癌辅助治疗决策，仍需更可及的风险分层工具

对于HR阳性、HER2阴性早期乳腺癌患者而言，辅助治疗决策的关键难点之一，在于识别真正能够从化疗中获益的人群。近年来，多基因表达检测显著推动了这一领域的发展。其中，Oncotype DX已成为当前临床中应用广泛、且具有随机试验数据支持的重要风险分层工具之一，可为部分患者是否接受辅助化疗提供参考。但论文同时指出，基因检测在成本、样本流转和检测条件等方面仍存在现实门槛，这也限制了其在部分医疗资源有限地区的可及性。在这一背景下，利用常规HE病理切片结合人工智能技术，建立一种低成本、易推广的风险评估方法，成为值得关注的研究方向。此前虽已有研究尝试基于HE切片预测基因组风险，但多停留在概念验证层面，缺乏基于高质量随机对照试验数据的系统评估。此次研究的重要意义，正是在TAILORx这一关键临床试验框架下，对病理AI模型的风险分层能力及其与化疗获益相关的预测潜力进行了回顾性验证。

基于TAILORx构建多模态模型，并完成多中心外部验证

研究共纳入包括TAILORx在内的7个独立队列，分析对象均为HR阳性、HER2阴性的浸润性乳腺癌患者。研究者在TAILORx质量控制后获得8284例患者数据，并将其划分为训练集和测试集；此外，还纳入来自以色列、美国和澳大利亚的6个独立外部验证队列，共5497例患者，以评估模型的泛化能力。模型并非单纯依赖病理图像，而是采用了多模态策略，将全视野HE数字切片特征与临床病理信息共同纳入，用于预测连续性的AI recurrence score，并参考TAILORx中的风险分界进行低、高风险分层。

在TAILORx测试集中，AI recurrence score与Oncotype DX复发评分呈较强相关，相关系数为0.728。以识别高基因组风险疾病，即复发评分≥26为目标时，模型的AUC达到0.898，显著优于仅使用临床病理变量或仅使用图像特征的模型。进一步分析显示，在低风险阈值16下，模型识别高基因组风险患者的灵敏度为0.948，阴性预测值为0.982；在高风险阈值26下，模型识别高基因组风险患者的特异度为0.959，阳性预测值为0.716。整体来看，该模型对于高基因组风险疾病具有较好的判别能力。

图1 TAILORx测试集中AI recurrence score与Oncotype DX复发评分的一致性及高风险识别能力

AI评分与Oncotype DX复发评分高度相关，高风险识别能力较强

在预后评估方面，研究显示，以26为阈值进行风险分层时，AI评分所得到的生存曲线与Oncotype DX复发评分分层结果整体接近。尤其在无远处复发生存期和无复发生存期等复发相关终点上，AI分层表现出较好的区分能力。论文报告，AI高低风险分层对应的HR在无远处复发生存期为2.88，在无复发生存期为2.61，而无病生存期的区分趋势相对较弱。研究还提示，AI评分与Oncotype DX并非完全重复：在Oncotype DX评分低于26的患者中，被AI进一步上调为高风险者，其复发相关结局更差；而在Oncotype DX评分不低于26的患者中，被AI下调为低风险者，则呈现出更好的生存趋势，但差异未达到统计学显著。上述结果提示，病理AI可能为传统基因检测提供额外的风险分层信息。

该研究另一项值得关注的内容，是对化疗获益相关信号的探索。不过，这部分结果需要特别注意其证据边界。由于TAILORx的随机化仅发生在特定Oncotype DX评分区间患者中，研究者并非直接在AI高低风险组中完成随机对照比较，而是基于AI与Oncotype DX分层不一致病例的比例进行了模拟分析。结果显示，在模拟分析中，经AI判定为高风险的绝经前患者仍表现出化疗获益信号，而经AI判定为低风险的绝经后患者则未见明确化疗获益。另一个具有临床启发意义的发现是，在传统临床风险评估为高风险的绝经后患者中，有31.3%被AI重新归类为低风险，且这一人群未观察到明显化疗获益。这提示，病理AI在部分患者中的确可能提供超出传统临床病理标准的再分层信息，但现阶段更适合表述为“支持其辅助决策潜力”，而非“已经证实可以替代现有工具指导化疗”。

图2 病理AI模型对传统临床风险分层的重分类作用

在6个独立外部验证队列中，经校准后的AI recurrence score与Oncotype DX复发评分同样保持较强相关，识别高基因组风险患者的AUC范围为0.858至0.903，显示出较好的跨中心泛化能力。研究还对不同淋巴结状态患者进行了分析，结果显示，模型在淋巴结阳性患者和淋巴结阴性患者中的高风险判别能力相近，提示模型捕捉到的生物学信号在不同淋巴结状态下具有较一致的判别能力。

图3 AI风险分层与Oncotype DX风险分层在关键生存终点中的预后表现

从“相关性验证”走向“临床应用”，仍需前瞻性研究补上最后一环

总体而言，这项研究的意义并不在于证明病理AI已经可以直接替代基因检测，而在于首次基于大型随机对照试验数据，对病理AI模型的风险分层能力及其与化疗获益相关的预测潜力进行了较为系统的回顾性验证。其结果提示，病理AI有望成为HR阳性、HER2阴性早期乳腺癌风险评估的重要补充工具，并在特定场景下，为基因检测可及性受限时提供数字化替代思路。与此同时，作者也明确指出，这仍是一项回顾性模型开发与验证研究，化疗获益相关分析依赖模拟，未来仍需前瞻性和随机化研究进一步建立其临床效用。

参考文献

Shamai G, Cohen S, Binenbaum Y, et al. Deep learning on histopathological images to predict breast cancer recurrence risk and chemotherapy benefit: a multicentre, model development and validation study. Lancet Oncol. Published online March 11, 2026. doi:10.1016/S1470-2045(25)00727-2.

责任编辑：肿瘤资讯-Kelly
排版编辑：肿瘤资讯-Hanna

04月01日

武亚东

首都医科大学附属北京友谊医院 | 肿瘤外科

好好学习天天向上