梁敏, 赵世俊, 周丽娜, 等. 胸片的肺结节检出和诊断效能及阅片者一致性研究[J]. 中华肿瘤杂志, 2023, 45(3):265-272.
DOI: 10.3760/cma.j.cn112152-20220304-00150.
目的
探讨胸片对于≤30 mm肺结节的检出和诊断效能及其影响因素,比较阅片者间的一致性。
方法
回顾性选取2012—2014年于中国医学科学院肿瘤医院就诊、同期具有胸部CT和X线胸片检查的无症状肺结节患者(43例),全组患者胸部CT影像均可见1枚≤30 mm的结节(全组共43枚结节)。1名有>20年阅片经验的主任医师复阅CT图像,对结节的大小、形态、位置、密度进行记录。6名具有不同年资(住院医师、主治医师和副主任医师)的影像诊断医师复阅胸片,记录其阅片时间、结节检出情况及诊断意见。比较胸片检出结节与未检出结节的CT影像特征,分析影响胸片结节检出的因素。计算6名医师的检出敏感度以及诊断正确率,比较阅片者间一致性水平,分析阅片时间、阅片经验对于诊断结果的影响。
结果
43枚结节中6名医师均检出的结节有17枚,检出敏感度为39.5%。≥5名、≥4名、≥3名、≥2名、≥1名医师检出的结节数分别为20、21、23、25、28枚,检出敏感度分别为46.5%、48.8%、53.5%、58.1%和65.1%。胸片呈假阴性的原因包括结节的大小、位置、密度及形态。6名医师对于≤30 mm、≤20 mm、≤15 mm、≤10 mm结节的检出敏感度依次为46.5%~58.1%、45.9%~54.1%、36.0%~44.0%、36.4%;诊断正确率依次为19.0%~85.0%、16.7%~6.5%、18.2%~80.0%、0~75.0%。6名医师对于结节检出的一致性较好(Kappa值:0.629~0.907),性质判断的一致性一般或较差(Kappa值:0.350~0.653)。年资越高的医师所需的阅片时间越短,阅片时间、阅片经验与诊断正确率无关(均P>0.05)。
结论
胸片对于≤30 mm肺结节的检出能力有限,性质判断能力不足,且阅片时间的延长、阅片者年资的增长均不会提高诊断正确率,不宜单独用于肺癌的诊断。
【关键词】肺肿瘤;胸片;CT;检出敏感性;诊断;阅片者一致性
肺癌是全球范围内死亡例数最高、发病例数仅次于乳腺癌的恶性肿瘤,我国肺癌死亡人数占全球肺癌死亡总人数的40%。国内外已有多项研究证实,应用X线胸片进行筛查的肺结节检出率低,Ⅰ期肺癌漏诊率高,不能降低肺癌死亡率,低剂量CT是目前唯一被证明可以有效降低肺癌死亡率的筛查手段。然而,基于我国人口基数大、卫生资源有限、各地医疗水平不均衡等国情,在实际临床实践中,完全采用CT替代胸片仍有很长的路要走。胸片具有价格低、操作简单、存储方便等不可忽视的优点,对肺癌具有一定的诊断价值,目前在我国仍有相对较广泛的应用。胸部X线片对于肺癌尤其是无症状早期肺癌的检出及诊断能力如何,哪些因素会影响胸片上肺结节的检出与性质判断,本研究基于以上问题,探讨X线胸片对于≤30 mm肺结节的检出和诊断效能及其可能的影响因素,并比较不同年资影像诊断医师的一致性水平。
1.临床资料:
回顾性收集2012—2014年在中国医学科学院肿瘤医院就诊、同期具有胸部CT和X线胸片检查(检查间隔时间<1个月)的无症状早期肺癌患者(43例)的影像学资料,全组患者的胸部CT影像均可见1枚≤30 mm的结节[结节大小=(横轴位长径+垂直短径)/2],所有患者均通过手术或支气管镜活检或CT引导下肺穿刺活检获得明确病理结果。
2.图像采集:
X线胸片检查采用数字化X线摄影(digital radiography, DR)技术拍摄正侧位胸片。CT检查采用64排多层螺旋CT扫描机(扫描仪包括GE LightSpeed VCT、GE Discovery CT750 HD及GE Optima CT660),扫描范围从肺尖到肺底部,患者仰卧位,双手上举过头,一次憋气完成扫描。胸部低剂量CT扫描条件:使用恒定电流(管电流30 mAs,管电压120 kVp)或自动毫安秒设置(噪声指数40,管电流范围30~250 mAs);机架转速为0.5 s/转;螺距为0.984。胸部常规剂量平扫CT和增强CT扫描条件:管电压120 kVp;自动毫安秒设置(噪声指数13,管电流200~350 mAs);机架转速为0.5 s/转;螺距为0.984。增强CT扫描使用非离子型碘对比剂(碘浓度为300 mg/ml),注射剂量为80~90 ml,注射速率为2.5 ml/s,静脉注射35 s后开始采集图像。重建算法使用标准算法,图像常规层厚5 mm,重建间隔5 mm;薄层层厚1.25 mm,重建间隔0.8 mm。DR与CT图像资料传入图像存储与传输系统(picture archiving and communication systems, PACS)内存档。
3.图像复阅与数据收集:
收集放射科信息系统(radiology information system, RIS)中患者X线胸片及胸部CT的检查时间及诊断结果。在未被告知RIS中X线、CT诊断结果和患者临床病理信息的前提下,由1名具有20年以上胸部肿瘤影像阅片经验的主任医师复阅胸部CT图像,对结节的大小、形态、位置、密度进行记录;由2名住院医师(医师1、2)、2名主治医师(医师3、4)、2名副主任医师(医师5、6)独立复阅X线胸片图像,医师1、2、3、4、5、6的阅片经验依次为3、4、6、8、10、13年,分别记录其阅片时间(s)、结节检出情况(检出、未检出)及诊断意见(恶性可能性大、不能定性、良性可能性大)。以病理诊断结果为金标准,将胸片最终诊断结果记录为未检出、诊断错误、不能定性、诊断正确。
4.统计学方法:
使用SPSS 25.0软件进行统计学分析。呈正态分布的计量资料采用±s表示,两组间比较采用独立样本t检验,多组间比较采用方差分析;非正态分布的计量资料以中位数表示,组间比较采用Mann-Whitney U检验。计数资料的组间比较采用χ2检验或Fisher精确概率法。采用Kappa检验两两比较6名医师对于结节检出及性质判断的一致性水平,采用单因素方差分析比较不同年资医师平均阅片时间的差异及不同诊断结果所需阅片时间的差异。检验水准α=0.05。
一、患者资料与胸片结节检出情况
43例患者(共43枚肺结节),肺结节大小为4~28 mm,中位大小为15 mm;良性病变7例(1例为非典型腺瘤样增生),肺癌36例[Ⅰ期肺癌占比86.1%(31/36)]。
复阅胸片时,43枚结节中,6名医师均检出的结节有17枚(检出敏感度39.5%),≥5名、≥4名、≥3名、≥2名、≥1名医师检出的结节数分别为20、21、23、25、28枚,检出敏感度分别为46.5%、48.8%、53.5%、58.1%和65.1%。将全组43例患者分为胸片真阳性组(n=28)和胸片假阳性组(n=15),胸片真阳性组患者的年龄为(58.3±10.5)岁,胸片假阳性组患者的年龄为(58.5±7.7)岁,差异无统计学意义(t=-0.07,P=0.944)。全组患者的临床病理特征见表1。
15例患者胸片检查先于CT,28例患者胸片检查后于CT,实际就诊时胸片报告中的结节检出数分别为12和20枚,共32枚,而本研究复阅结节检出数为28枚,5枚RIS胸片报告中检出的结节在复阅时未被检出,其中4例CT检查时间先于胸片,已知结节位置后在胸片上检出;另外1例胸片检查时间先于CT,RIS中结节在侧位胸片上被检出,但复阅时6名医师均漏诊。RIS胸片报告中漏诊的1枚结节在复阅时被医师3检出。
二、影响结节检出的因素
1.结节的大小:
胸片真阳性与胸片假阴性组间的肺结节大小(中位大小分别为16和14 mm)差异无统计学意义(Z=1.81, P=0.070)。胸片上检出的最小部分实性结节大小为12 mm,实性结节为8 mm(图1),未检出的最大部分实性结节大小为26 mm,实性结节为17 mm(图2)。胸片上检出的非实性结节大小为13 mm(图1),未检出的非实性结节大小为5 mm(本研究中仅有2枚非实性结节)。6名医师对于≤30 mm、≤20 mm、≤15 mm、≤10 mm结节的检出率均逐渐下降(表2)。
2.结节的位置:
肺结节所在位置情况见表3。7枚结节位于双肺下叶背段,5枚未被检出(漏诊率71.4%),其中4枚为实性结节(大小为4~17 mm),1枚为部分实性结节,大小约23 mm,其内实性成分呈散在小斑片状。另有6枚结节因在胸片上与胸部正常解剖结构重叠而未被检出,2枚双肺上叶纵隔旁的部分实性结节正位胸片上被肺门影、纵隔影遮挡,侧位胸片上被纵隔影遮挡;1枚右肺上叶后段实性结节胸片上与肋骨重叠且呈条形高密度影;2枚右肺胸膜下实性小结节大小均为6 mm,结节较小且胸片上与肋骨重叠;1枚左肺上叶尖后段实性结节,胸片上与主动脉弓重叠。
3.亚实性结节的密度与形态:
1枚大小为5 mm的非实性结节因较小,且密度浅淡,胸片上与正常肺组织密度差异小导致漏诊;3枚部分实性结节其内实性成分较少或呈不规则小斑片状,胸片上未能显示明确结节样形态而被漏诊。
三、X线胸片肺结节检出与诊断效能及阅片者间一致性
1.检出效能:
对于≤30 mm的肺结节,与CT结果比较,医师1~6的检出敏感度依次为46.5%、51.2%、58.1%、53.5%、53.5%、48.8%;对于≤20 mm、≤15 mm、≤10 mm的结节,6名医师的检出敏感度逐渐下降。
2.诊断效能:
对于被检出的≤30 mm的结节,与病理结果比较,医师1~6的诊断正确率依次为85.0%、50.0%、68.0%、60.9%、69.6%、19.0%;对于≤20 mm、≤15 mm、≤10 mm的结节,医师2与医师5诊断正确率逐渐下降,其余4名医师诊断正确率不稳定。
3.阅片者间一致性:
6名医师结节检出情况分别两两比较的Kappa值为0.629~0.907,诊断结果分别两两比较的Kappa值为0.350~0.653(表4)。
四、阅片时间对诊断结果的影响
住院医师、主治医师、副主任医师的平均阅片时间分别为116.9、71.8和49.1 s,差异具有统计学意义(F=40.45,P<0.001)。三种级别的医师(住院、主治、副主任医师)作出4种不同诊断(未检出、诊断错误、不能定性、诊断正确)所需的阅片时间均无统计学差异(P值分别为0.150、0.481、0.124;图3)。
肺癌起病隐匿,60%的肺癌确诊时已为中晚期,我国肺癌患者5年生存率<20%,而早期肺癌患者的5年生存率可达70%以上,故早发现、早诊断、早治疗是降低肺癌死亡率的有效手段。目前<40岁人群的常规体检大多仍使用胸部X线片,此外,在我国一些经济欠发达、居民整体受教育程度较低的地区,胸片筛查肺癌也仍在广泛应用。明确胸片的结节检出及诊断效能并分析其影响因素,有助于我们在实践中采取相应措施促使更多的肺癌被早期发现。
本研究中,6名医师均漏诊的结节有15枚[假阴性率为34.9%(15/43)],进一步分析假阴性的原因,我们发现,大小是结节能否在胸片上被检出的影响因素之一。6名医师对于≤30 mm、≤20 mm、≤15 mm、≤10 mm结节的检出敏感度依次为46.5%~58.1%、45.9%~54.1%、36.0%~44.0%、36.4%,表明结节越小,漏诊率越高。既往有研究曾评估了胸片对于5~15 mm大小的肺亚实性结节的检出能力,结果表明,胸片检出5~9 mm肺亚实性结节的假阴性率为74.1%~85.2%,检出10~15 mm肺亚实性结节的假阴性率为41.7%~66.7%。Wu等曾评估胸片对于5.4~15 mm实性肺结节的检测能力,4名阅片者对于5.4~15 mm、5.4~8 mm结节的检出率分别为41.7%和26.2%,本研究中6名阅片者对于≤15 mm结节的检出敏感度与该结果相当。另外,我们的结果显示结节大小在胸片真阳性组与假阴性组间无显著差异,这可能受到了样本量较少的影响。除大小以外,影响结节在胸片上被检出的因素还包括结节位置、密度及形态。通常情况下,位于肺野中、外带肋间隙的结节容易被发现,部分密度相对较高的非实性结节或含有少量实性成分的部分实性结节也可被检出,但位于肺尖、脊柱旁、肺门周围、纵隔影及心影重叠区的结节,即使为相对较大的实性结节,也极有可能被忽视,特别是位于双肺下叶背段靠近脊柱、纵隔的结节,正位胸片上被纵隔影、肺门影遮挡,侧位胸片上与脊柱影重叠,极易被漏诊,本研究中双肺下叶背段结节的漏诊率为71.4%(5/7)。对于部分实性结节,其内实性成分的大小及形态也会影响其在X线胸片上能否被检出,本研究中6名医师均未检出的部分实性结节共有6枚,其中3枚内部实性成分较少或呈不规则小斑片状,胸片上未能显示明确结节样形态而被漏诊。
阅片人数对于结节检出也有所影响,本研究中,由1名、2名、3名、4名、5名医师共同做出诊断的检出敏感度依次为46.5%、48.8%、53.5%、58.1%、65.1%,表明阅片者人数越多,结节被发现的可能性越大。在实际工作中,影像诊断报告通常由2名医师先后阅读并作出诊断,本研究中多名医师诊断的情况几乎无法实现,这提示我们或许可以借助计算机辅助诊断(computer aided diagnosis, CAD)系统的帮助。有研究者比较了4名住院医师与4名主治医师在胸片上对于4~20 mm大小的346枚肺结节的检出能力,结果显示,主治医师的检出能力优于住院医师(灵敏度分别为74.1%和62.3%,P=0.006),但这一差异可以在应用CAD后被消除,证明CAD可以为影像科医师提供有效的帮助。另有研究比较了3名影像科医师与CAD在胸片上对于66枚5~15 mm肺结节的检出敏感度,结果显示,医师检出的敏感度为18.2%~30.3%,CAD检出的敏感度为39.4%,CAD敏感度虽高但其假阳性率也高,故研究者认为CAD可以辅助影像科医师发现肺结节,但需影像科医师根据经验排除假阳性结果。近年来,随着基于人工智能CAD工具的开发和成熟,在其辅助下检出肺结节的假阳性率也显著降低。有学者比较了4种深度学习算法对于100张胸部X线片的肺结节检出效能,结果显示,结节检出敏感度最高可达85.1%,准确度最高为83%。另外,本研究中有4枚结节在复阅时被6名医师均漏诊,但在实际就诊时因已知结节位置而被检出,表明其在胸片上虽有显示但很难被发现,CAD或许可以帮助检出这类结节。
本研究中6名医师在胸片上检出肺结节的一致性较好,说明阅片经验对于结节的检出无显著影响。于2014年发表的一项研究有相似的结论,5名影像科医师使用3种显示器对40例T1aN0M0期肺癌患者的胸片和60例阴性胸片进行复阅,结果显示,使用高清医用显示器时,低年资医师与高年资医师对于T1a期肺癌结节(无论部分实性或实性结节)的检出能力无明显差异。本研究中2名住院医师的阅片经验分别为3、4年,这也从另一方面提示我们,在影像科经过3年住院医师规范化培训的诊断科医师,可能已具备了较好的结节检出能力,基本上能胜任基层或社区医院在胸片上检出结节的工作。
胸片对于结节性质判断的能力有限,本研究中,与病理结果比较,6名医师对于≤30 mm、≤20 mm、≤15mm、≤10mm被检出结节的诊断正确率依次为19.0%~85.0%、16.7%~76.5%、18.2%~80.0%、0~75.0%,6名医师两两比较的诊断一致性一般或较差。高年资医师的诊断正确率并不优于住院医师及主治医师,甚至其中1名高年资医师的正确率远低于其他医师,究其原因,我们发现其诊断意见中"不能定性"的构成比最高,这可能是由于高年资医师过往的经验与教训使其更加了解X线胸片图像所能"捕捉"到的影像信息有限,故其在给出诊断意见时,更倾向于不能定性,从而建议患者进一步行CT检查以明确病变性质。此外,本研究中年资越高的医师所需的阅片时间越短,这可能是由于经验增长会提高阅片者鉴别病变与非病变的能力,进而减少其阅片时的"纠结"时间。但进一步分析各年资医师阅片时间与诊断结果的关系,我们发现,并非"诊断正确"所花费的阅片时间最长。这表明阅片经验的增加及阅片时间的延长并不能有效提高阅片者在胸片上的结节检出能力及诊断水平,且我们认为,这与影像医师本身的专业能力无关,主要是由于胸片作为重叠影像,难以提供足够的影像学细节以帮助病变正确诊断。
总之,胸部X线片对于肺内≤30 mm结节的检出敏感度有限,阅片者间一致性较好,且增加阅片者人数有助于降低漏诊率。在未来临床实践中,或许可以联合CAD来提高胸片病变检出的能力。另一方面,胸片对于结节的性质判断能力不足,阅片时间的延长、阅片经验的增长均不会提高阅片者的诊断正确率,故不宜单独用于肺癌的诊断。这提示我们,在胸片上发现异常病变,即使非结节、非肿块样形态,也应建议行胸部CT检查以进一步明确性质。
免责声明本文仅供专业人士参看,文中内容仅代表中华肿瘤杂志立场与观点,不代表肿瘤资讯平台意见,且肿瘤资讯并不承担任何连带责任。若有任何侵权问题,请联系删除。
排版编辑:肿瘤资讯-Kate