推荐活动

【Nature子刊】华西医院李为民团队:AI系统助力肺结节恶性肿瘤的风险评估

首页 » 《转》译 12小时前 转化医学网 赞(2)
分享: 
导读
在这项研究中,团队使用45,064例病例的体检队列,提出了一个分类驱动的中国肺结节报告和数据系统(C-Lung-RADS)。

2024年9月17日,四川大学附属华西医院李为民团队在期刊《Nature Medicine》上发表了题为“Data-driven risk stratification and precision management of pulmonary nodules detected on chest computed tomography”的研究论文。研究结果表明,该系统以精确的风险分层和量身定制的管理为基础,最大限度地减少了对低风险病例不必要的侵入性操作,并建议对极高风险结节进行及时干预,以避免诊断延误。这种方法有可能增强决策范式,并有助于在常规检查和筛查场景中更有效地诊断肺癌。


https://www.nature.com/articles/s41591-024-03211-3

研究介绍

 01 

肺结节是胸部影像学中最常检测到的异常之一,诊断的关键是区分临床上与肺癌相关的恶性结节和良性结节。尽管做出了许多努力,但肺癌仍然是死亡率较高的主要恶性肿瘤,全球经济负担最高,在中国的影响尤为严重。与诊断为晚期的患者相比,被诊断为早期疾病的个体,更有可能接受根治性治疗并体验到更好的预后。在中国,与高收入国家相比,早期肺癌检出率仍然存在差距(第一阶段:中国为17.3%,美国为25.3%)。


低剂量计算机断层扫描(LDCT)已被证实是肺癌筛查的有效工具。国家肺部筛查试验(NLST)和荷兰-鲁汶Longkanker筛查Onderzoek(NELSON)队列等关键研究表明,LDCT可显著降低肺癌死亡率。此外,中国的一项前瞻性多中心队列研究表明,一次性LDCT筛查,可将高危人群的肺癌死亡率降低31%。随着LDCT的广泛应用,肺结节的检出率逐渐提高。然而,至少95%的筛查肺结节是良性的,需要精确的管理策略,以确保适当的干预。


在这项研究中,团队提出了一个分类驱动的中国肺结节报告和数据系统(C-Lung-RADS),以基于大规模数据集,估计肺结节的恶性肿瘤风险。该系统在两个后续阶段运行,具有不同的任务。它通过在初始阶段自动获取结节大小和密度,来区分低、中、高和极高风险结节。此外,它还集成了成像、临床和随访数据等多模式功能,以识别恶性结节并优化风险量表。随后,C-Lung-RADS的性能,在通过移动CT获得的独立测试队列中得到验证,并进一步探索了精确管理策略的可及性。


研究设计概述。

研究进展

 02 

阶段2/2+模型性能评估


与单维信息相比,考虑多维信息的模型,取得了更好的性能。对于内部测试数据集,多维模型的AUC值高于单维模(AUC为0.881,95%CI 0.880-0.882),为0.918(95%CI 0.918-0.919),其敏感性从79.6%(95%CI 79.4-79.7%)大大提高到85.1%(95%CI 85.0-85.3%)。在独立测试数据集中,多维模型的性能优于单维模型,灵敏度从64.3%(95%CI 63.6-65.1%)绝对提高到85.6%(95%CI 85.1-86.1%),提高了21.3%。多维模型的AUC值为0.927(95%CI 0.926–0.928),优于单维模型(AUC为0.924,95%CI 0.923–0.926)。在独立测试数据集中还评估了多维信息的有效性,结果与内部测试数据集的结果一致。基于这些结果,团队开发了用于结节四类风险分层的整体C-Lung-RADS管道,它整合了第1阶段的分类树、第2阶段的DCNN模型和第2+阶段的梯度提升回归(GBR)模型,依次执行,以识别极高危结节和真正的恶性肿瘤。根据四类风险等级,团队还设计了相应的管理,以推荐个体化干预策略。


在第2阶段包含多维信息的GBR模型,用于识别恶性结节。


真实程序的估计性能


在内部测试数据集中,C-Lung-RADS和Lung-RADS v2022检测到的高危人群(风险等级3)的比例,分别为2.9%和1.4%,C-Lung-RADS和Lung-RADS v2022检测到的极高危人群(风险等级4)的比例,分别为19.3%和13.6%。在内部测试数据集中,C-Lung-RADS的敏感性为79.9%(95%CI 74.0-84.8%),显著高于Lung-RADS v2022观察到的60.3%(95%CI 53.5-66.7%)(P<0.001)。C-Lung-RADS的相应FPR为8.2%(95%CI 6.8-10.0%),而Lung-RADS v2022为5.1%(95%CI 3.9-6.5%)(P=0.003)。这些结果验证了C-Lung-RADS具有与临床诊断相当的风险分层性能,优于Lung-RADS v2022,表明C-Lung-RADS更适合中国人群肺结节的风险分层,真阳性值更高。


C-Lung-RADS和Lung-RADS v2022检测到的高危人群比例,分别为4.4%和1.3%,而这两种方法检测到的疑似恶性肿瘤(极高危)比例,分别为11.7%和8.5%。在独立测试数据集中,C-Lung-RADS的敏感性为87.1%(95%CI 80.5-91.7%),而Lung-RADS v2022为63.3%(95%CI 55.0-70.9%)(P<0.001),C-Lung-RADS的相关FPR为5.9%(95%CI 4.9-7.1%),而Lung-RADS v2022为4.4%(95%CI 3.5-5.4%)(P=0.035)。因此,C-Lung-RADS可能会显著提高敏感性,尽管FPR会增加。这些发现验证了C-Lung-RADS管道的良好泛化性,并表明其在更广泛的中国数据中的预期疗效。


对于标签2和3的患者,建议每半年和每季度进行一次随访。标签4结节被认为具有极高的风险,需要立即采取临床行动。根据检测的安全性、额外诊断的潜在信息量和患者偏好,团队仔细考虑了干预措施的选择,包括增强CT扫描、正电子发射断层扫描(PET)/CT成像、活检或外科手术。此外,DCNN的移动CT单元和类别激活图(CAM),分别增强了C-Lung-RADS的可访问性和可解释性。医生可以利用C-Lung-RADS的AI报告,来为他们的决策提供信息,从而最大限度地减少忽视或误判诊断的机会。这些探索证明了C-Lung-RADS的临床潜力。


C-Lung-RADS管道在肺结节恶性肿瘤风险分层和管理方面的性能。

研究结论

 03 

这项研究存在几个局限性。首先,该系统作为一种风险分层方法,将不可避免地产生假阴性。在初步评估阶段,绝大多数假阴性病例为惰性肺癌,但仍需探索纳入分子生物标志物等方法,以提高模型预测的准确性。其次,将现有的随访间隔分为3、6和12个月,对于筛查检测到的肺结节患者,需要探索更精确的干预方案。此外,该系统是基于中国西部的人口构建的,为了扩大模型的适用性,有必要推广到其他地区。未来,团队致力于C-Lung-RADS的持续迭代,以增强其性能并拓宽其应用范围。


C-Lung-RADS作为评估肺结节恶性肿瘤风险的多阶段方法,在优化医疗保健资源的同时,加强早期肺癌检测。团队进一步采用多模态数据融合,提高了极高危结节的诊断准确性。该方案为不同风险水平的肺结节患者,实施了标准化的监测或干预策略,从而防止了不必要的侵入性手术和诊断延误。C-Lung-RADS有望补充传统筛查方法,将推动肺癌管理范式的革命性转变。


参考资料:


1.Mazzone, P. J. & Lam, L. Evaluating the patient with a pulmonary nodule: a review. JAMA 327, 264–273 (2022).


2.Adams, S. J. et al. Lung cancer screening. Lancet 401, 390–408 (2023).

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发