用户登录转化医学是什么？

【Nature子刊】华西医院李为民团队：AI系统助力肺结节恶性肿瘤的风险评估

首页 » 《转》译 2024-09-19 转化医学网赞(2)

导读	在这项研究中，团队使用45,064例病例的体检队列，提出了一个分类驱动的中国肺结节报告和数据系统（C-Lung-RADS）。

2024年9月17日，四川大学附属华西医院李为民团队在期刊《Nature Medicine》上发表了题为“Data-driven risk stratification and precision management of pulmonary nodules detected on chest computed tomography”的研究论文。研究结果表明，该系统以精确的风险分层和量身定制的管理为基础，最大限度地减少了对低风险病例不必要的侵入性操作，并建议对极高风险结节进行及时干预，以避免诊断延误。这种方法有可能增强决策范式，并有助于在常规检查和筛查场景中更有效地诊断肺癌。

https://www.nature.com/articles/s41591-024-03211-3

研究介绍

肺结节是胸部影像学中最常检测到的异常之一，诊断的关键是区分临床上与肺癌相关的恶性结节和良性结节。尽管做出了许多努力，但肺癌仍然是死亡率较高的主要恶性肿瘤，全球经济负担最高，在中国的影响尤为严重。与诊断为晚期的患者相比，被诊断为早期疾病的个体，更有可能接受根治性治疗并体验到更好的预后。在中国，与高收入国家相比，早期肺癌检出率仍然存在差距（第一阶段：中国为17.3%，美国为25.3%）。

低剂量计算机断层扫描（LDCT）已被证实是肺癌筛查的有效工具。国家肺部筛查试验（NLST）和荷兰-鲁汶Longkanker筛查Onderzoek（NELSON）队列等关键研究表明，LDCT可显著降低肺癌死亡率。此外，中国的一项前瞻性多中心队列研究表明，一次性LDCT筛查，可将高危人群的肺癌死亡率降低31%。随着LDCT的广泛应用，肺结节的检出率逐渐提高。然而，至少95%的筛查肺结节是良性的，需要精确的管理策略，以确保适当的干预。

在这项研究中，团队提出了一个分类驱动的中国肺结节报告和数据系统（C-Lung-RADS），以基于大规模数据集，估计肺结节的恶性肿瘤风险。该系统在两个后续阶段运行，具有不同的任务。它通过在初始阶段自动获取结节大小和密度，来区分低、中、高和极高风险结节。此外，它还集成了成像、临床和随访数据等多模式功能，以识别恶性结节并优化风险量表。随后，C-Lung-RADS的性能，在通过移动CT获得的独立测试队列中得到验证，并进一步探索了精确管理策略的可及性。

研究设计概述。

研究进展

阶段2/2+模型性能评估

与单维信息相比，考虑多维信息的模型，取得了更好的性能。对于内部测试数据集，多维模型的AUC值高于单维模（AUC为0.881，95%CI 0.880-0.882），为0.918（95%CI 0.918-0.919），其敏感性从79.6%（95%CI 79.4-79.7%）大大提高到85.1%（95%CI 85.0-85.3%）。在独立测试数据集中，多维模型的性能优于单维模型，灵敏度从64.3%（95%CI 63.6-65.1%）绝对提高到85.6%（95%CI 85.1-86.1%），提高了21.3%。多维模型的AUC值为0.927（95%CI 0.926–0.928），优于单维模型（AUC为0.924，95%CI 0.923–0.926）。在独立测试数据集中还评估了多维信息的有效性，结果与内部测试数据集的结果一致。基于这些结果，团队开发了用于结节四类风险分层的整体C-Lung-RADS管道，它整合了第1阶段的分类树、第2阶段的DCNN模型和第2+阶段的梯度提升回归（GBR）模型，依次执行，以识别极高危结节和真正的恶性肿瘤。根据四类风险等级，团队还设计了相应的管理，以推荐个体化干预策略。

在第2阶段包含多维信息的GBR模型，用于识别恶性结节。

真实程序的估计性能

在内部测试数据集中，C-Lung-RADS和Lung-RADS v2022检测到的高危人群（风险等级3）的比例，分别为2.9%和1.4%，C-Lung-RADS和Lung-RADS v2022检测到的极高危人群（风险等级4）的比例，分别为19.3%和13.6%。在内部测试数据集中，C-Lung-RADS的敏感性为79.9%（95%CI 74.0-84.8%），显著高于Lung-RADS v2022观察到的60.3%（95%CI 53.5-66.7%）（P<0.001）。C-Lung-RADS的相应FPR为8.2%（95%CI 6.8-10.0%），而Lung-RADS v2022为5.1%（95%CI 3.9-6.5%）（P=0.003）。这些结果验证了C-Lung-RADS具有与临床诊断相当的风险分层性能，优于Lung-RADS v2022，表明C-Lung-RADS更适合中国人群肺结节的风险分层，真阳性值更高。

C-Lung-RADS和Lung-RADS v2022检测到的高危人群比例，分别为4.4%和1.3%，而这两种方法检测到的疑似恶性肿瘤（极高危）比例，分别为11.7%和8.5%。在独立测试数据集中，C-Lung-RADS的敏感性为87.1%（95%CI 80.5-91.7%），而Lung-RADS v2022为63.3%（95%CI 55.0-70.9%）（P<0.001），C-Lung-RADS的相关FPR为5.9%（95%CI 4.9-7.1%），而Lung-RADS v2022为4.4%（95%CI 3.5-5.4%）（P=0.035）。因此，C-Lung-RADS可能会显著提高敏感性，尽管FPR会增加。这些发现验证了C-Lung-RADS管道的良好泛化性，并表明其在更广泛的中国数据中的预期疗效。

对于标签2和3的患者，建议每半年和每季度进行一次随访。标签4结节被认为具有极高的风险，需要立即采取临床行动。根据检测的安全性、额外诊断的潜在信息量和患者偏好，团队仔细考虑了干预措施的选择，包括增强CT扫描、正电子发射断层扫描（PET）/CT成像、活检或外科手术。此外，DCNN的移动CT单元和类别激活图（CAM），分别增强了C-Lung-RADS的可访问性和可解释性。医生可以利用C-Lung-RADS的AI报告，来为他们的决策提供信息，从而最大限度地减少忽视或误判诊断的机会。这些探索证明了C-Lung-RADS的临床潜力。

C-Lung-RADS管道在肺结节恶性肿瘤风险分层和管理方面的性能。

研究结论

这项研究存在几个局限性。首先，该系统作为一种风险分层方法，将不可避免地产生假阴性。在初步评估阶段，绝大多数假阴性病例为惰性肺癌，但仍需探索纳入分子生物标志物等方法，以提高模型预测的准确性。其次，将现有的随访间隔分为3、6和12个月，对于筛查检测到的肺结节患者，需要探索更精确的干预方案。此外，该系统是基于中国西部的人口构建的，为了扩大模型的适用性，有必要推广到其他地区。未来，团队致力于C-Lung-RADS的持续迭代，以增强其性能并拓宽其应用范围。

C-Lung-RADS作为评估肺结节恶性肿瘤风险的多阶段方法，在优化医疗保健资源的同时，加强早期肺癌检测。团队进一步采用多模态数据融合，提高了极高危结节的诊断准确性。该方案为不同风险水平的肺结节患者，实施了标准化的监测或干预策略，从而防止了不必要的侵入性手术和诊断延误。C-Lung-RADS有望补充传统筛查方法，将推动肺癌管理范式的革命性转变。

参考资料：

1.Mazzone, P. J. & Lam, L. Evaluating the patient with a pulmonary nodule: a review. JAMA 327, 264–273 (2022).

2.Adams, S. J. et al. Lung cancer screening. Lancet 401, 390–408 (2023).