推荐活动

【Nature子刊】西湖大学郭天南团队:利用蛋白质组学与机器学习技术预测II期和III期结肠癌患者的总生存期

首页 » 《转》译 2024-08-16 转化医学网 赞(2)
分享: 
导读
本文将深入探讨如何利用蛋白质组学数据和机器学习算法来预测II期和III期结肠癌患者的总生存期,以及其在临床应用中的潜力和挑战。

2024年8月13日,西湖大学医学院郭天南团队在期刊《Cell Discovery》上发表了题为“Prediction of overall survival in stage II and III colon cancer through machine learning of rapidly-acquired proteomics”的研究论文。本研究的目的是开发一个可理解的分类模型,以基于蛋白质组学的数据,预测II-III CC患者的长期生存期,并在外部验证数据集中验证其普遍性。


https://www.nature.com/articles/s41421-024-00707-7#ethics

研究介绍

 01 

被诊断为肿瘤淋巴结转移(TNM)II期和III期结肠癌 (CC)的患者,占所有CC病例的2/3以上。pT4病变(病理上肿瘤已生长到内脏腹膜表面或附着在其他器官或结构上)和12个淋巴结,以及生物标志物CDX2、SMAD4、BRAF和KRAS的状态,是影响医生选择辅助治疗的重要因素。对于具有II期高危临床特征的患者和III期CC患者,通常建议接受辅助化疗。然而,辅助治疗对所有III期患者的普遍适用性,以及其他II期患者的复发风险,仍存在争议。此外,现有危险因素不能准确预测总生存期(OS)和其他预后结果,这需要可靠的预后标志物或模型,来预测个体II-III CC 患者的预后。这些工具可以为高危患者提供更有针对性的治疗方法,并防止对预后较好的患者进行过度治疗。


在本研究中,团队招募了CC患者(II 期-III 期),他们都接受了根治性手术并接受了随访。在进行任何辅助治疗之前,团队使用压力循环技术(PCT)和数据非依赖性采集(DIA)质谱(MS)对福尔马林固定石蜡包埋组织(FFPE)手术标本,进行了蛋白质组学分析。利用机器学习算法,团队建立了一个新颖实用的分类模型,用于预测结合蛋白质组学和临床特征的CC患者预后,并在独立验证队列中,得到了进一步验证。

研究进展

 02 

从浙江大学第二附属医院(SAHZU)招募患者230例作为培训队列,从西京医院(XJH)招募58例患者进行外部验证。所有患者均随访超过5年。团队收集了患者的年龄、性别、病变位置、病理类型、分期、微卫星不稳定性(MSI)状态的信息,并采用逐步特征选择方法结合临床特征,构建了临床预后模型。使用PCT-DIA MS在蛋白质组学分析中,鉴定和定量了8,187个蛋白质组和6,256个蛋白质,具有高再生产率。在使用重采样训练集进行1,000次LASSO回归复制后,这些蛋白(筛选出9种蛋白,包括PDP1、ALR、ENOG、NPC2、FYCO1、STXB1、ARH40、RIMC1、MTMR5)的选择时间超过50%。


团队评估了该蛋白质组学模型的性能,以及将9种蛋白质与临床特征(病变位置、病理类型、分期、MSI 状态)相结合的模型,以预测II-III CC期患者的5年生存率。在训练队列中,团队将受试者工作特征曲线下面积(AUC)值从0.707(临床模型)和0.872(蛋白质组学模型)提高到0.926(蛋白质组学 + 临床模型)。在验证队列中,在包含临床和蛋白质组学数据的模型中,AUC值分别从临床模型的0.786和蛋白质组学模型的0.789提高到0.872。此外,模型结合临床和蛋白质组学数据的敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、总体准确性和F1评分均升高。团队整合临床和蛋白质组学数据的模型,显示出有希望的预后潜力。训练集的5年OS率为95%和39%(P < 0.0001),验证集的5年OS率为93%和53%(P = 0.0013)。关于辅助化疗的使用,风险分层是平衡的(P > 0.05),这不能有效预测5年随访中的OS。

模型研究和性能的示意图。


在9种蛋白中,存活超过5年的患者中,有8个蛋白下调,在CC中生存不利,而只有MTMR5上调,在CC中有利于生存。癌症基因组图谱(TCGA)中ENOG的mRNA表达,表现出相似的结果,进一步发现NPC2在MSI高CC患者中处于不利地位。PDP1、ALR、ENOG 和 NPC2与CC进展有关。由于线粒体功能障碍,PDP1激活可能在直肠癌中诱导放射抵抗。ALR作为一种抗凋亡和抗转移因子,促进细胞存活,参与肠道癌前病变。ENOG通过上皮-间充质转化,促进CC转移,并被认为在BRAFV600E突变CC的进展中,起关键作用。NPC2作为细胞内胆固醇转运蛋白发挥作用,被发现有助于CC的预后和转移。FYCO1、STXB1和ARH40参与其他肿瘤,但尚未在CC中报告。以往的研究没有将MTMR5和RIMC1与肿瘤联系起来,这表明团队的蛋白质组学方法,在挖掘与肿瘤相关的隐藏必需蛋白质方面具有潜力。

研究结论

 03 

一些研究已经开发出新的方法来改善TNM分期系统的预后,例如基于6-microRNA的分类器,用于预测II期CC患者的CC复发,以及I-III期CC的共识免疫评分分类。将MSI状态、BRAFV600E和KRAS突变状态与TNM分期相结合,提高了II期和III期CC个体患者准确预测预后的能力。此外,据报道,与苏木精和伊红染色切片的数字扫描相关的深度学习,可用于II-III期CC的预后分组。然而,这些方法的结果仍然不够令人满意,无法在临床实践中广泛采用。


总之,团队开发了一种新型临床和基于9种蛋白质的模型,来预测II期和III期CC患者的预后,并在外部队列中进行了验证。模型将通过对II期和III期CC患者进行分层,来帮助临床决策。高风险患者可以接受更积极的治疗和随访,而低风险患者可以接受相对低水平的辅助治疗。考虑到本研究的局限性,例如验证队列的样本量小,该模型需要在其他独立队列中进行更多的验证和校准。团队正在进行一项临床试验,以前瞻性地测试该模型,旨在改善预后并帮助合理随访、制定时间表和风险适应性个体化治疗。


参考资料:


1.Puccini, A., Berger, M. D., Zhang, W. & Lenz, H. J. Target. Oncol. 12, 265–275 (2017).


2.Kannarkatt, J., Joseph, J., Kurniali, P. C., Al-Janadi, A. & Hrinczenko, B. J. Oncol. Pract. 13, 233–241 (2017).

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发