【Nature子刊】赵方庆团队提出:肠道菌群大规模数据整合和生物标志物鉴定的新方法
导读 | 中国科学院北京生命科学研究院赵方庆教授领导的研究团队提出了一种高效整合大规模菌群数据和生物标志物鉴定的新算法(NetMoss)。 |
研究“Large-scale microbiome data integration enables robust biomarker identification”于5月23日发表在《Nature Computational Science》上。
https://www.nature.com/articles/s43588-022-00247-8
肠道菌群与人类健康的关系近年来受到越来越多的关注,并积累了海量的复杂数据。然而,从这样的大数据中提取与疾病密切相关的信息具有挑战性。
一方面,肠道菌群更容易受到饮食、地理等因素的影响。肠道菌群的组成在不同人群中可能存在很大差异,这导致了数据的直接整合和基于丰度的生物标志物的鉴定存在偏倚。另一方面,微生物丰度矩阵过于稀疏,常规的计算方法很难去除基于这种稀疏矩阵的批次效应。
新提出的算法利用微生物相互作用网络有效整合不同种群的数据。它可以通过比较不同状态下微生物网络的扰动来量化不同网络模块之间的拓扑差异,从而能够鉴定疾病相关的生物标志物。与之前的方法相比,NetMoss可以更高效地无偏倚地整合不同批次的微生物数据,挖掘疾病相关的生物标志物,并识别驱动多种疾病发生的微生物微生态失调协变模式。
在这项研究中,研究人员收集了来自患病和健康对照组的11377份肠道菌群的测序样本,涵盖了78项研究、37种疾病和13个国家或地区。有了这些来自不同人群的多个数据集,他们发现目前使用的计算方法极难去除实验和测序过程引起的批次效应。
为了高效地进行下游分析并避免偏倚,研究人员开发了一种用于数据整合和生物标志物鉴定的高效计算模型。该模型基于微生物相互作用网络。微生物相互作用网络是单独构建的,然后根据其结构特征使用不同的权重进行集成。通过量化患病和健康网络中不同模块之间的拓扑差异,将对外界影响扰动最敏感的细菌鉴定为生物标志物。研究人员将计算算法应用于模拟和真实的数据集。他们发现其在综合数据集和单个数据集中均具有高度准确性和稳健性。
“大部分生物标志物并不是单独引起一种疾病,而是与多种疾病相关。类似的微生态失调模式可能为不同疾病的发生提供重要线索,”赵教授说。这种新算法将帮助我们理解微生物-宿主相互作用的本质,更好地指导我们预防和治疗许多疾病。(转化医学网360zhyx.com)
参考资料:
https://medicalxpress.com/news/2022-06-method-large-scale-biomarker-identification.html
注:本文旨在介绍医学研究进展,不能作为治疗方案参考。如需获得健康指导,请至正规医院就诊。
还没有人评论,赶快抢个沙发