推荐活动

【Lancet子刊】浙江大学周丹团队:多模态框架改进了对替代组织的特异性基因表达的预测

首页 » 《转》译 2024-08-27 转化医学网 赞(2)
分享: 
导读
团队提出了一种方法,基于Multi-mOdal的框架,来桥接PE上腺组织和中央组织(MOTPEC)之间的转录组。

2024年8月22日,浙江大学公共卫生学院、浙江大学医学院附属第二医院周丹团队在期刊《eBioMedicine》上发表了题为“A multi-modal framework improves prediction of tissue-specific gene expression from a surrogate tissue”的研究论文。研究结果显示,MOTPEC显著缩小了外周血与中枢组织之间的差距。集成多模态特征可以改进跨组织预测,这可以应用于DGE分析。利用多模态特征的基于外周组织的预测方法,大大减少了直接使用外周血和使用中央组织,来识别性状相关组织特异性基因之间的分歧。结合TWAS和DGE方法的优势,有望识别复杂性状的基因。

https://www.thelancet.com/journals/ebiom/article/PIIS2352-3964(24)00341-4/fulltext#%20

研究背景

 01 

作为精准医学的基础工具,组学被广泛用于不同的研究领域,并越来越多地应用于临床实践。转录组是用于破译复杂性状分子回路的最广泛使用的组学层。基因表达是高度细胞类型或组织特异性的。经验数据表明,疾病相关组织(以下简称“中央”组织)和替代“外围”组织(如血液)之间的基因表达,可能存在很大差异。然而,如果不使用侵入性手术,大多数中央组织就不容易接近,这限制了科学界研究组织中,对许多复杂特征至关重要的致病基因的能力。组织特异性基因表达的高性能预测和增强对致病基因效应的检测,可能有助于应对这一挑战。


鉴定复杂性状相关基因的常用方法,包括差异基因表达 (DGE)分析、全转录组关联研究(TWAS)和基于基因相似性的方法。DGE分析功能强大,即使样品量很小,也可以进行。但是,在确定效果方向时,可能容易出错,尤其是在横截面设计中。DGE的结果,容易受到混杂的影响。中央组织的有限可用性,对DGE分析构成了重大挑战。基于基因调节的基因表达,TWAS解决了反向因果关系的问题,但需要较大的样本量。此外,由于遗传变异的性质,TWAS不太容易受到某些类型的混杂因素的影响。然而,局部连锁不平衡的复杂性和广泛的多效性效应,降低了TWAS对致病基因鉴定的分辨率。结合TWAS和DGE方法的优势,可能有望识别复杂的性状相关基因。


一些研究试图使用外周血,预测中央组织中的基因表达。现有方法包括TEEBoT(使用血液转录组进行组织表达估计)、B-GEX(BayR-based multi-tissue Gene EXpression)和MTM(多组织转录组图谱)。TEEBoT 中的主要模型,使用LASSO回归整合基因表达和剪接数据,而B-GEX利用贝叶斯岭回归,仅考虑全血基因表达。MTM是一个基于深度学习的统一多任务学习框架,支持从任何可用组织中,预测组织特异性基因表达。团队假设,一种整合了更全面的调控特征、先验生物学知识和替代组织中基因之间的连接信息的多模态方法,可以显著提高难以接近的组织(包括疾病相关组织)的预测性能。

研究进展

 02 

MOTPEC缩小了外周血和中枢组织之间的差距


通过使用MOTROPIC预测的表达 (例如,脂肪皮下、脑杏仁核),血液和中央组织之间估计的DGE效应大小的差异大大缩小。MOTPEC显著缩短了32个组织中的距离,在缩小基因BMI关联的差距方面优于TEEBoT(在26个组织中)。观察到常见的二元性状结果一致,包括T2D (25个组织对19个组织)。


为了探索MOTPEC框架的稳健性,除了BMI之外,团队还选择了6种疾病表型 (MHHTN-高血压、MHT2D-2型糖尿病、MHHRTATT-急性心肌梗死、MHHRTDIS-缺血性心脏病、MHCOPD-慢性呼吸系统疾病、MHASTHMA-哮喘)。通过使用MOPEC预测的表达,使用外周血和使用非外周组织之间的基因-性状关联的差距显著减少。以慢性呼吸系统疾病为例,在11个(84.6%)脑组织和29个(82.9%)非脑组织中,MOTPEC预测到测量的差距,小于血液到测量的差距。


研究结果表明,MOTPEC可以缩小血液和中央组织之间的估计效应量差异。

MOTPEC减少了血液和中央组织之间估计的DGE效应大小的差异。


细胞扰动分析进一步支持MOTPEC-DGE-TWAS一致性基因


由于输入基因的数量最少,15个感兴趣的组织(2个脂肪组织和13个脑组织)中,只有5个被应用于获得输入一致基因和细胞扰动之间的连接分数。团队通过脂肪内脏网膜组织中测量和MOPEC预测的表达整合分析,确定了两种扰动 (即PD-184352和GR-235),阳性连接评分与TWAS和DGE结果一致。然而,在测量的表达和基于血液代理的DGE之间,没有发现一致的扰动。


这两种化合物对肥胖都有促进作用,这表明查询具有一致的生物学效应。PD-184352是一种MEK抑制剂。MEK抑制剂可以防止TNF α介导的CIDEC(细胞死亡诱导DFF45样效应子C)下调。CIDEC在脂肪组织中特异性表达,促进甘油三酯积累。GR-235是一种FXR拮抗剂。现有研究表明,肠道FXR激动作用,可促进脂肪组织褐变并减少肥胖。研究结果表明,将基于MOTPC的DGE与TWAS整合,优于仅使用血液作为代理组织。

将MOTPEC-DGE与TWAS整合,可确定肥胖的候选药物。

研究结论

 03 

在本研究中,团队提出了一个显著改善中枢组织中基因表达预测的框架。值得注意的是,该方法可以扩展到其他组学数据。然而,这项研究有明显的局限性。尽管GTEx已扩展到多种组学数据,包括DNA甲基化和蛋白质表达,但该资源仍然受到样本量的限制,这限制了预测准确性的进一步提高。


总之,团队开发了MOTPEC,这是一种多模式基因表达建模方法,可显著减少使用外周血和使用中央组织,来识别性状相关组织特异性基因之间的差异。通过应用于BMI相关基因的鉴定和对其他6种(疾病)表型的效应大小差异的分析,证明了该预测模型的实用性。


参考资料:


1.Ibrahim R. Pasic M. Yousef G.M.

Omics for personalized medicine: defining the current we swim in.

Expert Rev Mol Diagn. 2016; 16: 719-722


2.Vassy J.L. Lautenbach D.M. McLaughinet H.M. et al.

The MedSeq Project: a randomized trial of integrating whole genome sequencing into clinical medicine.

Trials. 2014; 15: 85

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发