用户登录转化医学是什么？

【Science子刊】深度学习模型助力发现癌症中新的基因突变！

首页 » 《转》译 2022-06-17 转化医学网赞(2)

导读	Hi-C技术已被证明是检测人类基因组结构变异（SVs）的一种有前景的方法。然而，目前严重缺乏能够使用Hi-C数据进行全范围SV检测的算法, 只能以低于最佳的分辨率识别染色体间易位和远程染色体内SVs（> 1mb）。最近，科学家们开发了一个深度学习模型，结合了深度学习和集成学习策略的框架，以高分辨率预测全范围的SVs。

发表在《Science Advances》杂志上的一项研究称，一种机器学习模型已经帮助科学家发现了目前基因组测序无法检测到的数百种癌症基因突变。

https://www.science.org/doi/10.1126/sciadv.abn9215

该研究的资深作者是Duane and Susan Burnham分子医学教授Feng Yue博士。Yue说：“这些发现为癌症分类和潜在疗法提供了新的靶点。”

Yue同时也是美国西北大学Robert H. Lurie综合癌症中心的生物化学、分子遗传学和病理学副教授，以及癌症基因组学中心主任, 他表示:“我们在癌症基因组中认识了许多先前未知的融合事件，也发掘了已知致癌基因的新型调控机制。”

在每个细胞内，DNA长链需要经过精确地折叠和编组，然后装配到直径只有几微米的细胞核内。此前，Yue和他的合作者表明，癌症基因组的结构变异，如逆转和易位，可以被Hi-C这类基因组分析工具中检测到。

这些模式能够被计算机算法识别为结构变异的指标。此外，这些巨大的结构变异通常会被全基因组测序 (WGS) ，甚至是Nanopore这样的长读测序（LRS）所忽略。Yue说：“WGS非常擅长于检测碱基对突变和短插入缺失，但很难检测更大的变异。”

在这项研究中，Yue和他的合作者从8个癌细胞系(A549，Caki2，K562，LNCaP，NCI-H460，PANC-1，SK-N-MC和T47D)中收集了一组的不同类型的高可信度结构变异。这些被用来训练一个深度学习模型—— EagleC，来学习埋藏在这些信号中的隐藏模式。EagleC的检测结果与传统基因组测序技术基本一致，WGS或Nanopore测序也发现了70~80%的基因组变异。

不同的是，EagleC发现了数百个被全基因组测序或长读测序遗漏的融合基因。根据Yue所说，这些新发现的融合基因占Hi-C所检测到的总遗传变异的10%-20%。

许多这样的融合事件引起了一个致癌基因和位于另一条染色体上的一个远端增强子之间的联系。这些事件被称为“增强子劫持”，会导致致癌基因上调。