用NGS寻找罕见变异 需谨慎
导读 |
下一代测序引入的误差,使得我们很难检测到罕见变异,而这些罕见变异在癌症等疾病中发挥着重要的作用。在Biotechniques最近的一篇新闻中,Janelle Weaver报道了科学家们在描绘这些误差以及开发策略提高精度方面所取得的进步。 |
下一代测序引入的误差,使得我们很难检测到罕见变异,而这些罕见变异在癌症等疾病中发挥着重要的作用。在Biotechniques最近的一篇新闻中,Janelle Weaver报道了科学家们在描绘这些误差以及开发策略提高精度方面所取得的进步。
美国国家心脏、肺和血液研究所外显子组测序项目的研究人员,在对2400个人的外显子组进行测序和分析之后推断,大多数单核苷酸变异是罕见的,在样本群体中的发生率小于0.5%。这一发现解释了为什么全基因组关联研究(GWAS)——试图将常见遗传变异与特定疾病表型联系起来——对于复杂疾病通常是失败的。Albert Einstein医学院的Jan Vijg研究基因组损伤和衰老之间的关系,他指出:“这些罕见突变真的是最重要的。我们不倾向于在常见变异中寻找特定疾病的风险变异,因此很显然,所有的罕见变异在一起,的确引发了许多疾病表型,因此我们需要研究它们。”
虽然下一代DNA测序对疾病相关突变的检测和个性化医学发展,具有很大的潜力,但是我们检测罕见变异的能力,因样本制备、测序和分析步骤过程中引入的误差而受到限制。因此,大约1%的碱基是错误识别的。
虽然这种误差率对于某些应用是可以接受的,但是它已经成为癌症研究人员的一个主要障碍。所以现在,研究人员正在开发新的技术,以准确地识别基因组大海中的罕见变异。
降低误差率
在华盛顿大学,Larry Loeb是其中一个试图更好把握罕见遗传变异的癌症研究人员。但是由于以前的测序方法不够准确,他的实验室只能研究频率超过10%的突变。他说:“我们需要一种更准确的方法,可以研究那些可能不会出现在所有肿瘤细胞中的变异——它们可能是亚克隆或随机的。”
Loeb和他的研究团队描述了这样一种方法,称为双重测序(Duplex Sequencing),相关研究结果发表在2012年的《PNAS》杂志。通过对DNA双链体的两条链进行独立标记和测序,这种方法实现的理论背景误差率为,小于每十亿个核苷酸序列中有1个人为突变。因此,这种方法对于检测罕见DNA变异以及单分子计数具有很高的灵敏度,可精确地确定DNA或RNA拷贝数的绝对值。
在双重测序中,一段双螺旋DNA片段的两条链,被附加以一段随机的、但又互补的双链核苷酸序列。首先将一段单股的随机核苷酸序列引入一段接头链,然后用DNA聚合酶产生一段互补的双链标签,进行延伸,使双链的标签序列被合并到标准的Illumina测序接头上。接着,将标签接头结扎到剪切的DNA上,然后对单独标记的链,进行PCR扩增和配对末端测序。
通过比较双重测序两股链中每一段所获得的序列,Loeb及其同事能够将测序误差与真正的突变区别开来。由于一个DNA双链体的两股链是互补的,真正的突变位于两股链的同一位置。相反,PCR或测序误差仅在一条链上引发突变,因此可以被视为技术性误差。
Loeb说:“其他最好的方法,可在每一千个核苷酸中引起一个误差。如果你想测定存在于身体所有细胞中的遗传异常,这已经足够好了。但是,如果你想测定罕见变异,或者如果你想要一个肿瘤中的突变分布,或者如果你想测定病毒性种群,这个错误率就太高了。”
实现精确度
虽然科学家们都非常清楚PCR和下一代测序过程中引入的误差,但是DNA提取和样本制备过程中产生的误差却很少受到关注。麻省理工学院布罗德研究所和哈佛大学的Gad Getz带领的一个研究小组,2013年在《Nucleic Acids Research》发表的一项研究中解决了这个问题,该研究发现了样本制备过程中发生的人为突变的一个新来源。
根据这项研究,位于超深覆盖目标捕获测序数据中低等位基因片段的C>A/G>T颠换偏差,是来自于包含提取过程反应污染物的样品在进行声剪切时的DNA氧化。往剪切缓冲液中添加金属螯合剂,可降低这些氧化偏差,一种后处理过滤法能够筛选出氧化引起的测序数据误差。这些研究结果表明,实验室程序的变化和信息工具的使用,可以帮助研究人员抑制人为偏差的影响。
加州大学旧金山分校的Nadav Ahituv,研究基因调控序列在人类生物学和疾病中的作用,他没有参与这项研究,但是他指出:“人们都知道,使用任何测序技术都有误差,所以我不认为这有什么惊讶的。这项研究的长处在于,他们针对的是原因,并且提出了很好的计算工具来减少这个问题。”
根据卡罗林斯卡医学院癌症系统生物学专家Jussi Taipale介绍,除了最近这些研究中描述的实验和信息学方法之外,还有其他潜在的方法可提高测序的准确度。他没有参与这些研究,但是他指出:“精确度总是受到聚合酶错误率的限制,因为你必须使用它。如果我们能开发一种酶,具有较低的错误率,如果我们能处理突变的所有化学来源,那么这当然会提供更多的帮助。”
临床影响
像Vijg这些致力于罕见突变的研究人员,可能不需要等待太长时间就能实现这些方法。例如,双重测序可以适用于各种测序平台,含有双链标签序列的接头,可以代替标准的测序接头,而不会明显改变Illumina测序样本制备的正常工作流程。Vijg说:“我们肯定能够在当前的工作流程中快速地实现它。”
也许最重要的是,双重测序可以揭示赋予耐药性的罕见突变。Vijg说:“如果我们已经知道,在肿瘤中的某个地方,有一个特定的基因变异,能够使它们有机会逃脱一种特定药物,那么我们就可以尝试另外一种药物。这可能会对治疗产生直接影响。”此外,单细胞测序的未来发展,可能会进一步帮助研究人员确定这些类型的突变。
但是双重测序是否能够应用于许多类型的突变,仍有待确定。“实际上,他们主要将其应用于小突变——点突变。是否能在大的变化上做到这一点,如大的缺失、易位或拷贝数变异,我还不清楚。”
最后,双重测序可能不会代替标准方法。其中一个原因是,对于全外显子组测序来说,这种方法过于昂贵。Loeb说:“它对于细胞的测序不均匀混合物或提问的生物学问题,真的很有用,因为它们需要超级精确度。所以,从某种意义上说,双重测序可能会被限制在癌症研究、病毒群、古DNA取证之类的事情。”
Ahituv认为,各种测序方法将被并行使用。他说:“这两篇论文最重要的意义在于,如果我们想利用下一代测序技术来寻找罕见基因变异,我们就必须非常小心。”(转化医学网360zhyx.com)
推荐原文:
1. Tennessen, J. A., A. W. Bigham, T. D. O'Connor, W. Fu, E. E. Kenny, S. Gravel, S. McGee, R. Do, X. Liu, G. Jun, H. M. Kang, D. Jordan, S. M. Leal, S. Gabriel, M. J. Rieder, G. Abecasis, D. Altshuler, D. A. Nickerson, E. Boerwinkle, S. Sunyaev, C. D. Bustamante, M. J. Bamshad, J. M. Akey, G. O. Broad, G. O. Seattle, and on behalf of the NHLBI Exome Sequencing Project. 2012. Evolution and functional impact of rare coding variation from deep sequencing of human exomes. Science 337(6090):64-69.2. Salk, J.J., E.J. Fox, and L.A. Loeb. 2010. Mutational heterogeneity in human cancers: origin and consequences. Annu Rev Pathol 5:51-75. doi: 10.1146/annurev-pathol-121808-102113.
3. Schmitt, M.W., S.R. Kennedy, J.J. Salk, E.J. Fox, J.B. Hiatt, and L.A. Loeb. 2012. Detection of ultra-rare mutations by next-generation sequencing. Proc Natl Acad Sci U S A 109(36):14508-13. doi: 10.1073/pnas.1208715109.
4. Costello, M., T.J. Pugh, T.J. Fennell, C. Stewart, L. Lichtenstein, J.C. Meldrim, J.L. Fostel, D.C. Friedrich, D. Perrin, D. Dionne, S. Kim, S.B. Gabriel, E.S. Lander, S. Fisher, and G. Getz. 2013. Discovery and characterization of artifactual mutations in deep coverage targeted capture sequencing data due to oxidative DNA damage during sample preparation. Nucleic Acids Res. doi: 10.1093/nar/gks1443.5. Gundry, M., and J. Vijg. 2012. Direct mutation analysis by high-throughput sequencing: from germline to low-abundant, somatic variants. Mutat Res 729(1-2):1-15. doi: 10.1016/mrfmmm.2011.10.001.
5. Gundry, M., and J. Vijg. 2012. Direct mutation analysis by high-throughput sequencing: from germline to low-abundant, somatic variants. Mutat Res 729(1-2):1-15. doi: 10.1016/mrfmmm.2011.10.001.
顶一下(0) 回复
顶一下(0) 回复