Nature:新测序技术有助发现基因组微小变异
导读 | 利用一种新的基因组测序技术,研究人员揭示出了人类基因组中成千上万从未见过的遗传变异。这些研究发现关闭了长期以来因无法测序造成的许多人类基因组作图缺口。相关论文发表在11月10日的《自然》(Nature)杂志上 |
领导这一研究小组的是华盛顿大学基因组学系教授、霍华德-休斯医学研究所研究员、弗雷德-哈钦森癌症研究中心人类生物学部兼职教授Evan Eichler博士,其主要从事于基因组学与生物信息学研究,是国际上进行人和其他灵长类动物比较功能基因组学与生物信息学研究的顶尖科学家。在Cell, Nature, Science等国际顶尖学术期刊上发表了具有重要影响力的论文260多篇。
Eichler说:“长期以来科学家们对许多疾病的遗传病因都感到困惑不解。这一称作为单分子、实时DNA测序(SMRT)的新技术,使得研究人员现在鉴别出这些疾病背后的潜在遗传突变成为了可能。现在,我们进入到了以往对我们来说不透明的一个遗传变异的全新领域。”
到目前为止,科学家们还只能确定大约一半遗传性疾病的遗传病因。尽管无数科研人员在经年累月地进行研究,但人们还是未能找到许多人类疾病和特征背后的遗传因素,例如身高等家族特征和二型糖尿病患病风险。这一谜题被称为“遗传性缺失”(missing heritability)。
导致这一问题的一个原因在于,标准的基因组测序技术无法精确绘制基因组许多组成区域的图谱。这些方法是通过排列通常大约为100个碱基长度的、亿万的重叠的DNA小片段,随后分析它们的DNA序列来构建基因组图谱。
这种方法已成功地精确描绘出了数百万人类基因组中的小变异。这些由单核苷酸碱基替换引起的变异,称作为单核苷酸多态(SNP)。这种标准方法还使得鉴别出非常大的变异,尤其与是5,000个碱基或以上长度DNA片段相关的变异变为可能。但由于一些技术原因,以往科学家们无法可靠地检测出长度在大约50-5000个碱基之间的变异。
新研究中所采用的这一SMRT技术使得测序和读取长度超过5000个碱基的DNA片段成为可能,比标准的基因测序技术还要长。
这一由生物研究公司Pacific Biosciences of California Inc开发的“长读”技术,使得研究人员能够构建出相比以往更高分辨率的基因组结构变异图谱。研究的主要作者、Eichler实验室博士后Mark Chaisson开发出了这种方法,使得利用这一数据以碱基对分辨率来检测结构变异成为了可能。
为了简化他们的分析,研究人员利用了来自葡萄胎(hydatidiform mole)的基因组。葡萄胎是由精子与缺乏母源DNA的卵子受精所导致的一种异常生长物。葡萄胎的基因组织只包含每个基因的一个拷贝,而非存在于正常细胞中的两个拷贝,简化了搜寻遗传变异。
在葡萄胎中应用这一新方法,研究人员鉴别并测序了与基因组研究中标准人类参考基因组不同的26,079个片段。Eichler说,其中大多数的变异(大约22,000个)从未被报道。
“这些研究结果表明,我们错失了很多的变异。”
这一技术还使得Eichler和同事们绘制出了160个基因组片段的图谱,在过去一直难以对这些称作为常染色体缺口(euchromatic gaps)的片段进行测序。他们的努力关闭了50个这样的缺口,缩小了其他40个缺口。
Eichler说,这些缺口包括一些重要的序列,一些基因的组成序列以及帮助控制基因表达的一些调控元件。在这些缺口中的一些DNA片段显示出已知对大肠杆菌有毒的标记。大肠杆菌是常用于一些基因组测序过程的一种细菌。
Eichler说:“如果将这样的DNA序列置于大肠杆菌中,有可能细菌会删除这一DNA。”这或许可以解释为什么不能采用标准方法来对其进行测序。他补充说,这些缺口还携带了采用标准的测序方法无法很好复制的复杂序列。
“这些序列在人与人之间存在着广泛的差异,它们有可能是一些遗传不稳定性热区,”他说。
由于价格昂贵,每个基因组需要大约10万美元,SMRT技术仍然是一个研究工具。
Eichler预测:“在五年内,有可能会有一种长读测序技术将使得临床实验室能够从一端到另一端测序患者的染色体。‘是的,你具有大约3百万-4百万的SNPs以及插入缺失,你还具有大约3万-4万个结构变异。在其中,有一些结构性变异和少数的SNPs是你易患某种疾病的原因。’知道所有这些突变将改变游戏的规则。”(转化医学网360zhyx.com)
Eichler说:“长期以来科学家们对许多疾病的遗传病因都感到困惑不解。这一称作为单分子、实时DNA测序(SMRT)的新技术,使得研究人员现在鉴别出这些疾病背后的潜在遗传突变成为了可能。现在,我们进入到了以往对我们来说不透明的一个遗传变异的全新领域。”
到目前为止,科学家们还只能确定大约一半遗传性疾病的遗传病因。尽管无数科研人员在经年累月地进行研究,但人们还是未能找到许多人类疾病和特征背后的遗传因素,例如身高等家族特征和二型糖尿病患病风险。这一谜题被称为“遗传性缺失”(missing heritability)。
导致这一问题的一个原因在于,标准的基因组测序技术无法精确绘制基因组许多组成区域的图谱。这些方法是通过排列通常大约为100个碱基长度的、亿万的重叠的DNA小片段,随后分析它们的DNA序列来构建基因组图谱。
这种方法已成功地精确描绘出了数百万人类基因组中的小变异。这些由单核苷酸碱基替换引起的变异,称作为单核苷酸多态(SNP)。这种标准方法还使得鉴别出非常大的变异,尤其与是5,000个碱基或以上长度DNA片段相关的变异变为可能。但由于一些技术原因,以往科学家们无法可靠地检测出长度在大约50-5000个碱基之间的变异。
新研究中所采用的这一SMRT技术使得测序和读取长度超过5000个碱基的DNA片段成为可能,比标准的基因测序技术还要长。
这一由生物研究公司Pacific Biosciences of California Inc开发的“长读”技术,使得研究人员能够构建出相比以往更高分辨率的基因组结构变异图谱。研究的主要作者、Eichler实验室博士后Mark Chaisson开发出了这种方法,使得利用这一数据以碱基对分辨率来检测结构变异成为了可能。
为了简化他们的分析,研究人员利用了来自葡萄胎(hydatidiform mole)的基因组。葡萄胎是由精子与缺乏母源DNA的卵子受精所导致的一种异常生长物。葡萄胎的基因组织只包含每个基因的一个拷贝,而非存在于正常细胞中的两个拷贝,简化了搜寻遗传变异。
在葡萄胎中应用这一新方法,研究人员鉴别并测序了与基因组研究中标准人类参考基因组不同的26,079个片段。Eichler说,其中大多数的变异(大约22,000个)从未被报道。
“这些研究结果表明,我们错失了很多的变异。”
这一技术还使得Eichler和同事们绘制出了160个基因组片段的图谱,在过去一直难以对这些称作为常染色体缺口(euchromatic gaps)的片段进行测序。他们的努力关闭了50个这样的缺口,缩小了其他40个缺口。
Eichler说,这些缺口包括一些重要的序列,一些基因的组成序列以及帮助控制基因表达的一些调控元件。在这些缺口中的一些DNA片段显示出已知对大肠杆菌有毒的标记。大肠杆菌是常用于一些基因组测序过程的一种细菌。
Eichler说:“如果将这样的DNA序列置于大肠杆菌中,有可能细菌会删除这一DNA。”这或许可以解释为什么不能采用标准方法来对其进行测序。他补充说,这些缺口还携带了采用标准的测序方法无法很好复制的复杂序列。
“这些序列在人与人之间存在着广泛的差异,它们有可能是一些遗传不稳定性热区,”他说。
由于价格昂贵,每个基因组需要大约10万美元,SMRT技术仍然是一个研究工具。
Eichler预测:“在五年内,有可能会有一种长读测序技术将使得临床实验室能够从一端到另一端测序患者的染色体。‘是的,你具有大约3百万-4百万的SNPs以及插入缺失,你还具有大约3万-4万个结构变异。在其中,有一些结构性变异和少数的SNPs是你易患某种疾病的原因。’知道所有这些突变将改变游戏的规则。”(转化医学网360zhyx.com)
还没有人评论,赶快抢个沙发