推荐活动

智因东方速递| 儿科基因组学:在儿童罕见病诊断中的应用

首页 » 《转》译 2018-02-27 转化医学网 赞(3)
分享: 
导读
每年的2月28日为世界罕见病日,罕见病又称“孤儿病”,是指那些发病率极低的疾病。虽然在中国并没有明确的定义,但仍有超数十万的罕见病病人。

2018新春伊始,智因东方为奋战在儿科遗传病诊断战线上的临床医生、遗传学家奉上一篇《NATURE REVIEWS GENETICS》新近刊登的综述《Paediatric genomics: diagnosing rare disease in children》(PMID: 29398702)的完整译文,这篇综述将NGS用于儿童遗传病诊断的方方面面进行了阐述,包括以下大家关心的问题:

哪些患者需要做基因检测?

选择哪种检测策略,是Sanger测序、WES、trioWES还是WGS?

核心家系模式(trio)与先证者模式相比有什么优势?
变异数据该如何过滤、判断,并与临床信息整合分析?
如何考量基因检测所涉及的伦理问题?

对上述及其他诸多问题,文章进行了全面的、高屋建瓴的阐述。本文堪称鸿篇巨制,是全面深刻理解遗传病精准诊断的不可多得的纲领性文献。译文将以四个部分发布在转化医学网上。

儿科基因组学:在儿童罕见病诊断中的应用

Caroline F. Wright, David R. FitzPatrick and Helen V. Firth

摘要| 很多罕见病都累及儿童,且这些罕见病患儿的发病情形多数是由于潜在的遗传因素所导致的。然而,利用当前的知识和技术对这些罕见病进行分子诊断仍是一项挑战。儿科基因组学通过将新一代测序技术,特别是全外显子组测序(WES)全基因组测序(WGS)技术,应用到该领域的研究及临床实践中以攻克这项挑战,目前其尚处于一个发展不甚成熟但进展非常迅速的阶段。这种复杂多学科的方法,结合不断增加的人群遗传变异数据,已经大幅提高了致病基因的发现率,并促进了儿科罕见疾病的诊断。

重要的是,对于受累家庭,一种更好地了解罕见病遗传基础的方法,能够转化成更精准的疾病预后、管理、监测和遗传咨询,并促进新疗法的研究,和提供更好的医疗支持。

罕见病被定义为,在普通人群中发生率低于1/2,000 的疾病由于罕见病通常会对生殖适合度产生不利影响,故而这类疾病在一般人群中很少见。目前约有7,000种罕见病,其中~80%被认为是由于遗传因素所导致。多数(50-75%)罕见病累及儿童, 且很多是具有一系列表型、累及多系统的严重疾病。从整体来看,这些疾病是儿科住院患儿的重要病因,35%的这些罕见病患儿在1岁内死亡;1/3的先天罕见病患儿的生存期将不超过5年

虽然近1500个基因的罕见变异已被证明可导致发育障碍性疾病(developmental disorders),但仍有许多致病基因有待被发现。精准诊断——这里被定义为识别出可解释罕见病临床特征(表型)的精确分子致病原因(基因型)——是安全医疗实践的基础。对于罕见遗传病的患儿们来说,一种可靠的基因诊断方法,不仅为其得以利用医学文献中的丰富信息提供了钥匙,这些文献信息提供了疾病管理和治疗方面的建议,还有可能使其接触到特定疾病的支持群体,使这些罕见病家庭不再孤立无援。强有力的基因诊断也能够精确测定家庭成员目前和未来的患病风险。

然而,因这些疾病的基因和表型的多变性以及因我们认识的局限性所致,对每个个体进行精确诊断仍然是一个相当大的挑战。为应对这一挑战,国际罕见病研究联盟(International RareDiseases Research Consortium, IRDiRC)最近发出了2017-2027未来十年的愿景:让所有罕见病患者在就医的第一年,都能够得到精准的诊断、关怀,以及尽可能的治疗资源”。

致病性基因变异的范围,从变异大小来说,可以从单个碱基对的替换、缺失或重复,到基因结构变异,乃至整个染色体拷贝数的改变(非整倍体),或基因组拷贝数的改变(例如二/三倍体嵌合)。不仅由这些变异单独导致疾病的情况非常罕见或极罕见(<100,000),而且通常还存在由于疾病外显率差异以及同种疾病不同患者的表现度差异所呈现的临床表型的多变性。

这种遗传病的多变性部分甚至全部(在极端条件下)可归因于基因座异质性(locus heterogeneity)和等位(基因)异质性(allelic heterogeneity);例如“智力障碍”的临床特征,可能是由一个或多个(>700个)不同基因的单个等位基因变异或双等位基因变异引起的。其他导致遗传病多变性的原因还包括一个基因或多个其他基因(修饰)的多个遗传变异和环境因素,但目前我们对这些因素很难进行识别和量化。因此,大多数罕见遗传病并不具有高度特异性的临床表型,并且临床上通过经典方法难以诊断,所谓的经典方法,即依赖于临床表型模式一致性的识别,如发育异常、特异部位的畸形以及特征性面容等表型的组合。此外,并不是所有儿科罕见病病因都归因于遗传,在世界范围内仍有很小一部分但非常重要的原因是由于致畸物的接触(如胎儿酒精综合征,先天性弓形虫病或兹卡病毒感染)。因此到目前为止,大多数罕见病患儿,尤其是发育障碍的患儿,仍未得到确诊。

新一代测序技术(NGS)大大提升了获得基因诊断的预期,因为在用这种方法时,这些患儿的基因型和临床表型是不可知的。对基因组中每个基因同时测序,能检测出个体基因组中存在的绝大多数可能致病的基因变异,使得跨越一系列复杂的儿科临床表型进行诊断成为可能,甚至对于罕见和极其罕见的病例,包括那些儿科临床医生可能都很陌生的罕见病,也可望得到诊断。一旦某综合征的遗传基础得到确认,其被发现的临床表现往往会增多称为综合征扩张,因为我们已经认识到,相同的分子遗传基础可以表现为轻微表型或部分表型的组合。

基因组检测技术的进步对儿科罕见病有着特殊的影响,与成人罕见遗传病相比,儿科罕见病因其早期发病以及致病变异性质和发生频率的差异,意味着诊断阳性率通常会较高。严重发育障碍性疾病的生殖适合度通常很差;没有强大的平衡选择(相对罕见),或受到社会上和/或地理上隔绝的婚配的影响(相对常见),这类疾病的基因变异在人群中难以传代维持。因此,严重儿科遗传病的致病变异预期应该是极罕见变异和往往是新发(de novo)变异(显性遗传模式),或在近亲婚配人群或奠基者人群中富集的变异(隐性遗传模式)。

尽管人类基因组在不同的个体之间存在大约400万至500万个的多态性变异位点,但这些变异位点绝大多数是常见且良性的变异。那些罕见危害性新发变异(和双等位变异的组合)不太可能出现在成人对照群体中,故儿科罕见病的基因诊断可以由此而简化。

Figure1 | 各类儿科疾病利用全外显子组测序(WES)的诊断率(基于文献报道)

上图中给出了每个表型类别的全外显子组测序的诊断率和相应的PubMed文献识别号(PMID);仅采用了病例数≥10的临床病例系列,且仅包括已知或可能致病基因的致病性或可能的致病性变异。除了神经发育障碍性疾病以外,其他许多种类的疾病缺少相应的研究报导。上图中图框的大小与在儿科临床实践中统计的疾病表型流行率大致成正比。

本文主要综述了基因组学在儿科罕见病诊断中的应用,不涉及肿瘤的体细胞变异或基因组学在儿科癌症诊断或管理中的应用。

本文将分成以下四个部分进行论述:

1.从传统的基因诊断检测转向NGS检测的益处。

2.数据分析中的问题。

3.全外显子测序(WES)或全基因组测序(WGS)在目前临床上应用的主要适应症。

4.儿科基因组学的未来。

从基因检测到基因组检测

1. 传统的基因检测

在过去,临床遗传学主要依赖两种类型的基因检测:高度集中于分子区域的高分辨率的单基因检测和全基因组低分辨率的细胞遗传学检测 (FIG. 2a)。在单基因分子检测中,根据患者的临床表现选择特定基因进行Sanger测序或基因分型。通过这种检测得到确诊的概率,取决于医师正确识别病症的潜在遗传病因,并选择正确的检测方案。

因此,单基因分子检测最适合用于诊断由一个或少数几个基因突变导致的高度特异的临床表型。例如,大多数“经典”遗传病是用这种方法进行诊断的,如囊性纤维化(由CFTR变异引起) 或Duchenne型肌营养不良症(由DMD变异引起), 而低分辨率全基因组检测方法,例如G显带显微镜核型分析(分辨率约为5-7Mb),可以用于诊断常见的三倍体异常和染色体部分结构非整倍体异常,还包括一些明显散发的发育障碍性疾病,后者往往由于染色体部分结构发生了罕见的重复或独特的大片段的不平衡所导致。

较小一些的结构性变异,例如拷贝数变异(CNVs),可以通过基因组微阵列的方法来进行分子核型检测,这种方法的分辨率通常可达50-100kb。基因组微阵列可检测到基因组中任何位置的致病性CNVs,包括与微缺失和/或微重复综合征相关的重复发生的变异。然而与NGS相比,这些检测技术诊断敏感性较低,仅能诊断出约10%的儿科罕见病患儿。

2.现代基因检测技术

NGS技术能够对多个基因, 进行大规模的平行测序,这使得临床遗传学 发生了革命性的变化。临床医生现在可以要求同时对多个基因、甚至全外显子组或全基因组进行测序,而非仅仅选择对单个基因或单一类型的变异进行检测。这种高分辨率的全基因组检测方法结合了单分子检测和全基因组细胞遗传学检测的优点(FIG.2a)。

许多儿科疾病是由众多不同基因中的一种基因变异引起的,因此,对多个基因同时测序可以进行快速且全面的分子遗传学分析。举例来说,Bardet- Biedl综合征可能是由20多个基因的变异引起的,其临床表型难以区分; 同样,先天性感音神经性听力障碍的致病变异也有很多,其在临床上难以区分,但在分子遗传学上却存在显著差异。针对这些情况,对所有已知的致病基因同时进行检测将能改善并加速诊断进程。

NGS对于可能由基因组的上千个基因的任何一个的单核苷酸变异(SNV),或小的插入和/或缺失(indels)导致的罕见发育障碍性疾病的诊断特别有用。依次地检测每个候选基因已不再是可行的方法 (FIG. 2b)。(译者注:这里对Sanger测序和NGS的比较性论述非常关键,Sanger测序的敏感性存在局限,Sanger测序验证时常会对NGS检出的杂合变异和嵌合体变异给出假阴性的结果)

以NGS应用于婴儿型癫痫性脑病的基因诊断为例,婴儿型癫痫性脑病是可由数十种基因中的任何一种基因变异导致的一类异质性疾病,在NGS的驱动下,该疾病在2012年至2015年间已发现和鉴定出31个新的致病基因。NGS技术检测SNVs和indels的敏感性非常高,虽然Sanger测序仍被许多实验室认为是金标准,但实际证明NGS技术可能更优越,尤其是在检测杂合性变异和嵌合体变异方面,杂合性变异是指目标变异仅出现在染色体对中的一个拷贝上,嵌合体变异是指仅在个体中部分细胞亚群中出现的变异。

NGS数据也可以用来检测CNVs和其他的结构性变异,尽管在这方面NGS分析的有效性目前还落后于微阵列。然而,经过优化的基因panel采用NGS深度测序对于检测小的外显子缺失(<10kb) 已证明非常有用,而这部分变异往往容易被低分辨率微阵列检测所遗漏,同时WES和WGS两种方法均已成功用于检测大的CNVs(>500 kb)。对发育障碍性疾病的患儿进行WES或WGS 检测之前,是否进行基因组微阵列检测的问题目前尚未解决,因为各个检测的敏感性和特异性取决于所选择检测方法的特性、分析流程的部署以及对不同大小CNVs的诊断率。

虽然NGS技术能对基因组上每一个基因和每一个顺式调控元件(CRE)进行测序,但儿科临床报道通常关注那些已知与儿童期发病的罕见病相关的基因的变异。然而,基因组中约70%的基因和几乎所有的CREs在人类健康和发育中的功能仍然未知,因此可能导致疾病的许多变异通常不会被报道,因为这些变异在分析时出现在未知疾病相关性的基因上。

此外,短读长的NGS无法可靠地检测出三碱基重复扩增,而这涉及到儿科疾病如脆性X综合征、先天性肌强直性营养不良和Friedreich共济失调等疾病的诊断。另外,NGS对小片段CNVs的检测通常表现也较差,如外显子缺失或重复的检测,这是某些疾病如杜氏肌营养不良 和脊髓性肌萎缩症(SMA)1型的主要致病原因。合子后的嵌合体变异在低覆盖率的检测数据中经常会被遗漏,这类病例中受累患儿经常是de novo变异引起的,也有可能遗传自未发病的嵌合体的父亲或母亲。

因此,至关重要的是要回顾审核每份报告可能缺失的数据,并确定检测和/或分析是否覆盖了所有相关基因,和是否检测了通常与该疾病相关的所有变异类型。(译者注:这里提到了NGS在检测小型变异和大型CNV方面的优势,及其局限性。值得注意的是,NGS 对于中等片段CNV,例如连续几个外显子缺失/重复的检测,已有些实验室和研究组做了探索并取得了积极进展)

3.基于新一代测序技术的诊断检测

NGS用于临床诊断的策略有很多种,根据测序靶标区域数量和类型的不同而不同。靶标检测方法,包括对完整的单个基因进行测序,例如之前已经对单独变异进行过基因分型的疾病;对疾病特异性基因进行测序,检测范围从2至>2,000个基因中组成的不同大小的基因检测panel;对目前与单基因疾病有关的约4,000个基因的所有外显子进行测序,这也被称为临床外显子组或孟德尔组(Mendeliome)。

相比之下,通过WGS对WES 和整个基因组的所有约20,000个蛋白质编码基因进行的测序本质上应属于非靶标检测。所有基于NGS的诊断方法都会生成大量数据,但不同检测之间的数据量的差异可能很大,从一个小基因的几百个碱基对,其中仅含有少数变异的数据量到整个基因组30亿个碱基对每个人约有4-5百万个变异的数据量 (FIG. 2c)。

随着平行检测的基因数的增加和产生数据量的增多,检测的敏感性也随之增加,而检测的特异性将会降低,并且来自后续法律和伦理的挑战将会增加(BOX 1)。尤其是关于如何处理未经许可的二次分析的问题,由于每个基因组中数量庞大的变异信息和其应用范围的广泛性,这个问题是非常有争议性的。WES或WGS为各种疾病的基因组筛查提供了机会,但对于过度诊断的合理担忧,已经促进在不同的实验室和不同的管辖区内实行了不同的替代性方法。

在应用虚拟基因panel的方法分析WES或WGS数据时,需要在以下二者间求得平衡,即panel范围的设定是限定在与患者特定表型直接相关的高度特异性、保守的基因集内,还是包括与患者表型相关的系列疾病所包含的更广泛的基因集(例如,是仅局限于对癫痫相关基因的检测,还是包括所有与神经发育障碍相关的基因的检测)。小panel 在临床上是非常有吸引力的,因为它减少了目标外冗余数据及预期外结果的可能,但由于遗传的异质性,其应用极易导致漏诊。然而,每个个体中存在的良性遗传变异的数量,以及每个基因组数据64的解读潜力意味着过度解读导致过度诊断的可能性是相当大的,且这种情况的出现随着检测的范围的增大而增加。

目前尚不清楚如何最好地调整基因组的分析,以达到最大限度地识别真正的致病性变异,尽量减少对误导性变异的识别。一般很少对特定检测的灵敏度和特异性进行记录或比较,因为这些结果取决于许多因素,包括患者是否最终确诊、所讨论表型的基因组证据,以及来自正常人群的对比数据的可用度。在临床实践中,检测数据之间并不能常规地进行互相比较。

4.先证者模式和Trios家系模式的检测

对WES或WGS检测得到的分子遗传变异进行分析的一个很好的策略即是使用家系Trios模式分析患儿及其生物学父母的样本。这使得良性的家族罕见变异可以被过滤掉,仅出现在患儿身上的新发变异可以很容易被识别,隐性疾病或印记疾病的变异状态可通过遗传模式进行确定。对于父母双方都没有受到与孩子同样疾病影响的家庭,父母-先证者(Trios家系模式)的测序分析比单独孩子(先证者模式)的测序分析,可以减少大约十倍的候选变异数,并提高了50%的诊断率(FIG. 2c),从而大大提高了达到精确诊断的可能性和加快了达到精确诊断的速度。

需要对这种分析效率的提升与其所带来的患者父母测序额外成本的增加进行权衡,但是其所增加的费用成本,往往被需要共分离家系验证分析的候选变异数目的减少而抵消,而这种共分离验证对于先证者模式却是必不可少的。(译者注:随着测序成本的下降,trioWES的成本逐渐降低,在中国已出现了和Panel价格倒挂的情况,从而更加凸显了trioWES的价值)。对于使用常规基因检测无法诊断的、表现为严重发育障碍的患儿进行Trios模式(标准家系,即先证者及其父母共三人)WES筛查,目前诊断率约为40%, 而在所有基因检测方法中,该模式对这些表型多样、难以解决的疾病的总体诊断率超过50%。

Figure2 | 临床上的遗传异质性与基因组检测策略

a| 应用于临床遗传学的基因组分析方法,从使用光学显微镜观察染色体进行基因组拷贝数分析的传统方法,发展到全基因组测。

随着检测分辨率的提升,可检测到的变异数量也随之增多。虽然能检测到的变异数量的增加可以提高各种疾病的诊断阳性率,但同时也大大增加了检测到偶然发现和临床意义不确定的变异的可能性。

b| 疾病表型的特异性越低,其越可能由很多个基因的变异导致,即遗传异质性随着表型特异性的降低而升高。

如果疾病的表型和/或遗传同质性很高,则对单个或少量基因进行检测可能更为适当。而在表型和/或遗传异质性较高的情况下,可能需要对数百上千的基因进行检测,这样平均每个患者将有数千个基因变异的检出量。全外显子测序(WES)和全基因组测序(WGS)是表型未知情况下的最佳检测策略,可用于诊断各种疾病。

c|需要在测序策略的诊断潜力和其实用性与成本之间寻找平衡。

如图示,目前已报道的通过不同NGS方法检测的先证者数量绘制于X轴,所覆盖的基因组百分比用Y轴log10 的值表示,诊断率则来自公开发表的文章。利用Trios策略的WGS诊断阳性率最高,数据信息量最大,但其费用也最高,因此可参考的相关报道很少。鉴于目前已知的致病性基因变异大多位于基因编码区,在严重智力障碍疾病的诊断中,WES策略相对WGS仅在诊断阳性率上有少许降低(从约42%降到40 %),但检测的费用成本大大减少。

另一方面,虽然用仅对先证者进行检测(proband-only)的策略取代核心家系 (trio)策略是可行且经济的,但代价是诊断阳性率的显著下降(译者注:从trioWES的40%降低到先证者模式WES的仅约28%),这主要源于新发de novo变异和等位基因的反式杂合变异往往不能通过仅先证者检测的模式(proband-only)直接判别。

对基因panel或单个基因的NGS测序是最常用的方法,但是诊断率很大程度上依赖于对表型和患者的考察。这取决于临床表型同某种可检测的基因变异之间的相关性和有多少比例的该疾病表型的患者可以用该疾病已知的致病基因来解释。(见FIG. 1)。 N/A表示不适用。

关于儿科基因组学:在儿童罕见病诊断中的应用的后续内容更加精彩,请继续关注明日转化医学网......(转化医学网360zhyx.com)

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发