【重点梳理】染色体芯片与NGS技术在产后遗传检测方向的应用与临床价值
导读 | 5月8日,安捷伦2020遗传与肿瘤学基因检测技术线上研讨会第一场顺利开展。研讨会主要以产后遗传分析为主题,三位专家在线共同探讨了染色体芯片与二代测序(NGS)技术在产后遗传检测方向的应用与临床价值。以下是小编对研讨会内容的重点梳理。 |
王剑 教授
二代测序在产后遗传病检测上的中国应用实践
非常感谢有这次机会能给大家分享二代测序在我们儿科产后的遗传病诊断中的应用实践。随着我们对基因组的了解,会发现现在所有的疾病都或多或少的跟基因组或基因变异有关,从整条染色体的异常到拷贝数的变异再到单个基因的变异。基因的突变或变异,几乎与现在所有的疾病相关。当然有一些疾病呢,特别是罕见病,就有着单基因因素的因果关系。那更多的一些常见病,可能是很多跟遗传相关性的因素,包括环境等等。
以前可能讲到,儿科产后遗传病的产品,更多是在内分泌代谢这些专业比较多,也因为质谱在我们国家普及的相对比较少一点,所以筛出来的一些代谢病比较多一点。那现在我们随着对疾病谱的越来越了解,其实每个临床专业都有很多疾病都跟基因组和基因变异有一定关系,比如血液肿瘤,骨髓衰竭的疾病,心血管心律失常,心肌病,免疫缺陷,肾病综合征,骨骼包括脆骨症等,更多的还是神经肌肉疾病。除了一些典型的肌肉疾病,还包括营养不良,癫痫,智力发育等等。所以基本上现在大家对这种遗传的也是越来越重视了。随着高通量测序的普及,测序价格越来越便宜,我们一点点走近了基因组医学时代。我们人的一生都跟基因组上密切相关。
那孕前的话,一些严重致死致残的疾病,就可以做一些孕前携带的筛查。产前的话,除了一些家族史,随着影像学能力的加强,一些胎儿超声异常的,我们也可以做一些这种胎儿的羊水的高通量测序来检测确定是不是胎儿的一个去留,所以基因诊断在产前产后也会越来越重视。这个系列,除了今天分享的,后面安捷伦也在5月10日上午9:30安排了产前的讨论。
我们出生以后,其实在遗传病这块基本还是越来越普及的。从新生儿的基因的到儿童期的罕见病,病秧子越来越多了。其实这几年,成人科医生也是越来越重视遗传这块了。一些心源性的猝死,家族性的遗传性肿瘤综合征,这些其实都跟某一个基因的突变密切相关的,还包括成人神经科的一些疾病。大家也都是越来越重视,包括老年期很多疾病是跟这种基因组变异相关,当然老年期的疾病我们可能相对关注的比较少一点。
随着高通量测序技术的进步,尤其是在临床应用上。我们首先还是要了解一下它的一个大致这个分类:高通量测序,二代测序,三代测序,全基因组测序,全外显子组测序,还包括一些医学外显子组测序等等。其实从大的层面来说,不管二代测序还是三代测序,都是属于高通量测序的一个范畴。二代测序主要局限在片段只有150个碱基,三代测序读长相对比较长一点。临床应用主要应用的还是二代测序。然后在测序里还分全基因组测序,全外显子组测序,医学外显子组测序,还有包括几十个基因到几百个基因的Panel测序。我们现在总体趋势越来越大,一开始NGS刚起步时基上都是以panel测序为主,因为那时候测序相对比较贵一点,后来主要是以医学外显子或临床为主,这几年以全外显子测序为主,将来可能随着这种生物信息学能力的加强,数据存储设备的提高,我们可能也会在这种全基因组层面增加比例。我相信不可能每个样本都测全基因组,但是它的比例会越来越高。那现阶段的话,到底选哪一个方法比较合适呢?一般我们还是主要遵循这几个原则:
第一,根据疾病对象。一般来说,越罕见的疾病,可能需要全外显子测序,甚至可能要进行全基因组测序。一些诊断相对比较明确的遗传病,而且这个基因也是比较固定的,医学外显子或者是panel就足够了,当然这个时候要看那个距离成本是多少。第二,TAT时间的要求。有的可能时间比较长一点,有的人比较快一点。比如,如果是产前,那我们可能等不及,那可能时间要求比较高,那尽可能选快速的方法。第三个,到底选做一个先证者还是做一家三口?这个其实也是跟每个实验室每个病例的情况不一样而定。其实我们也统计过,就是我们100个人,比如说是精准明确的阳性病例,回过头来其实绝大部分的阳性样本其实不大需要做一家三口。但有些这种罕见疑难病例,如果做了一家三口的话,可以帮排除掉很多模棱两可的候选病。是像产前比较急的情况,直接就做一家三口了。另外也是跟每个人的分析的能力有关。一般来说数据分析的时候,它最好有个父母的背景图在那边,可能最好做一家三口,但我们如果是做的相对比较成熟熟练一点的话,基本上一个先证者就足够了。当然还是要看下父母的基因型,这样可以出报告的时候准确点。如果要节约成本的话,就用一代测序做父母的验证。第四,跟质量密切相关。另外,还要看你想做临床还是做研究,我个人认为如果是产前诊断,这种基本上不确定的型号一般也不是很有必要去测。当然要做研究也是可以需要全外。当然有些病例或许在已知的基因是阴性的,那用全外比较合适,但我的感觉是现在已知的基因是越来越多,其实基因变异的位点可能都不在编码区,都是在那种内含子区,或者藏的比较深的地方,或者结构型的变异。所以其实有时候做全外或者基因组,因为分析能力有限,也不一定马上能找得到。当然这个数据总归是有用的,将来一旦又有新的计算方法一定是有用处的。那我们的宗旨是花最少的费用、最短的TAT时间,得到最大的临床功效。
其实更重要的是NGS实验的基本流程。流程大致其实分两个部分,一部分就是湿实验部分,就是产生数据的一个过程;第二部分干实验部分,就是分析数据出报告的一个过程,好比放射科技师和放射科医生或者病理科技师和病理科医生一样,我们首先需要这种技师来把这个片子拍清楚,然后那个交给后面解读的人,我们这里也是的,就是说首先要产生一个质量比较高的一个数据,那这里面就是目标要保证所有目标去都覆盖,然后所有的变异都被检出,而且检出的这个变异需要是真实的变异。测序的评估的指标包括测序深度、覆盖度、均一性等。
总体来说,其实这里面是非常非常关键的,我们其实前前后后各种各样的数据分析也是多了,我们从0809年就开始接触了二代测序的数据,其实这几年测序数据确实是在不断地进步,但是各个那个厂商的那个在测序数据质量,包括各个品牌的型号的仪器的这些数据其实差异还是蛮大的,有的时候你假的变异太多的话,真的是可能会把真的变异的阳性的给隐藏掉。另外一个,建库也是非常重要的。建库要把想要的东西把它富集起来,不想要的东西就不需要富集,这个时候其实跟探针的质量,包括反应的体系,其实这里面还是各种各的注意的地方还是很多很多的。
第二个还是基因解读部分,就是干实验部分。我们要评估测序产生的数据里,这些变异里哪些是才是真正的犯罪分子。那我们所以要准确解读,然后也要来精准的遗传咨询,因为有些变异可能会有些外显率差异,不光是要按照指南来准确进行解读分类。另外遗传咨询也是很重要的。遗传基因变异解读,主要是三个层面:致病基因,致病变异,疾病的表型。
我们拿到数据后过滤下来的一些变异,首先要看这个变异是哪一个基因上面的,因为我们知道人基因总共有两万多个。在这两万多个里面,可能只有4000多个基因才可以适用于这种临床级别的基因,大部分的基因可能意义不是很大的,跟疾病的关系不是很明确。另外,在4000多个基因里面也分。有些基因可能有个变异以后,可能会增加某个病的百分之七八十的风险。所以我们要报的基因基本上都是这种属于相对明确的一些基因。有些只能作为诊断,因为同样一个家族里面同样一个突变,可能这个孩子有,父母也有这种突变,但是父母可能一点症状都没有。那这种有了症状,然后也找到这个新的基因突变了,那这个时候是可以作为诊断,但是如果是直接用于预测可能会带来一系列问题。
第二个,每个阶段某个变异到底怎么分类?我们基本上是按照ACM的分类,把这些变异分为致病变异,可能致病变异,临床意义未明变异(VUS),可能良性变异,良性变异。一般来说,达到致病变异、临床致病变异的话,然后再结合临床表型,基本上98%以上还是能够诊断的。后面两种情况呢,可能和良性变异差不多。最麻烦的其实是VUS,如果放得松一点的话会报告很多很多的变异,但一般来说我们建议还是稍微增加一点证据,它可以跳到lp的那种级别的,我们建议放上去或者是跟疾病表型相关度比较高的,一般来说很多,就是说离得比较远,但我们尽量还是不要放,因为有的时候放了以后会带来很多很多的麻烦。产前一般只报前面两个级别就行了。
所以报告解读的话,第一个看基因,第二个看变异分类,第三个结合临床表型,有些人表型还未出,那就看遗传证据。这个基因的致病机理都比较清楚,那我们还是可以明确诊断的,那特别像产前的样本等等。
那我们今天的主题,其实是儿科遗传病的高通量测序在国内的应用实践。11-12年的时候,我们主要从以科研为主,逐渐走到临床常规化。美国有美国的一些一系列的流程,国内也是。因为国情还是不一样的,国内测序成本比美国相对高不少。另外,美国的医生很多基本上受过专门的遗传学培训,很多都是由遗传科医生开单。我们国内不一样,因为大家都都没有培训的经历,所以基本上只要家属愿意,每个医生都可以开。但没选对合适的方法,就又浪费钱又没找到基因突变。所以我们还是要建立适合国情的一个方法。医学外显子相对比较好一点,价格相对便宜点,可以检出绝大多数的基因变异。另外,国内可能一家三口的检测费可能会达到上万,所以这些都跟我们国情有关。首先第一步还需要建立适合国情的遗传病诊断规范化流程。第二,建立一种“儿科-产科(生殖)-遗传科”合作诊治体系。因为现在数据越来越多,我们从需求来说,我们诊断的病例中,生二胎就会介绍到产科和生殖科去。或者生殖科或产科还没搞清楚的,那就需要儿科医生来一起评估一下。另外,现在数据越来越多了,我们需要这种专业也越来越专了,就是需要我们多学科的团队的一个合作,就是我们儿科的临床医生,可以从临床表型,大致体现一件事什么样的指明个方向,让我们数据分析也可以结合他们的一个建议或表型提示进一步的评估,然后两者结合起来做到基因型表型的诊治。第三,逐步建立基于人工智能的罕见疑难病辅助诊断系统,就是临床表型与基因组的数据的收集,包括人脸识别系统。虽然现在还有很多疾病,由于病例太少还没办法明确,但是将来随着数据的不断积累,我们还是需要这种人工智能的一些数据的管理来帮助解读。我们在临床实践运用中,NGS技术逐渐取代其他遗传检测技术,渐渐取代了一些经典的遗传学技术。优点基本都是比较正确,缺点就是需要已知的范围,所以高通量测序一点点会取代这些方法。基因芯片在产前还是有很大的优势的,将来的趋势中NGS也在不断的进步。我们统计的364个样本中,有45个样本(12.3%其实是CNV的结果。以前先选芯片,但现在最新的指南应该是先选NGS了,所以都在不断地进步。有的老师也经常会问,NGS检测大的CNV肯定是没有问题,那到具体是能检测多少片段。这个问题很难回答,我只能说探针比较多的话,那就比较精确点,所以区域无法精确。我只能说,外显子其实也能检测,但是前提条件就是说前面一定要有个指路一盏灯,那就是在AR模式里已经找到一个“致病点突变”。比如,这个案例是怀疑“肾上腺疾病”,包括它在STAR基因上存在。
至今已经诊治12000余例遗传病例,包括5000多年罕见的疑难病例;400多种疾病类型,其中至少50种为国内首报。
下面做一个罕见遗传病的分类总结。主要按照“信号通路、作用机制”来分类。第一类,儿童生长发育相关的信号通路,包括生长激素分泌基因缺陷,生长激素通路基因缺陷,旁分泌生长调节因子缺陷,软骨细胞外基质基因缺陷。还有一些跟生长相关的综合征,如以“De novo新生突变”为主的,包括RAS-MAPK信号基因相关疾病和表观遗传调控基因相关疾病;以“隐性遗传”模式为主的。
如果将来唐氏会被筛查得越来越少的话,RAS-MAPK信号基因相关疾病发病率应该不低,发病率重可能还会影响到智力。大部分基因都是AD模式的,除了LZTR1是AR模式。还有,就是表观遗传调控基因相关疾病,包括DNA甲基化,组蛋白末端修饰,染色质核小体重塑。这类疾病早期缺乏表型特异性,但预后较差。
还有个比较有意思的,就是DNA损伤修复通路基因。以前主要是研究的肿瘤,跟生长发育也非常相关。主要包括“生长发育障碍”为主的,“神经系统症状”为主的,“造血障碍”为主的。另外,还有癫痫。癫痫主要是离子通道突出功能的基因突变。其实是一个平衡和失衡的状态,有些基因突变了以后,它可能会获得功能,会影响平衡。所以这些离子通道的基因也是很重要的,离子通道除了引起癫痫以外,还会引起心律失常。还有跟心肌病相关的通路基因,包括肌节蛋白啊,细胞骨架蛋白,桥粒蛋白,核膜蛋白。还有,糖基化障碍和线粒体代谢基因。在不断临床研究探索工作基础上,我们还要进行遗传病“新致病基因”的鉴定。
最后小结一下,儿科遗传病的精准诊治,首先从先证者明确诊断的角度看,临床医生需要从临床表性、基因检测、致病基因、致病变异、多学科会诊等方面进行评估。医学上建议药物、手术、移植、康复训练等等。另外还可以进行遗传咨询、产前诊断和植入前诊断。
陈晓丽教授
基因组拷贝数变异和儿童发育异常性疾病
我就简单说一下基因组拷贝数变异和儿童发育异常性疾病。首先,我先介绍下拷贝数变异,一般指一个1kb以上,但最新的是指长度为50bp以上的基因组拷贝数增加或缺失,又称为亚显微水平的基因组微失衡。由基因组CNV等导致的人类疾病成为基因组病,一般称为XX微缺失综合征,XX微重复综合征。
基因组拷贝数变异和基因单核苷酸变异都是人类基因结构的多肽的表现。前20年随着芯片和全基因组测序的运用,据我发现,基因组拷贝数变异很丰富,超单核苷酸变异。其实基因组拷贝数变异并只是缺失,还有倒位、插入和多个染色体重复。按频率来讲,和单核苷酸变异一样,超过1%就是常见的拷贝数变异。
接下来看基因组拷贝数变异的病因。目前认定了三个形成病因:非等位基因的同源重组、非同源末端连接和复制叉停止与模板交换。第三个是上海复旦大学中山医院张锋教授提出的。在了解这个非等位基因之前,我们先了解一下染色体。染色体会有很多同源序列,或者重复序列。它存在染色体的很多部位,最常见的就是在等位基因。每个人有两对染色体:父源和母源。在每一个等位基因会有很多同源序列。这种同源序或重复序列的目的,其实是用来进行父源和母源的染色体交换。暂时通过这种交换,同源父母生的孩子配子形成的时候会新增多种多样的case,也就造成同一个父母生的孩子会出现不同的这个表型特点,这是人类进化过程中遗传多样性所必需的等位基因同源重组,是我们进化的一个要求。
但是,有时候在染色体减速分裂的过程中,同一个染色体非等位发生 了一些重组,重组之后会出现一个新的染色体,我们叫它衍生染色体。但非等位基因同源重组也可能出现在不同的染色体中。这还是一个衍生染色体。非等位基因同源重组是我们呃人体中基因组病是最多的一大块
重组的机理2,就是双链断裂后的末端修饰。我们知道我们的基因组或者染色体在受到放射或在培养的时候加一些药物的时候,染色体会进行锻炼。但这种锻炼呢,由于我们染色体本身有各种DNA双链修复酶,DNA双链修复酶到相应的位置会引起修复,重新合成可以达到完整的恢复修复作用。
第三个机理就是复制叉延迟致模板重组。染色体在DNA复制过程中,两条链要同时进行复制,一条链是连续性复制。这样的延续性复制的犯错误的概率比较少。还有一条链,是非连续复制。
我在国外时还发现,其实可能在这个复制叉的过程中,可能还存在另外一个机理。由于DNA序列有很多反向回文序列,如果复制叉在非连续性复制的时候,中间DNA模板存下来的一些反向回文序列,这时候DNA本身就会形成一个回文结构,之后选择中间的序列杯,绕在港型的片段之外。由于它本身是一个非连续性的复制,那这时候它就会把中间的区域给忽视了,没有进行复制,那最终这个片段会形成一个缺失。所以微序列要高度同源之外,它旁边有一定的基因组结构,比如是回文序列,还有一些repeat区域,使得他们不断地互相互补,最终导致这个序列直接从上一个复制叉跳到下一个复制叉。
基于这样一个机理,我们会分成两类CNV:再发性CNV和非再发性CNV。后者的意思就是在不同的患者中CNV断点都一样。其原理就是由于基因组里面的这种高度同源序列引发的。它主要就是由于DNA双链修复或复制叉延迟而引起的。那么,可以发现CNV的断点并不完全一样。但是,他们每一个断点左侧和右侧都有一定的相似的同源小序列存在。
CNV导致人类疾病的主要致病机理主要四种。第一种,剂量效应。由于缺失或者重复,那使得这个附近的基因增加了一倍,或者是减少了一倍。那最终基因表达的蛋白的量就不同,就会引发不同的疾病。第二个就是基因融合。由于基因缺失了之后,然后形成一个新的基因,但这个新基因获得一个功能,这个功能可能引发了一系列的表型或者导致疾病。第三个,基因打断。机理其实还是由于打断了基因导致的剂量所丢失引起的疾病。第一就是一个调控原因,就是由于你的调控元件被丢失了,下一个基因无法进行调控或进行正常的表达,引起后面下一个基因剂量发生的变化,出现了一些疾病。在我们目前针对这个CNV的临床致病性的理解上,我们还是主要依靠剂量去进行。这也是美国CNV致病性评估指南的一个主要依据。
我们再来简单了解一下CNV的检测方法。其实也很经常说的很多年了。我们知道儿科疾病它有它的特殊性吧,所以我们首先会容易想到他是有先天性的问题。那先天性的问题,也就是说他可能是本身的遗传物质出了问题。因此呢,在儿科遗传检测方面,遗传性疾病如果想检测拷贝数变异了,在没有WGS检测和芯片之前我们都是采用了区域性的,我觉得他是哪有考虑,我就去检测哪块。那染色体芯片呢,基本上目前除了点突变或者是平衡异位没法检测,其实所有的拷贝数变异都能检测的。所以呢,在儿科和产科肯定是受到实验室的青睐的。这几年随着WES检测,像王剑教授说的,这个染色体芯片会用得相对比较少,但是他对产前来说还是一个很重要的检测方法,尤其是对于伴发低烧检查有异常的,或者胎儿有流产情况,那染色体检查是必不可少的一个,是最重要的这个方法。现在就CRV的检测技术,其实特定区域我们都不去讲了,那我们肯定现在肯定是做全基因组的。其实王剑刚才也说了WES是靠CNV的。如果WES做的质量很好的话,就能很清晰地看到拷贝数变异有一些很好的区域呢,你甚至可以靠一些单基因拷贝数变异。WES肯定是一个趋势,目前可能存在的困难是,因为数据比较大,没有一个消费商业化的流程很简单的来运用的。
染色体芯片分两种:SNP和CGH。如果想了解每一个患者的SNP基因型的话,那可能是SNP芯片要优于CGH。另外,CGH的优势是更敏感,或者是这个CMA拷出来的点会更容易让你知道哪一个点的探针区域出现了异常,至于哪个探针出现异常是看不出来的。不同芯片具有不同的优势。
第三个我们介绍儿童发育异常相关的CNV。我们知道目前是有84个区域的基因组变异是和人类疾病相关的,如果就这个84个区域里去筛查疾病的话,其实筛查率是10-12%。在国内,复旦大学附属儿童医院王慧君团队,他们曾经写过一篇很好的综述,这个综述囊括了123基因组病,有44种再发性和79中非再发性。而这样很详细的列表涉及到每一个区域,患者的症状,核心的基因和染色体的位置这样的一个详细的列表对应,不论是诊断实验室做芯片,还是临床想快速了解一些基因组病,都是特别有帮助。
关于儿童发育障碍,什么样的区域需要做这个芯片呢?老早,波士顿儿童医院的沈亦平教授和David都在国际顶级的遗传杂志和儿科杂志发表相应的综述。David2008年的文章,对多发畸形,儿童发育障碍,或者不明原因的神经发育障碍都应该首选做芯片。沈义平教授发表了一个对于原因不明的孤独症患者发表去做芯片的时候,发现诊断产率能达到7.5%。证明这一一类和二类表型都应该首选去做芯片。后面一些研究又指出,癫痫,语言障碍,身材矮小和肥胖的患者,不是首选芯片,但可能需要去完善芯片检查从而帮助患者完成诊断。因为有一些这样的相应的检查,能达到一个诊断率在5%到7%至15%。
CMA在儿童发育障碍诊断中的局限性和不合适指标:点突变和小片段插入,不合适单或多基因点突变为致病机理的疾病,比如脆性X综合征;染色体平衡易位,倒位及复杂性重排;不能筛查低水平小于10%-20%的嵌合体(和探针数目无关)。
基因组病常常纠结的是外显率差异。没有明确抑制的表型不代表该拷贝数不致病。
第四个,简单介绍一下这个染色体芯片检测中CNV的评估。安捷伦5月10日早上9:30还会有产前专场研讨会,所以我们只说一下产后对于儿科的一些方面。首先你评估的一个前提就是说这是一个真实的事件,然后明确检出的最小的长度,并在《检测方法局限性》给标注。然后在这个基础上面才去进行评估。
第二个,这个评估它适合我们认为的生殖细胞的拷贝数变异,而不是体细胞,也适合儿科遗传细胞。
美国很早就开展了CNV临床致病性评估指南建设。最早,他们是分为三级,2011年2评估时,分为致病性,临床意义不明和良性;2013年,把临床意义不明进一步分成了可能致病,临床意义不明和可能良性;2020年,还是保留最后一个五个等级的分类,但是2020年也就是去年年底发的那个指南嘛,他其实把这个五个分类呢,通过量化的一些指标,然后来区分达到多少分以上才能评为这样一个五类。这样就把这个五类分类给予了一个量化的一个评分的框架,它的目的其实就是希望各个实验室的之间的评估能能够一致,还要把致病性分类与临床表性区分开,这是最核心的两个要点。为了评估增加依据,他们后面在拷贝数缺失的评估里,又把单核苷酸变异中评估的一些依据拿来利用,那使得我们在这个评估和缺失的时候,就可以减少VUS评估结论的发生。2016年,沈义平教授和于永国教授等还写了一篇文章,关于染色体基因组芯片的儿科遗传学的临床应用。
第五点,CNV正常的杂合子丢失的评估原则。杂合性其实是指肿瘤事件,就是体细胞事件。儿科一般不建议用,我们会用到纯合状态或者区域,亲属关联程度,或者单亲二倍体。CMA中ROH区域中,如果是SNP芯片的话,我们会看到两条线,那它是属于纯合区域,如果整个基因组都有大量的纯合区域,我们会考虑他有亲源关联程度。也就是我们考虑他可能是有近亲,有亲属关系。如果ROH发生在单基因或者或者是一个基因的部分区域,那我们这时候我们才会用到UPD。如果我们在一个患者看到很多区域都是有这种ROH,那我们要把这些ROH叠加起来,然后进行计算。
当CMA一整条染色体存在ROH区域,它就属于印记区域,可对受检者和父母进行MLPA分析。如果无印记基因,就需要考虑是否有隐形遗传病危险。
最后就简单说一下临床医生怎样快速上手开展CNV评估。首先,可以先把抑制的基因组病打印出来了解了解,把这些排除一下。另外,有一些常用的数据库。第三个就是了解剂量敏感基因和遗传模式。最后一步才需要去检索文件。
张鸿明
安捷伦产前产后最新细胞遗传学芯片
aCGH+SNP与NGS检测方案
5月8日,也是第27个世界地中海贫血日,所以,我希望通过这种在线讲座的方式,从技术上增进我们对罕见病的防控能力。我今天讲的内容,大概分五个方面。前两个方面主要是介绍我们安捷伦的CGH和CGH+SNP的芯片。第三和第四部分,分别是介绍NGS。第三部分主要就是介绍我们全外,特别是针对罕见病全外的产品和技术。第四部分主要介绍我们目前安捷伦可以替代WGS的一个技术,这可以同时检测SNV和CNV的。第五部分是前两位教授讲到的数据分析和解读的安捷伦解决方案。
首先,我们来看一下我们的这个基因芯片这块的内容。我们今天主要介绍的是安捷伦的aCGH+SNP基因芯片。用这个芯片比较病人的和正常的基因组看看有没有变异,所以我们把这块叫做比较基因组杂交芯片,简称CGH芯片。它实际上是一个定量的范畴。另一块陈教授也谈到了,就是SNP芯片。它实际上是根据SNP信息定性,设计SNP探针,从而检测基因组多态性和基因型。为什么我们今天还在讲CGH呢?因为在这个目前产前和儿科,很多学会仍然把CGH去作为拷贝数检测的一个金标准。ACMG很多指南也推荐CGH为侵入性产前诊断的一线检测方法。这个之前王教授也谈过。第三,就是CGH比较稳定,很容易在单个实验室就实现,从头到尾达到数据样品的制备,数据的分析和报告解读等,这个过程它不需要呢专门的生信团队,2-3天就能出结果和报告。所以说CGH在传统的FISH, NGS, MLPA里面有一席之地的。
安捷伦的芯片有什么特点呢?安捷伦芯片分为一层,二层,四层和八层。那怎么理解呢,就是一张芯片上我们人为地划分了几个独立的方块,比方说我们做四层,那就是在我们在一张芯片上划分了四个方块,那么每个方块都可以独立地进行杂交,也就是换句话叫每一个方块就是一个样本。里面的44k就是探针的密度,也就是一张芯片有44000个探针。所以我们在这里要还要跟大家提醒一下过去呢,我马上就来呢,是推出的是4x44k。但陈晓丽教授讲的更多的是4×180k,比如说我们的密度是增加的,同时分辨率也是大大提高了,但随之噪音也多,不同厂家比较分辨率最直接。产前的包括羊水穿刺,包括唾液取样外周血的都是可以适合的。我们的芯片有分为4×180k的,2x400的。实际上就有很多这个芯片有带SNP的,和不带SNP的,那我们在临场选的时候有两个标准,一个是性能,第二个是价格。还有个维度呢,就是要考虑到这个探针的数量和分辨率的问题,所以在临床上我们现在用的比较多的还是用4×180k和8×60k的两款芯片。今天讲的这两款芯片实际上也是4×180k带SNP的和不带SNP的,也包括8x60k的。这两块芯片的格式包括规格,我们早就有了,但是为什么这次我们就要新的呢?因为这两块芯片会更加贴近个新的指南新的数据库的更新。
GenetiSure Cyto CGH芯片专注于重要的遗传病致病区和基因,有四大优势。第一,芯片探针设计专注于基因和需要CGH分析的重点区域,这包括来自ClinGen, ClinVar, OMIM和儿童生长发育障碍基因型-表型关联数据库等临床相关的数据。第二, 为方便芯片数据解读,芯片骨架探针在染色体端粒和PAR区域增加了覆盖度。第三,高质量的探针确保检测拷贝数变化和嵌合体,有较高的特异性和灵敏度。第四,预留探针设计空间。这也是在国际细胞标准委员会的基础之上做的优化和升级。
然后,介绍下三款芯片:GenetiSure Cyto 8×60k CGH芯片,GenetiSure Cyto 4×180 CGH芯片和GenetiSure Postnatal 2×400k CGH+SNP芯片。前两款的都是CGH芯片,第三款是带SNP探针的。但细心的会发现,中间这个基因数明显少一些。从分辨率来看,基因数越少分辨率越高。也就是说基因少,放的探针多了,使得分辨率越高。我们在端粒和PAR区域也增加了探针的分布,使得分辨率。还有一个就是灵活性,以及控制一定自由的空间。如果希望加入一些特色的监测区域呢,我们也可以定制一些探针放上去。我们这块新的特点呢,就在于说我们家追加了SNP探针的密度,使得我们检测的分辨率有过去的5mb到现在的2.5mb了。所以三款芯片,各有千秋,各有特点,所以在临床应用的时候,我们要根据这个临床的适应症的范围选择不同的芯片。那么,带SNP和不带SNP的操作上有什么区别吗?带SNP的中间有一个酶切过程,其他流程都一样。
最后呢,我总结下,我们拿到数据之后,怎么样来做数据分析和数据的解读?实际上我们的基因芯片的数据分析和解读相对NGS来讲,还是相对要容易的。只需要一台桌面电脑啊,就装一下安捷伦的CytoGenomics Software CGH+SNP芯片数据分析与解读的软件就行。如果在临床上的确认,我们安捷伦还有一个软件叫Alissa Interpret,那么这个软件是得到美国FDA和欧盟CRV认证的专门用于解毒的一款软件。
全外特别是针对罕见病全外的产品和技术,推出了Agilent SureSelect外显子探针/试剂盒。主要从三方面来看:性能,内容和灵活性。CREv2探针设计提升5109个致病基因的覆盖度。Agilent全外在不同GC含量区域的均一性更好。CREv2囊括了迄今发现的所有与疾病相关的基因,可变剪切位点,内含子区域和与疾病发生相关的非编码区。最后呢,要考虑到灵活性,在临床之外,入王剑教授想研究线粒体,我们可以把线粒体探针放进去,和临床全外进行组合。那么我们的V7呢?啊,也是这样的,也是这么一个概念。
接下来我们跟大家介绍一个新的技术,叫OneSeq。相对于WGS来讲,他的这个数据量包括数据分析的相对应该说容易一点,但是它的功能上,它可以实现同时CNV,LOH,SNV & indels。一次性就可以把所有的病例都检测出来。我们探针的设计还是基于捕获杂交的一个原理。根据它的分辨率,我们分为两类,一个300kb的,一个是1M的。实际上我们选用300kb的这个分辨率在ClinGen这个区域可以达到25到50kb,基本上就囊括了所有的。但如果是1M的话呢,就是大部分是囊括了这边,我要提醒大家在选择产品的时候一定要细细的研究一下。然后我们做了OneSeq全基因组的这个科学技术之后,我们和刚才前面讲的CGH芯片做一下平行比对。你会发现这两者这两个技术的重现性和一致性是非常好的。在不同的这个片段大小的情况下,两者的表现都是非常一致的。
(转化医学网360zhyx.com)
还没有人评论,赶快抢个沙发