强强联合:在CRISPR/Cas9相关研究中应用新一代测序技术
导读 | 近两三年来,另一种从细菌的获得性免疫系统发展而来的革命性的基因操作工具CRISPR/Cas9受到广泛关注,其应用和影响范围仍在不断扩大。CRISPR/Cas9系统的发现与DNA测序技术分不开,它的发展与推广仍然得益于DNA测序技术。CRISPR/Cas9技术与近五、六年来同样快速发展的DNA新一代测序技术(Next Generation Sequencing, NGS, 也称高通量测序技术)相结合,不但可以使研究者高效快速地得到一些实验结果,也拓宽了这一技术的应用范围。 |
摘要:
CRISPR/Cas9基因组编辑技术和新一代测序技术(也称高通量测序技术),是当今对生命科学研究有重大影响的两项技术。二者并非毫不相干。有效地将二者联用,有时可以大大加速科研进程。两者之间有什么样的联系呢?在哪些研究领域或方向上可以联用呢?本文根据在这两个领域的技术服务经验,对相关内容进行了系统地整理。
一.引言
在分子生物学的发展历史中,人们曾经不止一次地从微生物的某些生命活动中得到启示,发展出了对于DNA操作有重要意义的工具,如分子克隆用的限制性内切酶和PCR用的耐热聚合酶。它们为分子生物学的发展带来了革命性的影响。近两三年来,另一种从细菌的获得性免疫系统发展而来的革命性的基因操作工具CRISPR/Cas9受到广泛关注,其应用和影响范围仍在不断扩大。CRISPR/Cas9系统的发现与DNA测序技术分不开,它的发展与推广仍然得益于DNA测序技术。CRISPR/Cas9技术与近五、六年来同样快速发展的DNA新一代测序技术(Next Generation Sequencing, NGS, 也称高通量测序技术)相结合,不但可以使研究者高效快速地得到一些实验结果,也拓宽了这一技术的应用范围。
二.CRISPR/Cas9系统简介
CRISPR/Cas9技术的产生与DNA测序技术的进步密不可分。1987年在对大肠杆菌E.coli K12的一个区段的测序结果的分析中,研究者首次发现细菌了碱性磷酸酶基因附近存在着成簇的规律间隔的短回文重复序列(Clustered Regularly Interspaced Short Palindromic Repeat, CRISPR)。在接下来的十多年间,随着DNA测序技术的飞速发展,微生物基因组测序数据显著增多,更多的CRISPR在细菌和古细菌中被发现。据估计40%的细菌和90%的古细菌基因组具有CRISPR结构。CRISPR 由一系列短的高度保守的正向重复序列(repeats) 与长度相似的间隔序列(spacers)间隔排列组成(见图1)。本世纪初,CRISPR位点附近的、高度保守的Cas基因(CRISPR-associated genes)引起了研究者关注。Cas基因是一类基因家族,编码的蛋白具有与核酸结合功和核酸酶、聚合酶、解旋酶等活性。2005年,得益于病毒、质粒测序数据的日益丰富,通过对测序数据的系统分析,研究者推测间隔序列可能与外来的病毒、质粒有关。通过一系列的研究,人们认识到Cas基因可以与CRISPR序列协同作用,使细菌对病毒具有获得性免疫功能,而间隔序列则编码引导Cas蛋白定位的向导RNA的部分区段。
根据Cas基因的不同,人们将CRISPR/Cas系统分为I-III三类。其中II类CRISPR/Cas系统包含一个Cas9蛋白。这类系统最先在改造后用于小鼠和人类基因组编辑,同时也是目前研究最为充分的系统。它只需要单独的Cas9蛋白即可在gRNA(guide RNA)的引导下完成对DNA的定点切割。Cas9蛋白可以通过突变改造为具有不同功能的衍生蛋白,例如只具有DNA结合功能而无切割功能的dCas9和只具有单链切割功能的Cas9n(也称nCas9) 等。Cas9蛋白行使功能需CRISPR转录而来的crRNA与反式激活的、与CRISPR 重复区互补的tracrRNA (trans-activating crRNA,tracrRNA) 形成的复合物参与。为了操作简便,研究者将crRNA和tracrRNA 融合进同一条单链中,设计出单链引导RNA(single guide RNA,sgRNA)。对靶序列有效的切割还需靶序列相邻的原型间隔序列毗邻基序,即PAM (protospacer-associated motif)。图2显示了CRISPR/Cas9 系统的主要元件。为了增强系统的特异性或实现某些特定的功能,除了前面提到的对Cas9蛋白的改造外,一些实验室还对有的元件进行了其它方面的改进。
三.CRISPR/Cas9技术的应用领域
对生物体包括人类自身的基因组进行高效自由地操作是许多生命科学和医学工作者的梦想。与传统的基因打靶、ZFN和TALEN等基因组操作技术相比,CRISPR/Cas9技术简单、高效,也不失精准。它已经成为基因组工程的有力工具。它在生命科学基础研究、生物技术和医药领域有广泛的应用前景。短短一两年,该技术成功应用于动植物及微生物的报道已屡见不鲜。在生物学基础研究领域,它有助于快速解析基因功能及基因间的相互作用;在生物技术领域,它有助于定向育种,有助于抗逆、高产或有特殊经济性状的作物或菌种的培育;在医药领域,利用它可以快速建立疾病模型,可以进行基因治疗和新药开发。CRISPR/Cas9的推广和应用步伐可谓一日千里。
四.CRISPR/Cas9技术与新一代测序技术的联用
革命性技术总是发展迅速、应用广泛的。作为另一项革命性的生命科学研究技术,DNA新一代测序技术在近五、六年得到快速发展和推广。它已经用于生命科学相关领域的许多方面。同样地,也可以用在CRISPR/Cas9相关的研究中。两者之间的应用领域有许多交叉或重合。
1.高通量测序可用于检验CRISPR/Cas9基因组编辑的结果,以及进行脱靶效应的分析
编码Cas9和sgRNA的片段通过质粒或其它途径转染进细胞后,Cas9在特异的位点对目标基因组进行切割,引起DNA双链断裂 (double-strand break, DSB),通过非同源末端连接(nonhomologous end joining, NHEJ)或同源重组(homologous recombination, HR),产生DNA的插入或删除(indel),或者依赖于含有特异突变的同源模板,进行目的位点的定向改造。基因组编辑的结果需要确认。对于目标位点或计算机预测的脱靶位点,除了用核酸酶进行电泳分析检测外,还可以用DNA测序方法确认是否有变。当需要检测的样品较少或靶位点较少时,可以采用Sanger测序。当样品或靶位点较多时,适合采用高通量测序。这需要用测序引物对靶位点进行PCR扩增,然后对扩增子(amplicon)测序。几种当前常用的高通量测序平台均被不同的实验室采用过。因为不同的高通量测序平台测序的最大读长不一样,需要注意扩增产物的长度和测序引物的位置。曾有报道,读长较长的SMRT DNA 测序对于基因组编辑的结果评估也很有意义。
CRISPR/Cas9的特异性是人们对该系统关心的一个问题。 它被关注后不久有报道提出了CRISPR/Cas9的脱靶问题。脱靶效应与诸多因素有关,如sgRNA自身的特征、浓度及其与Cas9的相对量多少等等。人们通过改造这个系统的元件或采用不同的策略增加基因组编辑的特异性。尽管一些文献报道,对人类iPSC进行CRISPR/Cas9编辑具有很高的特异性,人多能干细胞中的脱靶突变发生率很低,但基因组编辑的安全性仍然是人们担心的一个问题,尤其在基因治疗领域。全基因组测序(whole genome sequencing )可以对整个基因组进行单碱基分辨率的检测,当CRISPR/Cas9用于基因治疗等对安全性要求较高的领域时,有必要采用这一方法检测基因组编辑的效果。当前已有不少对CRISPR/Cas9编辑后的基因组进行全测序的实例。
对于基因组比较大的生物体来说,全基因组测序花费毕竟是高昂的。那么,此时如何了解CRISPR/Cas9 在某种生物或某类型的细胞上是否容易脱靶呢?对于目标区域进行富集,然后对富集的片段进行高通量测序,是一种策略。对于DSB区域的富集与检测,曾报道过BLESS 法(Breaks Labeling, Enrichment on Streptavidin, and next generation Sequencing )。最近,J. Keith Joung 领导的小组报道了一种检测方法,称为Guide-seq (Genome-wide, Unbiased Identification of DSBs Enabled by sequencing)。这种方法的过程是,使活体细胞吸收双链寡核苷酸(double-stranded oligodeoxynucleotides,dsODN)标签并整合进基因组断裂位点,抽提基因组DNA,进行随机打断和末端修复加高通量测序接头等操作,然后依据dsODN的专有序列进行PCR扩增,富集出包含dsODN的片段,对收获的片段进行高通量测序,分析Cas9的切割位点(过程示意见图3)。它适合临床前对所采用的CRISPR/Cas9在某类细胞中的应用风险进行评估。
在进行CRISPR/Cas9脱靶效应分析时,有些研究者采用了染色质免疫共沉淀结合高通量测序的方法(chromatin immunoprecipitation and high throughput genome sequencing, ChIP-seq),通过特异性的抗体捕获Cas9或其衍生物结合的DNA片段。这也是一种富集测序策略。
2. CRISPR/Cas9技术与高通量测序结合用于研究基因的功能
Cas9包含两个活性区域,即RuvC 和 HNH 结构域,各负责切割一条DNA单链。当只有一个结构域引入突变时,Cas9可被改造成为切口酶(nickase)nCas9。nCas9与两条不同的sgRNA联用可用于较大片段的置换,也可增强编辑的特异性;当两个结构域同时引入突变时,Cas9内切活性丧失,成为dCas9(dead Cas9), dCas9仍能与靶区域结合。dCas9 可以用来开启或关闭某些基因的表达。它与目的基因启动子区域或编码区段时,可能由于空间位阻效应阻挡了转录因子或 RNA 聚合酶与 DNA 的结合,从而抑制转录。将dCas9与转录调控因子如KRAB的抑制区融合,可抑制靶基因,这就是CRISPRi(CRISPR interference);dCas9也可与VP64的激活区结合,激活靶基因。dCas9的这种特异性调控功能,与 RNA-seq相结合,可以用于许多基因功能相关的研究。CRISPRi用于真核生物时甚至比RNAi还具有优势。
不通过RNA-seq这种方法,CRISPR/Cas9技术与高通量DNA测序结合也可进行功能基因组学研究。国内外一些研究者已经通过CRISPR/Cas9技术建立可能与某类功能相关的突变体库,通过功能性筛选和富集、PCR扩增以及深度测序分析,确认与这类功能相关的基因。
3. 新一代测序的结果,为CRISPR/Cas9技术的应用提供了对象
新一代测序技术既可以在全基因组或全转录组范围内筛选出基因或其转录产物的变化,也可以在某个局部范围(如外显子组内)考察基因的变异。这项技术适合在其它线索很少的情况下(如基因位置信息)筛选出与某些功能相关的、变异的目标基因。这些目标基因的具体功能可以用CRISPR/Cas9技术进行研究。
例如,CRISPR/Cas9技术与高通量测序技术相结合,在药物开发中可用于快速发现药物的靶标并进行有效、直观的验证。这对探究药物的药理、毒理或细胞的抗药机理非常有意义。它是一种可用于反向遗传学的技术,可以从另一角度验证正向遗传学的结果。先用药物处理细胞,选出药物抗性克隆,对这些克隆进行新一代测序,找出候选的基因突变,这些基因的产物可能是药物的靶标。如何确认某一(或某些)候选基因突变导致药物抗性?研究者们采用CRISPR/Cas9技术突变这一(或这些)基因,观察细胞是否出现抗性。在这类研究中,用新一代测序大范围内快速发现候选的基因突变,非常有必要。有些研究者通过对基因组测序发现侯选的突变;有人则为了兼顾研究基因表达情况,采用了转录组测序的方法进行突变检测。
再如,对于肿瘤组织与癌旁组织进行转录组测序,选出某些差异基因,再用CRISPR/Cas9 系统验证这些基因的功能,也是对肿瘤相关基因进行研究的一条策略。
总之,新一代测序可以为许多进一步的研究(包括利用CRISPR/Cas9技术的研究)找到切入点。
4. 新一代测序可以用于研究自然界存在的更多物种的CRISPR/Cas 系统
CRISPR/Cas 是一类基于基因的功能系统,它自身也可以用新一代测序技术加以研究。前文已提到,自然存在的CRISPR/Cas 系统有多种类型,CRISPR/Cas9只是其中的一类。深入研究和了解不同类型的CRISPR/Cas 对于充分认识和利用这类系统很有必要。譬如,利用RNA-seq 技术,有人在不同的微生物发现新的CRISPR位点;有人则用RNA-seq 探索了CRISPR RNA 的加工(processing)和调节机制。也有作者利用高通量测序技术研究了CRISPR位点间隔区(spacer)的获取机制。
五.结语
新一代测序技术和CRISPR/Cas9基因组编辑技术,是进入二十一世纪十几年来先后发展出来的两项影响较大的遗传学研究技术。像PCR技术一样,两者已经大大推动了生命科学相关领域的研究。在科研中将两者有效地联用,不但可以带来事半功倍的效果,也有助于解决许多悬而未决的技术问题。(转化医学网360zhyx.com)
还没有人评论,赶快抢个沙发