推荐活动

HiSeq V4 PE125 测序有些什么新应用?

首页 » 产业 » 产品 2014-09-10 陈巍学基因 赞(4)
分享: 
导读
自Illumina在2014年6月正式把HiSeq V4 PE125的测序试剂推上市,至今已有3个多月,各家主力测序服务公司也已把自己的主力测序平台调整到 V4 PE125上来。

自Illumina在2014年6月正式把HiSeq V4 PE125的测序试剂推上市,至今已有3个多月,各家主力测序服务公司也已把自己的主力测序平台调整到 V4 PE125上来。

V4 PE125 的测序方式,除了大家已知的比原 V3 PE100 更长、更快、产更多数据之外,在应用上有哪些更强于 V3 PE100 的地方?

我总结了以下几点:

  • RNA-seq,更好地发现融合基因

上图摘自论文《HIP1–ALK, A Novel ALK Fusion Variant that Responds to Crizotinib》,图中展示了一个read跨2个不同的基因,多个reads重复出现的这个跨越位点,证明了融合基因的存在

    • 融合基因是导致肿瘤的一个重要原因,例如:RET/ALK/ROS等基因与其它的有高表达启动子的基因形成融合基因,是已知的最具代表性的融合基因致癌实例。融合基因往往是在重复序列处发生融合。

    • 要发现融合基因,测到RNA中一个Read跨两个基因,是最直接的证据发生融合基因的证据。

    • 以往测PE100时,因为建库插入片段一般是180bp,所以Read 1和Read 2之间的交叠不够多,只有20bp左右,所以一般不把Read 1和Read 2合并,是分别拿一个Read的两端去与参考基因序列比对。

    • 这样,在PE100的测序方法中,左边要有30个已知的碱基与A基因完全比对上、右边也要30个已知的碱基与B基因完全比对上,中间就只有40个碱基可以是融合位点。

    • 现在,因为读长到了PE125,建库还是180bp左右的插入片段,所以交叠的部分很长,完全可以把Read 1和Read 2合成一个新的长Read 3,拿Read 3来与参考基因组进行比对。扣掉左、右各30个碱基,中间还有120碱基可以是融合位点。同样的Reads数,发现融合基因的效率一下提高了50% (120 / (40*2) = 1.5)。更长的Read 3还有助于克服融合位点附近重复序列带来的不确定性。

  • 外显子组测序,更高效地去除污染DNA

  • 上图摘自药明康德公开宣传册,左边是未过滤前的PDX模型测序数据,其中有18415条是鼠的DNA序列;右边是经过过滤后的结果,其中鼠的DNA序列下降到915条


    • 在PDX实验(PDX,Patient Derived Xenograft,裸鼠带移植瘤动物模型)中,对裸鼠身上长的肿瘤进行测序,以确定肿瘤的基因突变型,是很重要的一步。因为只有知道了突变型,接下来的靶向药物才真正有了“靶子”(也就是变成了的驱动基因)。

    • 小鼠与人都是哺乳类动物,两者的基因组序列的差异大约是5%。也就是绝大部分相似,但又有少量的不同。

    • 在测序结果中要确定人的基因突变,就必须先过滤掉那些似是而非的鼠的基因序列。

    • 在过滤过程中,读长是最主要的过滤有效因素。读长越长,则过滤的准确性越高。

    • 用Agilent捕获外显子组测序时,文库的插入片段一般是180~200bp的长度。现在用PE125方式来测序,左、右2个Reads(Read 1和Read 2)之间可以有50bp以上的交叠,完全可以拼出一个新的长度为180~200bp的“Read 3”出来。

    • 用新拼出的Read 3来与人、鼠两个物种的参考序列比较,就很容易判断这个序列来自于人、还是鼠。有人计算过,读长100bp,可以过滤掉99%的鼠序列;读长达到150bp时,可以过滤掉99.7%的鼠序列。现在读长达到180bp,过滤的准确性一定还会进一步提高。

  • De Novo

    • 长读长在De Novo中的意义,我就不多解释了。

    • 从原来的PE100读长增加到PE125,虽然没有MiSeq PE300的读长带来的构建长contig的优势那么明显,但是因为HiSeq V4的测序每G数据的单价只有MiSeq的约1/4,所以,HiSeq V4 PE125带来的De Novo优势也是注得关注的。

高通量测序,一路延着摩尔定律飞奔:更多、更长、更快、更准、更便宜。

技术的每一次进步,都让我激动不已,相信明天会有更多新性能、新技术、新应用在迎接我们。


评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发