HiSeq V4 PE125 测序有些什么新应用？

首页 » 产业 » 产品 2014-09-10 陈巍学基因赞(4)

导读	自Illumina在2014年6月正式把HiSeq V4 PE125的测序试剂推上市，至今已有3个多月，各家主力测序服务公司也已把自己的主力测序平台调整到 V4 PE125上来。

自Illumina在2014年6月正式把HiSeq V4 PE125的测序试剂推上市，至今已有3个多月，各家主力测序服务公司也已把自己的主力测序平台调整到 V4 PE125上来。

V4 PE125 的测序方式，除了大家已知的比原 V3 PE100 更长、更快、产更多数据之外，在应用上有哪些更强于 V3 PE100 的地方？

我总结了以下几点：

上图摘自论文《HIP1–ALK, A Novel ALK Fusion Variant that Responds to Crizotinib》，图中展示了一个read跨2个不同的基因，多个reads重复出现的这个跨越位点，证明了融合基因的存在

融合基因是导致肿瘤的一个重要原因，例如：RET/ALK/ROS等基因与其它的有高表达启动子的基因形成融合基因，是已知的最具代表性的融合基因致癌实例。融合基因往往是在重复序列处发生融合。

以往测PE100时，因为建库插入片段一般是180bp，所以Read 1和Read 2之间的交叠不够多，只有20bp左右，所以一般不把Read 1和Read 2合并，是分别拿一个Read的两端去与参考基因序列比对。

现在，因为读长到了PE125，建库还是180bp左右的插入片段，所以交叠的部分很长，完全可以把Read 1和Read 2合成一个新的长Read 3，拿Read 3来与参考基因组进行比对。扣掉左、右各30个碱基，中间还有120碱基可以是融合位点。同样的Reads数，发现融合基因的效率一下提高了50% （120 / （40*2） = 1.5）。更长的Read 3还有助于克服融合位点附近重复序列带来的不确定性。

上图摘自药明康德公开宣传册，左边是未过滤前的PDX模型测序数据，其中有18415条是鼠的DNA序列；右边是经过过滤后的结果，其中鼠的DNA序列下降到915条

在PDX实验（PDX，Patient Derived Xenograft，裸鼠带移植瘤动物模型）中，对裸鼠身上长的肿瘤进行测序，以确定肿瘤的基因突变型，是很重要的一步。因为只有知道了突变型，接下来的靶向药物才真正有了“靶子”（也就是变成了的驱动基因）。

用Agilent捕获外显子组测序时，文库的插入片段一般是180~200bp的长度。现在用PE125方式来测序，左、右2个Reads（Read 1和Read 2）之间可以有50bp以上的交叠，完全可以拼出一个新的长度为180~200bp的“Read 3”出来。

用新拼出的Read 3来与人、鼠两个物种的参考序列比较，就很容易判断这个序列来自于人、还是鼠。有人计算过，读长100bp,可以过滤掉99%的鼠序列；读长达到150bp时，可以过滤掉99.7%的鼠序列。现在读长达到180bp，过滤的准确性一定还会进一步提高。

从原来的PE100读长增加到PE125，虽然没有MiSeq PE300的读长带来的构建长contig的优势那么明显，但是因为HiSeq V4的测序每G数据的单价只有MiSeq的约1/4，所以，HiSeq V4 PE125带来的De Novo优势也是注得关注的。

高通量测序，一路延着摩尔定律飞奔：更多、更长、更快、更准、更便宜。

技术的每一次进步，都让我激动不已，相信明天会有更多新性能、新技术、新应用在迎接我们。

评论：

共有 0 条评论