推荐活动

实录 | 2019年第六届NGS创新开发者大会(一)

首页 » 产业 » 会议 2019-04-27 转化医学网 赞(3)
分享: 
导读
2019第六届NGS创新开发者大会于4.26在杭州宝格丽雅国际宴会中心盛大开幕。

主题:2019第六届NGS创新开发者大会

时间:2019426日上午

地点:杭州·宝格丽雅国际宴会中心

提示:实录中所涉及图片详情请查看大会图片直播 https://live.photoplus.cn/activity/live/pc/2731989/#/


开幕主持人—王学刚

主持人:尊敬的各位来宾、朋友们!2014-2018年是向稳同学发起的基因科技创新者大会的第一个五年,201942日,向稳在一个细雨绵绵的深夜里(我估计有雨水和泪水),饱含深情写了一个NGS大会的回忆录。和大家一样,作为行业从业的一员,我逐字逐句地看了,也是百感交集,像一首歌,像一杯酒。那些淡淡的回忆,凄凄切切,来回拉扯。我们时而思考全民健康的未来,时而思考个人的未来,时而思考这个行业的现状和前景,时而思考着基础技术应用的现状,时而恨,时而爱,有爱有恨。但是我们今天既然聚到这里,相信我们都是无怨无悔。今天我们聚到一起,为的是当初的约束,为的是下一个五年。在这里,我正式宣布—2019第六届NGS创新开发者大会正式开始!

按照会议的习俗,我们不太邀请领导讲话,我们谈的都是行业的现实问题,但是这次的会议还是前期和生物医学工程学会康熙雄老师做了很深入的沟通,觉得现在创业者和学会之间的关系可能要做一些重新的梳理,所以这次也很荣幸邀请到康熙雄老师。下面,有请康老师为开幕式致辞!

康熙雄:尊敬的各位!我以非常激动的心情站在这里,NGS这个单词大家非常熟悉,已经大致有了将近20多年的历史,但是从中国NGS团队的活动来讲,大致就像刚才学刚讲的这样,今年算是第六届,但是NGS发展到N·GS,这可能是今天值得大家庆贺的一件事情。NGS是什么情况呢?我觉得是五个方面的组成:写码的人、测码的人、读码的人、解码的人、用码的人。实际上,作为我来讲,我是一个用码的人,我只会用,不会前面三个,我往往是在这阶段里。虽然我是从事了将近50年的所谓的健康行业,但是到现在好多新的知识对我来讲是非常新鲜的。而且,往往是因为时间长了,所以总是站在以评价人的角度上思考问题,但是这个评价人必须得是了解人,了解这个码,为了了解码,我在我们现在的微信里拜读过在位各位好的文章,但是今天有好多人是第一次见到的,而且第一次确认,确实是我们这次会议里所集中的人,绝大多数是我的老师,我是以学生的身份来这里和大家一起交流。因为,测码、读码和解码对我来说是一个新的知识。因此,我借此机会向让我领教过很多好文章、通俗易懂文章的各位老师们表示敬意,谢谢各位老师!

有关这次的会议,我感到很新鲜,上次学刚开了一个开发者大会,是在北京,在那里我认识到开发者群体的萌芽,在这次会议上,也认识到了向稳总,而且也听到了这几年所开展的相关活动。在这个过程中,我恰恰是求知欲非常旺盛的时候,我的求知欲在哪儿呢?因为在中国的体系里有一个评价体系,这个评价体系是所谓的认可体系,这个认可体系主要的权利集中在于国家的食品药品管理局(CFDA),在那里我经常参加评价有关的创新项目过程中,碰到了好多问题,但是实际上在好多问题对我自己来讲不是非常熟悉的领域。所以那天向稳和我说,我们一直是开展着这样的活动,问我有没有兴趣,我非常的感兴趣,有了这个以后,有了非常好的向大家学习的机会,以后更准确地、科学地评价我们国内相关产业的创新项目,所以我非常欣然地同意了。而且在那次会上和向稳一起讨论,我们能不能把这些事情走上正规,恰恰昨天晚上我12点到了饭店以后,读到了他的文章里有这么一句话,“前五年,我们一直是用人来推动了我们这次会议,在这里饱含着刚才所说的泪水和汗水”。第二句话说的是“我们想把这个会议走上轨道上,体系化、正规化和规范化”。

实际上NGS大会,我觉得还是非常好的一个状态,自然发生的,非常茁壮地成长的这样一种会议,在这里它不仅是形式多样,而且所需要解决的问题解决的非常好,所以前五次大会我通过他的文章中读到了,它是一个向上的、动态的、形式多样化的这么一种会议,而且每年的主题在变化着,根据社会的需求在编制着这么一个会议,所以从形式上来看,也是逐步向前发展的这么一个会议。我觉得这次会议叫做“协作创新”,当然协作一定要从全国相关的专家们合作在一起共同向前推动,因为我们中国所谓的大数据实在是还不成熟,协作的过程中一定要创新,创新的过程中向前走,那么创新的过程里主要的是什么呢?向解决人类健康问题上靠拢,这很可能是我们创新里最后的主题。所以今天和明天的会议议程里,我觉得安排的非常丰富,不仅有解决问题的,比如说像顾大夫论坛,还有好多具体的更向着解决问题的,就像我这个角度,就是用码的这个身份上的内容。还有好多新的发展的技术平台以及相关的一些领域,这是一个情况。再一个是后面的所谓的开发者论坛里有好多具体的如何开发新的领域,比如说NGS变成为N·GS等等,这个N怎么解释。因为我们也正在探讨一个问题,我刚才说了我是用码的人,是体外诊断领域的人,怎么样把这个码用好,所以从今年年初开始一起探讨,包括和学刚一起探讨,我们怎么样建立一个新的体外诊断的体系,这是正在探讨过程中也同样加了一个N字来命名,叫NIVD。那么N在哪里?它是新吗?NEW吗?还是NEXT?还是N个吗?对N的读法也在不同的角度上,不同的维度上,对它进行解释,所以为了这个我们正在筹划NIVD的体系向前走。在这个过程中,我想肯定有对人体的健康解码的更好的应用和创新的领域,期待着在座的各位给它创新和开发。

刚才说了,这次的主办是在五届相关次序下来的这么一个团队,和我们生物医学工程学会的体外诊断行业相结合在一起向前走,这也体现了开发者的方向是向人靠拢,解决健康作为主题的向前发展的这么一个趋势。实际上,自然发展着是非常好的,它成长到一定程度的时候,就像藤的生长过程中需要支架或者向前发展的过程中一样,怎么样把它完整的,以任何风浪都打不掉的体系向前走,这也是我们在思考的方法之一。所以,我们从今年开始,和中国生物医学工程学会的体外诊断分会合作在一起向前走。这个问题我们谈论过几次,正好去年因为基因剪切应用的事件而切断了一下,借此机会继续向前走的话,可能是我们体外诊断的组学领域有更大的进步和发展,更快地向临床靠拢,更快地向健康靠拢。所以,希望在座的诸位一起把我们的协作创新以及NGS继续向前推动,同时丰富中国生物医学工程学会临床检验分会结合在一起,共同推动这一组学的完成,希望大家一起共同推进。

谢谢大家!

主持人:谢谢康老师,康老师怀着学生的情怀来到我们的会场,但是作为前辈也给了我们很多鼓励、肯定和期望、建设性意见。接下来我们隆重邀请过去六次大会的发起人和组织者郝向稳先生!

郝向稳:谢谢大家!以前我来讲的时候,我往往不拿手机,但今年忽然发现到了40岁以后记忆力下降了很多,所以拿着手机打了个草稿。

这个会,因为来的人相对来说,我觉得都是很年轻的,所以气氛也都是比较轻松的,大家一会儿去提问的时候,也不要有任何拘束,越苛刻、问题越尖锐,我们主办方越是欢迎这样的氛围。所以大家一会儿要提问的时候,要轻松、热烈地提问。

首先是感谢大家从海内外,因为有很多朋友是从美国飞过来的,从中国的四方八面过来参加这个会议。像汉嘉(音)老师和朝寒(音)博士其实也没有演讲,就是跟大家相聚一下,听一下讲座的内容,非常感谢!也感谢我们在座今天的各位嘉宾,也是从不同的地方,昨天晚上很晚12点多、2点多才到这儿,非常感谢!

这个大会发起的初衷,就是当时我们想促进基因测序这个产业的发展,我希望有更多的资金能够给到创新创业的人,然后创新创业的人拿到更多的资金以后,能够去做创新创业的事情,能有更多的基因应用开发出来。有了更多的基因应用以后,我们大家每个人才能够受益,整个产业才能够往前发展,就是这么一个初衷。

我们可以看到过去从2014年到现在为止,已经五年多的时间,从爆款的NIPT到现在被我们大家寄予厚望的肿瘤液体活检和常规遗传病的检测,其实有很多,包括这两年开始被大众接受了消费级的基因检测,还有一种是肿瘤早筛,现在也有一种果熟蒂落的态势。我相信随着应用的不断发展,这个产业一定会不断往前发展。

但是过去的一年,我相信如果说在座的主要是创业的人,感受会非常的深刻,就是过去的一年,咱们中国的资本市场不管是一级还是二级,其实有一个急速冷却的过程,虽然最近又有点升起来的趋势,但是大的氛围就不如前两年那么火热。但我觉得这么一个冷却的态势,也给我们这些创业者去冷静,然后想自己创业的本质。我们的主业到底是什么,我们如何在坚持主业的基础上,去做出更多的创新出来。

然后在我们过去几年,说实话整个内容上基本上是围绕着基因测序来的,基因测序仪、基因测序技术、数据的分析、数据的应用包括一些技术的方法,都围绕着这个来。但实际上到的这个以后,以前有人经常问我发现了一个遗传病,我又能怎么办?这个问题经常有人会问到。我们这次请到基因测序、基因编辑、基因合成,我们想不同的基因科技有关的细分赛道,能够在这里进行碰撞,需要希望能在这里,大家能找到互相合作的机会。通过技术上的协作,来解决我们实际应用当中的一些技术的问题。但是技术的协作,有时候往往是比较容易的,大家互相搞一个项目的合作,这个是比较容易的。但是如果说是这种长久的业务合作,有时候往往会比较难。你会发现有一个公司做大了,另外一个公司可能会分离出一些小公司出来。或者一个技术出来了,另外一个技术也很快会出来。但是如何能做到这种业务之间的协作?其实是蛮难的。因为现在大家的运动模式,基本上都是成立工作,以前我们研究人员很难去成立公司,现在研究人员也能去成立公司了。但是成立公司的话,你也却发现公司跟公司之间的合作,现在很顺利,但往往不够灵活。能不能有一种方式,把这种人,把这种团队,把这种公司之间,更好地去协作起来?其实我们这一次会议的话,也安排了区块链相关的内容,这是一种非常好的协作模式。

当然基因科技可以说是一把双刃剑,去年的“基因编辑”,全世界的人都知道我们中国的这些科学家。但是另一方面,我们又想能够把基因科技的正面的效果快速地去落地,所以我们跟顾老师去合作,然后把顾卫红沙龙从北京搬到杭州来,讨论的主题就是《生命科技创新如何有效协作,创造临床的价值》,里面我们请了有NIPT这种成熟的,然后有遗传病这种在临床的功能诊断的,有肿瘤的液体活检,有第三代的测序,也有肿瘤的早筛,还有医疗信息化、医疗大数据,相关不同主题的人、不同阶段的人聚集在一起,包括我们临床医生,临床医生如果能够更好协作利用,让生命科技创新这些技术、这些方案,能够更快在临床上实现它的价值。

最后,这个会很多内容、很多嘉宾,是我去邀请,但是我发现有时候对我挑战挺大的,就是很多嘉宾的内容都非常的技术,有时候是分子结构,一个个分子结构,然后有时候是数据分析,有时候又是非常基础的物理理论,讲纳米相关的,很多东西我也不懂,然后去学习。

所以我们今年邀请了医生来注册参会,就是以前老听人讲说一声是一个比较保守的群体,不愿意去接受新鲜的事物。但是我觉得在保守的群体当中,一定会存在对新科技十分感兴趣的医生。我相信今天来的医生,都是对基因科技非常感兴趣的前沿的医生。

我觉得我希望我们大家来到这儿以后,能用这么短短两天的时间,把过去一年甚至两年基因科技发展的最新趋势、技术,能够有一个认识。可能很多词或者很多概念不是特别熟悉,但是我觉得只要坚持下去,这些知识能够在脑子里留下痕迹,我觉得就达到了效果。

最后,非常感谢大家!也感谢我们的赞助方!谢谢大家!

主持人:谢谢!向稳,我们昨天在沟通的时候,他说这个会议怎么开幕,如果按照我们的习俗我们怎么开都好的。因为今天这两天有真正真核心的核心价值在讨论,所以开幕过程仪式感就并不那么重要,这样的话我的发型今天也没有保持的那么好。在开幕式结束之前,在嘉宾们做专业报告之前,我把支持这次大会的赞助商做个口播。为什么要这样?因为这次会议的维系和维持其实是很艰难的,昨天晚上我们在聚餐的时候也在思考接下来怎么和大家和行业共赢做这个事情,所以长话短说。

首先感谢HGBC、贝壳时代、倍数资本、贝壳社、顾大夫工作室、华大智造,贝克曼库尔特商贸(中国)有限公司、illumina China,明码生物科技、为度生物、翊圣生物、达仁基因、PerlainElmer、赛默飞、菁良基因科技、金唯智、厚泽生物、币冠生物、GeneBocH。谢谢各位的支持,也希望大家未来可以更好地支持我们的组织前行。谢谢!

接下来我把话筒交给大会主席向稳。


——以上致辞环节——


演讲主持人:郝向稳

主持人:接下来进入到轻松的时候,大家上去讲,大家有问题也可以提问。第一位演讲嘉宾是复旦大学的于文强教授。在请于老师之前,我还问了一下于老师,我说于老师您现在讲的内容跟三年前相比有什么差别?然后如果说差别不大的话,我就不让您来了。因为我每次邀请嘉宾的时候,为了保证内容的新颖,我都会把他以前讲的PPT拿出来去比较一下,以前的PTT都留着。然后于老师跟我们讲了一下,他做了很多他原来基础上的工作,今年年初也发表了文章。于老师的技术还有讲相关的内容,大家了解的话,他做这个技术用了七八年的时间。比如在去年的开发者大会上,北京大学黄严一(音)老师的纠错编码策划技术用了七年的时间,我当时跟他说真是七年磨一剑、一剑下天山,然后一个技术出来,非常非常不容易,特别是基础的技术。我们现在请于老师给我们介绍一下。

于文强:非常高兴来参加NGS会议,也非常感谢向稳。也不是请我来,是要自己要来参加。这个会议,其实我作为讲者参加过两次,其他次不作为讲者我也参加过几次,对这个会议的形式,其实从我自己角度来讲的话,我觉得还是非常好的,它其实是请一些学校的老师包括教授,另外还有很多企业界,我觉得是非常好的结合。

所以我今天把我们经过非常长的时间里面做的DNA甲基化技术告诉大家,在这里讲的话,其实我想这个技术是怎么来的,包括它能够做一些别人做不了的事情,另外能不能把概念从新进行解释,另外能不能发现一些别人技术角度发现不了的事情,从这个技术角度来讲还是非常重要的。

报告内容:一个是技术方面的东西,另外是能够有一些规律的东西。另外向稳跟我说你老讲技术还不行,你还要给我讲讲技术完了以后,参会的人能不能在你的技术上能有更新的东西开发或者怎么做,所以我这里面也掺杂这样的一些内容。

大家做二代策划这块,其实遗传一直占非常重要的位置。其实表观遗传学跟遗传学比,你可以这么讲,我们从素人拿到了遗传学的基因,我们把白细胞测一次就够了。但是表观基因组不是这样的,可能不同的人,不仅不同的人不一样,而且同一个人的不同细胞也不一样,而且随着时间也是变化的。所以表观遗传学在整个生命中变化非常明显,比如说在胚胎的早期甲基化有变化,而在整个生命中我们随着年龄的增加,甲基化也会变化。所以甲基化的测序,其实一直是这里面非常重要的问题。

甲基化测序,其实从我们角度讲的话,你说于老师讲这个东西,大家说方法太多了,比如说最早用芯片,Array公司开发了很多甲基化的芯片,包括RRBS测序,包括最近我们包括很长时间大家用WGBS测序。但这里面其实很多芯片,它大概测了基因,从CG角度来讲,大概是像850芯片,就是85万,CG大概是2800万个,你可以看到覆盖范围比较低。RRBS,大概也就覆盖1%WGBS覆盖虽然多一点,但是你可以仔细看WGBS测的发的一些文章,总体来说,用WGBS研究疾病还是太少,因为测序实在太贵。

WGBS在做的过程当中,为什么比较贵,其实最主要的东西是WGBS测序完了以后,我们处理完4个碱基,变成3个碱基,复杂度降低,它的MAP是一个很大的问题。第一是MAP不上去,很多都是MAP上不去,第二是MAP store(音)。所以WGBS工作,MAP是非常关键的问题。所以从这两个角度来讲的话,你可以看到包括美国的Road Map“表观基因组”计划当初决定测100个人的表观基因组的组织细胞的时候,它其实花了6亿多美元,你可以想象它非常贵。

既然是这样的话,从我们要解决问题的角度,我们就要从MAP角度着手,我们要把MAP问题解决了,我们认为WGBS包括甲基化测序就比较好解决了。

所以我们有一种方法叫Guide Positoining Sequencing,其实原理是很简单,你是MAP,你MAP不上去,我们如果能够用定位的测序,那是非常可以。为什么这么说?是因为我们知道我们基因组MAP没有问题,我们如果有什么办法,让它的二代测序一端是基因组,另外一端是表观基因组。我们用基因组去定位,那就不会问题。方法呢?我们2010年就想到这个方法去做,包括中间的优化包括软件的编码用了很长时间。

现在看一下GPS到底为什么能够这么做?我们知道分子生物学有一个非常重要的酶叫做T4,特性是没有dNTP的时候,这个T4是发挥外向性(音)的活性;当有dNTP的时候,这个T4发挥的是聚合类的活性。所以我们很简单,把这个酶加dNTP的时候和不加dNTP的时候,它会在3秒钟切。切完了之后,我们加上dNTP以后,你可以看到它可以把这一段延伸回来。而这时候非常重要的事情,这个dNTP里面所有的“C”我们换成“MC”,所以换成“MC”以后,这样的话MC和(英文)这一端其实跟基因组是一样的。有了这个技术以后,我们就可以做非常多的一些事情,比如说一端定位、一端做甲基化。

你想起来很简单,但其实做过程中并不是你想象的。比如说最主要的是酶,你如果控制温度或控制时间,让它切100个左右,所以这是非常关键的。因为如果37度做的话,基本上很快1分钟DNA全切光了,所以我们这里面做了非常多的工作,所以这个方法也是开发。

另外有了这么一个方法以后,我们可以和WGBS比一下我们的方法优势到底在哪里。我们比了GPSWGBS的方法,你可以看到GPS方法,因为和基因组比的话,基因组测序MAP大概到到86%左右,GPS MAP大概在85%左右。BSMAP,目前WGBS大概在65%左右。另外在实测数据中,我们会发现GPS大概在80%左右,而WGBS大概在60%左右,这是说的理想状态,比如说这是正常组织。但是在肿瘤组织这个地方,无论GPS还是WGBSGPS大概在70%左右,而WGBS一般很少超过50%

另外从MAP角度讲,你能不能MAP上去,另外一个是WGBS的均一性。所谓的均一性,就是说你测的序列是不是和基因组拿到的序列是一样的。可以看到我们在基因组的分布里面,像PrometerExon都是非常重要的序列,你可以看到它的科目大概在7%左右,可以看到它的WGBS MAP也在7%左右,你发现目前WGBS一半都不到。换句话说用WGBS,目前很多地方很多关键区域你是MAP不到的。

我们知道其实人体基因组里面有非常多的重复序列,而这些重复序列在人体中非常重要,比如说肿瘤中重复序列的低甲基化是非常常见。GPSWGBS,可以看到在重复序列的MAP上,有非常强的优势,大部分的重复序列GPS MAP要比WGBS高得多。

其实最后一个非常重要的就是它的准确性,GPSWGBS。所以我把原理讲清楚的话,大家可能非常清楚GPS一定是比较重要的。而且事实上,比如说我们无论是每一个点去做,还是最后如果我们用WGBSGPS测的两个甲基化不一样的话,如果去验证的话,这时候一定是GPS这个地方测的点比较准。而且在这里,WGBS测序往往大概覆盖30层以上,而GPS一般情况下我们看到覆盖5层以上的话,就基本上是比较准的。

有了这些方法,其实我们可以做很多事情,比如说我们目前为止WGBS做了这么长时间,我们很难说拿到一个表观基因组图谱。为什么这么讲?是因为我们人体基因组CG2800万,而2800万,目前大家做的方法能够达到2800万的90%就非常不容易了。但事实上我们人体里(英文)是11.7亿,因为NC(音)甲基化也非常重要,而NC甲基化在ES细胞、神经元是非常重要的。所以从一个表观基因组图谱来说,是所有Prometer的甲基化状态或者没有甲基化。所以我们这个地方,你可以看到覆盖96%,可以测11.2亿的C的位置。


在肿瘤中也会非常有意思。我们在比较,我们会发现人体肿瘤细胞受到甲基化globe是低的,但是你可以在这里看到肿瘤细胞的甲基化比我想象的还要低,大概在20%。一般WGBS测下来,大概在40%左右。一个非常重要的原因,是WGBS很多低甲基化区域是覆盖不到的,所以这样的话全面覆盖以后,你会发现其实人体在肿瘤细胞的甲基化,低到我们在早期胚胎发育的甲基化差不多,也是大概20%左右。

有了这个方法以后,能不能采取一些其他的拓展?比如说能不能用GPS做很好的标志物?我们后面可能会讲。因为WGBS很多地方是覆盖不到的,所以很多地方你会漏掉。还有一个非常重要的东西,我写科学算命,因为我们知道DNA甲基化跟人的年龄有非常大的关系,比如说在外周血中甲基化的程度,完全可以反映一个人的年龄。如果说你用了不准确的方法,我估计你没法用。你如果说能够非常准确一个人外周血甲基化,你可以用它判断这个人。比如说你40岁,你测的甲基化也是40岁,那还好,如果你是40岁,你测的甲基化程度是50岁的年龄,说明你整个生活压力包括你衰老,可能会比年龄要快,反过来也是一样的。所以有了这些方法以后,你可以对他非常精准地做一些检测。

有了GPS这个方法以后,除了这个东西,你能不能做一些在以前WGBS很多发现不了的一些表观调控调整规律?我们基因甲基化和基因表达有非常大的关系,我们都非常清楚:高甲基化会低表达、低甲基化低表达。在个别基因上没有关系,但整体大家非常清楚你要把一个细胞所有的甲基化,所有的基因表达连接起来做,你会发现它是没有规律的、没有关系的。

WGBS这里,我们会发现其实Prometer的高甲基化是基因低表达的,但是GeneBody的高甲基化是基因高表达的。如何把这两者能够结合起来,能够预测基因的表达?其实我们就用了一个GeneBody甲基化减去Prometer甲基化,我们用了MECTP,你可以看到这个值和基因表达的相似是非常高的,换句话说我们可以通过GeneBody甲基化减去Prometer甲基化,通过这个值,来预测基因的表达。

你肯定说GPSWGBS是不是也可以?可以看到WGBS rho大概在0.33左右,你说为什么是这样?非常重要的原因是WGBS做的很多结果其实是不准的,所以这样的话,你在看到它的规律是没有的。

有了这个东西以后,我们就会发现我们知道肿瘤它在发生过程中,比如说和免疫有关系,比如说和代谢有关系。你会发现用MeGDP预测基因的表达以后,你会发现很多基因低表达基因都是跟代谢或者跟酶有关,而且这些基因在肿瘤发病中可能有非常重要的作用。

除此之外,我们都知道甲基化的高低很重要。我们就会发现甲基化的宽度也非常重要。比如说在很多细胞中,同一个Prometer甲基化的宽度不一样,他的基因表达也会不一样,所以我们把它叫MBS,就是说在Prometer位置,如果它甲基化的宽度越宽,这个基因就越高。这个结果还是非常明显的,你可以看到在Prometer ,随着甲基化宽度增加,对基因的表达是增加的。这里可以举一个最简单的例子:cimek(音)基因。我们知道在肿瘤中cimek基因都是高表达的,有关cimek基因为什么会高表达,我觉得会有非常多的文章描述这个问题。但是可以看到cimek基因在肿瘤中的高表达,非常关键的是MBS。你会发现在肿瘤中,cimek基因的高表达是因为它的宽度和正常细胞比起来,宽度非常宽。所以从这个角度来讲,我们会发现用MBS预测基因的话,你会发现很多基因都在rebos(音)上,包括Cell cycle。换句话Cell cycle有关的基因和rebos有关的基因,你可能在检测过程中,正常细胞、肿瘤细胞的Prometer都是低甲基化的,但因为肿瘤细胞的宽度非常宽,所以使rebos基因会高表达。

有了这个东西,其实我们有一个非常重要的东西,就是肿瘤和免疫的监测问题。我们大家现在研究肿瘤免疫其实把它割裂开始,也就是肿瘤细胞研究免疫细胞,尤其研究很多免疫系统。换句话说,其实我们在研究肿瘤细胞过程中,我们肿瘤细胞有关免疫项的基因表达,可能会和很多东西有关系,尤其是大家现在免疫治疗、PD1的治疗在2%左右。我们现在告诉你,是说如果用肿瘤细胞的甲基化来预测免疫治疗的效果,可能会比一般的要好得多。

另外有了这个东西,你能不能对一些现象重新做一些解释?其实我们刚才看到MBSPrometer甲基化是有一定宽度,我们发现其实增强组的甲基化,它的宽度也是会变化的。换句话说增强子所在的甲基化有宽有窄。如果说比较宽的话,说明Invasion的活性也会有所改变。

而且我们知道增强子的变化和细分的身份,包括细胞酶的组织非常不一样。可以非常清楚看到在肿瘤中尤其在肿瘤转移中,我们很多东西不清楚,但你会发现肿瘤甲基化,它可能会在肿瘤细胞里面,有些增强子是获得了增强子,有的是修饰了增强子,还有有些增强子宽度有发生变化,有些变宽了,有些变窄了。而这些基因,你会发现高兴地发现这些基因和很多细胞身份的变化有非常大的关系。

我们也知道很多肿瘤会特异性情况转移,比如肝癌会转到肺上、肺癌可以转到脑上、前列腺癌可以转到脑上。到目前为止,肿瘤器官转移是说不清楚的。但我们知道的事情是如果把一个正常细胞,比如说把肝细胞放在肺上是不可能长的,但为什么肿瘤可以的?我们发现非常有意思,其实肿瘤的发生,肝细胞变成肝癌的过程中,其实是肝细胞特异基因的下调和其他组织基因的上调,你可以看到在这个细胞系里面,M3是一个肝癌细胞转到肺上,你可以看到肺这一级增加了。换句话说,肝癌细胞能够长到肺上,是因为肝癌细胞表达了很多肺的表达基因,可以适应这个环境。而这种表达,是通过增强子操控的,你可以看到肝特异增强的下调和肺特异增强的上调跟它是一致的。而这种调控,又和DNA甲基化有非常密切的关系,换句话说可能是因为DNA甲基化的变化,导致增强子的变化,导致组织结构的变化,导致某些肿瘤细胞特别容易到某一个器官去。

所以我们提了同化共生,换句话说肿瘤为什么转移?是因为肿瘤细胞到它所在的靶器官,获得了这个靶器官很多的特征,表达了靶器官基因,同时使得肿瘤能够转移。

到目前为止,我们做肿瘤这么多年,其实就两个问题:1.肿瘤的转移,2.肿瘤的耐药。这两个问题解决其中一个,肿瘤问题就解决了。但到目前为止,有关肿瘤转移的预测,做了这么多年,其实大家没有什么好的办法来预测肿瘤会转移。而通过我们这么做,我们可能会有效预测肿瘤会转到什么器官上。如果我们知道它会转移到什么器官上,我们就可以知道我们用什么办法,比如说肺癌容易转到脑子,我们知道它为什么容易转到脑子之后,我们会想一些办法broke那些非常重要的组织基因,使肿瘤转移得到逆转。

除了这个之外,其实我们非常重要的东西是GPSWGBS能不能做一些跟别人不太一样的东西。所以我这里面说了甲基化共有标志物。这个问题其实从我这个角度来讲,我大概最早发现肿瘤共有标志物,我讲过几次,我开始以为别人都会觉得信,其实没有几个人信,为什么?上世纪八九十年代,大家知道肿瘤可能有共有标志物,找了这么多年没有一个也没找到。

从我们的角度来讲,从肿瘤检测,尤其是在现在的精准医学大环境下,大家恨不得每种病人都找到一种药物。如果我们知道肿瘤有共有的标志物的话,这对肿瘤是非常重要的。肿瘤有没有共有标志物?其实从理论上讲是会有的,因为从表征角度来讲的话,肿瘤有两大特征:异常增生和异常分化。到目前为止大家研究最多的是肿瘤异常增生问题,比如说我们研究(英文),研究了半天其实都是生长的关系。但肿瘤发病一个非常重要的问题,为什么分化会出现问题,而这个地方没有太多理论。分化的问题,其实就是细胞生成的问题。如果我们认为肿瘤有共同的特征,我们从(英文)的角度来讲的话,它背后一定有非常相近的机制来和肿瘤的发生和发展有关系。

其实我们也有幸找到这些标志物,在目前为止在一些细胞上。我们也做了很多临床样本的验证,会发现它确实在很多肿瘤中都是甲基化。比如说我们做了13种肿瘤。

这个东西能干什么?其实我们知道胃癌的病人在复发或者大部分情况下,都是在切沿切口的位置复发,大概五年以后。当病人得病以后,给医生说最多的话就是医生你能不能想方设法给切干净?医生也想切干净,但目前的策略和方法就是通过冷冻切片取一块组织,比如说取6块组织送给病理看。你可以仔细想想让病理医生在20分钟之内要给结果。你仔细想如果是绿豆大一块,让你切5微米的片子,你知道要切多少片子。然后这5微米的片子,如果每一个地方都检到的话,我觉得基本上是不可能完成的。如果我们有分子生物学的检测,如果发现甲基化的变化和肿瘤有关系的话,我们就会非常简单了。

另外做血浆中的检测,到目前为止我认为甲基化的检测一直是一个难点。这里面非常重要的问题是它的检测稳定性,还有很多其他问题没有解决,或者说神经非常少。我们也做了非常尝试,会发现这个MAP在血浆中还是可以作为稳定检测,在肿瘤检测中还是不错的。

其实目前为止,我们在肺癌的诊断上,目前螺旋式CT的应用,肺部阴影的检测率是越来越高了。但是一般情况下肺部阴影以后,医院基本上让病人回家等三个月看看有没有变大,变大再说。但一般情况下,病人大概回家都等不了一个月,回来一定要找医生赶紧把我这个切了。而且我们目前也知道把阴影切的话,50%甚至70%切了以后,这个阴影都是良性的。而且目前在医患关系比较紧张的情况下的肺癌肺部阴影,目前你是可以诊断错了、手术错了,病人也比较高兴,但医生是很无奈。所以在肺的灌洗液检测中,你可以看到我们用Methylation做的话,红色的线代表最后确认是组织肺癌的,你会发现绿色的线虽然没有确诊,但总体上来说用甲基化做肺癌的诊断还是可以的。

其实肿瘤的治疗这一块,目前所有的肿瘤治疗方法,比如说治疗以后我们三个月会复查很多指标,复查CT有没有变小。其实像PD1这种免疫治疗非常贵,如果一个疗程结束,病人其实花了很多钱。能不能有一些办法,能够非常早期甚至一个礼拜告诉病人这个药有效或者没效。其实从我们这个角度来讲,不管你任何治疗也好,放疗也好,化疗也好,还是免疫治疗,只要你把肿瘤细胞杀死了以后,这个甲基化肿瘤一定入血,只要入血,这个甲基化一定有曲线。如果有了曲线以后,我们一个礼拜就可以预测药物到底有没有效。

从这个角度来讲,我自己觉得包括肿瘤共有的MAP,可能一个非常重要的问题是所有肿瘤的共同发病机制,到目前为止应该没有太多人研究,我们都在不同的肿瘤研究不同的发病机制。我们从共有MAP的发现,我们自己觉得所有任何的标志不会是拿来让我们检测的,一定和肿瘤有各种各样的关系。有了共有标志物,我们可以研究肿瘤共有的机制,那我们将来治疗肿瘤的话可以有共有的方法和策略,另外我们可以做肿瘤很重要的检测。

所以我非常感谢大家!

主持人:我们现在到了提问时间,大家有什么问题?

提问:我是宜康基因的(音)于军(音),我学到了肿瘤转移在基因表达方面有甲基化控制的同化共生的概念,我觉得很有意思。但是我们知道肿瘤转移不是满数都能转移,经常有骨转移、肺转移、肝转移、脑转移,大概也就这么几个,我没有听说过乳腺癌转移,更没听说过肌肉转移。很显然,从于老师的基因表达同化共生角度来看,您怎么看肿瘤转移的靶向性,为什么有些器官永远不转移?

于文强:其实肿瘤转移,我觉得是一个非常老的话题,我这么多年一直在做。其实从我们自己的角度来讲,肿瘤器官转移,比如说有的器官:脑子、肺。其实在我们做的结果中,我们会发现它其实在肿瘤转移中,比如说我们最近看到有些研究文章,有的人研究前列腺癌骨转移,他会研究很多,比如他找了一个基因,然后做了很长时间基因的功能性研究。我当时听了报告以后,我一查基因,发现前列腺癌所谓的骨转移,其实那个基因就是一个骨特异性的基因,而且在骨中发育。当然为什么肌肉没有转移,心脏有没有转移?这个地方除了我们说的一种理论,比如说和它器官有关系,还有和器官本身也许,比如说肌肉运动包括心脏运动,但在脑部或者肺部这些地方当然有血液循环,其实包括EMT,我自己觉得肿瘤不管前面怎么发生,但是最后它在靶器官定位的时候,一定要和靶器官相互适应是非常重要的。你可以这么想,其实我们肿瘤现在做CTC,肿瘤细胞一直在我们血中循环,为什么最后能在这些器官中能够找到?其实我觉得这就是筛选的过程,就是转移的其他东西,它不能适应器官的话,它也长不了。另外我自己的想法,其实肿瘤细胞本身从它遗传学和基因学角度来讲,它非常容易死。换句话说他只能在器官里面,有这些基因和生长环境才能长。在其他的地方,虽然能循环,但不能适应环境,其实也是长不了的。

提问:于老师好,我来自源码基因(音)的田庚(音),老相识了。甲基化这块研究方法确实很多,您的GPS技术,可能是我了解到的效率非常高的技术。但应用上您刚才也提到四个拓展,如果是甲基化影响基因表达,我测表达铺不就行了,这是第一个问题。第二个问题,在那四个拓展里面,我们真正能开发出来一个就已经有很大的临床应用,但实际还有其他的方法可以替代,包括刚才说的结节。我们知道基准医疗范老师最近发的一篇文章,就是我选个别基因就够了,这样的话GPS的优势不一定能发挥出来。而且您刚才提到GPS几个场景,时间、成本这样因素是不是比别的技术有绝对的优势,我觉得这是您要思考的问题。从您的PPT里面,其实我看不到这些。如果是这样的情况,尖锐点来说,这个东西很难产业化。如果产业化不了,咱们停留在科研阶段,那就是发发文章的事情。

于文强:我觉得是非常好的问题,我自己喜欢挑战,我也喜欢别人挑战我。从基因表达的角度来讲,我可以非常清楚告诉你基因表达和基因甲基化有关系但也没有关系。比如说我们找到的很多点跟基因表达一点关系都没有。所以从基因表达测一些预测,这是可以的,但是在某些关键部分就不行,因为最主要的是甲基化,我们要明白DNA基因甲基化除了调控,其实我们大家对DNA甲基化低估了非常多,我们光知道基因表达,换句话说其实基因甲基化跟染色的结构关系,可能比你的基因表达要重要得多。所以如果光从基因表达来推一些作为marketing的话,我自己觉得是可能的,但可能不够,可能需要更深层次判断这个东西。

另外从应用角度来讲,我刚才说的marketing。其实我们一直在做业务,在胶原测序(音),胶原测序成本比二代测序可能要低得多,因为它只有4个位点,所以我们做起来非常容易。但如果用二代测序,反而是这四个基因有点太多,从成本角度来讲意义也不是很大。而且我们大概有100多个BP,我们现在最主要的目标是如何在血浆中如何做稳定。其实甲基化这一块,我自己做了这么多年,我自己认为甲基化这个地方的水还是非常深的,并不是你做了就会知道,这里面有非常多的小东西,可能我做了半天都没有发现原来还可以这样做。所以这就是目前甲基化在临床应用方面,我们知道有关甲基化的标志物,大概七八千篇文章,但临床没有几个好使,其实这里面最关键的问题是在甲基化检测过程中它的重复性是非常重要的。因为我给你同一块样本,你能不能检测五次,检测一模一样,我估计很多实验室不一定做得到,比如说我做5%arrival(音),但NGS要做到5%arrival是很难的。像最早的海顶公司(音)检测METP(音),可以来预测药物治疗,最后都黄了。其实这里面是需要作为研究者、研发者,和企业共同面临这个问题。所以我自己觉得这里面可能还需要我们更多的努力,去把它做。但我非常坚信甲基化是一个非常好的标志物,能够去做很多的事情。但是,可能还需要时间来把这个问题,尤其是稳定性做好了,我觉得可能就离应用不远了。

提问:如果在座各位今天有样本给到您,您现在实验室能不能以最快的速度把甲基化测序的实验做了、数据分析做了,多长时间能出来结果。

于文强:因为我们现在在实验室里面做,你给我样本,我是什么都不干,大概在5个小时之内可以出结果,因为你可以从DNA提取算时间,所以五个小时内可以有结果。而且事实上我们自己在挑战自己,比如说我们现在能做检测,比如说肿瘤甲基化我做的。但我们现在两三年前在挑战我们自己,我们所有临床验证给我们的样本,我们给它标上号,我们根本不需要任何你给我们的信息,我们会把甲基化数据完全交给医生,医生是根据结果来看。所以从这个角度来讲,其实我们现在做的很多东西是这么做的。所以只有医生敢给我样本,这个医生一定是我的合作伙伴。如果不给我样本,或者他不相信这个东西,我是没办法。但是他给我样本,结果一定是他满意的。所以这里也要花非常大的精力和时间。

主持人:时间关系,提问到此结束!下面有一个提示,下面的嘉宾上来的时候,不需要一定站在这儿,可以走,这儿有提示屏。这次的会议特意为大家安排了视频的录制,因为我们也没有钱给演讲嘉宾作为讲课费,所以希望把视频录制下来,经过后期的剪辑,送给演讲嘉宾作为礼物。谢谢!

下一位嘉宾,是来自华达智造的王威博士,她讲的内容非常丰富,把整个测序技术的历史梳理了一遍,有请!

王威:大家好!我来自华大的王威,非常感谢向稳这次给我们这个机会来做分享。

今天应该说特别荣幸能够参加这个活动,因为见到了很多前同事以及现在的合作伙伴,其实做这个报告很忐忑,因为过去十年一直在基因组临床应用方面,现在又回到了技术层面,所以心里挺忐忑。今天这个报告是向稳和制造的同事共同定的命题作文,让我们讲讲读长以及新的技术,长读长和短读长以及碱基识别是今天的主要报告内容。

实际上,我们在做测序的时候,基因测序从根本上来说就是一个碱基识别和读取的技术,所以华大内部的读写存,读是指基因测序技术,写是指基因编辑,存就是指存储。那么,对于读技术,也就是测序技术,实际上我们有很多的因素是需要考量的,特别是和长度有关的一些信息,比如说读长的准确性、读取的速度、通量、稳定性、成本,这都是我们需要考虑的一个因素之一。

回顾测序发展的历史,可以看到它从最初的前直读一直发展到直读技术,最早还是没有办法直接读取的,需要借助其他的手段才能读取到碱基的序列,发展到直读。再到测序技术逐步实现自动化,从最初的手工测序到毛细胞电泳,再到后来的高通量测序,这应该是测序发展的四个非常重要的突破。现在比较热的就是长分子的单分子的测序技术,但是这个测序技术有它显著的优势,但是到现在还没有达到之前技术使用的广度和应用性,希望能够在未来的时间,能够看到它更多的应用。

(图示)测序,左边是最早的毛细管电泳,再发展到高通量的电泳,应该说现在有很多的高通量测序平台,虽然平台的原理是不一样的,但是共性是一样的,都摒弃了原有三个测序一个模板一个电泳通道的方式,一次性对很多的模板分子进行平行测序,所以显著提高了测序的通量。它是裸密并行的方法,也就是说,原来我们需要在管里进行,现在直接裸露在芯片上进行反应,或者说在磁珠上进行反应。每个分子簇其实就是一个裸密的测序反应,它带来通量提高的同时,牺牲的是测序下机读长。最早2005年出来的时候,当时最早是454454当时做到的读长也是特别长。到现在,经过十几年的发展,它的测序读长有了很显著的改进,但是依然不是特别理想。

(图示)这张PPT列的是现在主流的一些测序平台的读长,可以看到NGS基本上可以达到300500的分子碱基读长,其实已经比较接近我们三个测序。相比起来,单分子的实时测序,读长是它非常显著的优势,不是长读长,而是超长读长,可以达到二三万个甚至二十万个的碱基读长,它在测序读长的优势是非常显著的。但是没有完美的技术,这几类测序技术既有优势也有局限性,比如说NGS的测序,我们单位把它叫做大规模并行高通量测序,其实就是NGS,它的技术是比较成熟的,但是它的读长相对比较短。相比起来,单分子虽然读长很长,但是目前它测序的错误率是比较高的,最高可以达到10%多,通量相对来说要低一些,费用也比较高,对通量的的标本一般需要投入到模板建库里,对DNA的要求也是非常高的。

对于某些应用,可能二代测序的读长就够了,比如说NIPT,实际上它检测的就是游离血,而且它又并不是精细到某个碱基,所以在这种情况下,NGS的技术就够了,但是对于高通量的应用,长读长来说,有显著的不可替代的优势。目前来看,它至少可以帮助我们完成一些重复区域的检测,能够帮助我们更好地发现一些拷贝数的变异和结构的变异,特别是一些复杂的变异,能够了解整个基因转录本的情况,能够帮助我们了解单体型的信息,还有一些Denovo基因组与转录组组装,它提供的信息是非常丰富的。所以说,在测序的准确率和成本相对一致的情况下,长读长肯定有它的好处。

正是因为现在的技术都不是特别完美,所以这时候如果要达到或者说接近完美基因组的数据,我们需要借助于一些策略,在座我看很多都是生物信息的大咖,这个我就不细讲了,这是一篇非常经典的文章,主要采用的是将长读长的技术和NGS的技术进行结合使用,用NGS相对高保证的测序来对长读长的技术进行辅助纠错和组装。经过这种结合的使用,它可以使基因组测序的准确性从80%多提高到99%

另外一种策略就是继续在NGS上做文章,这个大家也都不陌生,这是目前两个的策略,它的核心就是利用一些共标签的技术来对NGS的短片断,通过一些标签的关联性来合成一个更长的片断,来帮助我们跨越一些复杂的序列,了解更多的结构变异。(图示)左边的好处,它是在微控板里对标本进行分隔,对使用的工具没有更多的要求。右边的技术需要有专门的微流控的装置,因为它是通过乳液滴来对标本进行物理的分隔,所以需要借助一些特殊的装置。那么,建完了这个库还是需要在二代的机器上进行测序。

我们单位针对这种合成的Synthetic long的技术,开发了单管长读片断的技术(StLFR),这个技术和之前的Synthetic long技术,其实都是需要用到共标签的技术。共标签的技术就是说投入到建库体系中的长分子会标注到这些Barcode,来源于同一条长分子的Barcode是一样的,不同的长分子之间的Barcode是一同的。那么,我们在测序获得reads的同时,也可以获得对应的Barcode的信息,通过Barcode的对应关系,我们可以将不同的片断还原到建库伊始的这种长片断中去,能够帮助我们了解更复杂的一些结构变异。其实还有一个重要的就是了解单倍体型,帮助我们构建单倍体型,如果对人类基因组技术有所了解的话,就像当初(英文)的方式来借助克隆的方式,作为中间的桥梁来帮助我们组装成一个完整的基因组。

StLFR的雏形是在更早期的LFR的技术上开发完成的。(图示)这是LFR2012年发的一篇文章,就是希望用共标签的技术针对少量的标本,当时是针对10-20个人的细胞,能够准确进行基因组的测序,能够准确地构建出它的单倍体型。当时这个技术还是120PKDNA,当时还没有现在的转作体、微控板,主要是在模板里进行物理分隔,把这些长的片断标记上这些标签,然后再打断,进行NGS的测序,最后借助于Barcode组装成不同的单倍体型。当时这个结果还是非常好的,97%的杂和基因都可以被归到不同的单倍体型上,而且整体的错误率差不多是十万分之一,当时的结果还是非常理想的,但是这只是实验室阶段一个研究性的工作,当时的实验还是相对比较复杂的。因此,我们在这个基础上开发了StLFR的技术,这个技术在这里面采用的是(英文)的建库的方式,同时不再使用试管或者微控管,它是在一个管子里进行虚拟分隔,因为打断之后在酶的作用下依然是一个长链,然后和标记有标签的磁珠进行结合,通过磁珠来实现物理的分隔,然后把这些长片断最后标记到磁珠上,最后在磁珠上完成后续的建库反应,我们会得到一个StLFR的文库,这时候再结合DNA球的技术来进行测序,这就是基本的流程。

这篇方法学的文章4月份已经建刊了,这里面有非常详细的实验过程。在发表的研究里,每个标本投入的是五千万个条形码,最后的结果是单倍体的N50可以达到34mb,对于这个结果还是比较满意的。总的来说,StLFR技术是通过磁珠来实现一个物理分隔,不需要在微控板上进行分隔,所以实验操作是三个里比较简单的,成本也有所降低。它是在磁珠上完成,也适合后续的高通量自动化建库,可以方便把相应的工作流程自动化,也不需要特别微流控复杂的装置,在实验室的条件下就可以完成。目前推出的StLFR的文库建构试剂盒,N50可以达到10mb左右,可以用于demovo组装,分析多种变异,包括InDels与单碱基变异,以及CNVSV和高度同源区域的变异分析。

有了这个技术,我们肯定想到底有什么样的应用?对于华大就延伸了一些现实的需求。(图示)这是当时和301医院合作的一个病例,这个妈妈来的时候已经是怀孕第12周的,这时候她提起她之前的一个孩子有疯糖尿病,就担心现在的胎儿也有这样的疾病。所以这是我们和她进行的一个探索性的工作,当时因为没有StLFR技术,我们还是用胎儿测试的方式来对爸爸妈妈以及胎儿进行一个非常高深度的测序,通过测序对腹中的胎儿进行了准确的诊断。当时的技术、流程非常的复杂,前后差不多花了一个月的时间,这种情况肯定不太适合临床应用,还是一个研究性的工作。有了StLFR的技术,我们就可以肯定首先就想到能不能应用于父母于基因组进行StLFR的测序,再结合cfDNA游离血浆的测序,能不能以无创的方式获得胎儿的完整的基因组,用这种无创的方式,只要在一管之内就可以了解到胎儿的整个基因组的信息。它的好处就是可以帮助我们了解胎儿遗传病的情况,还可以发现一些胚胎新发的突变。

(图示)这是我们测试的一些情况,可以看一下红框里是StLFR的测序情况,30XStLFR测序深度,再结合100XcfDNA的测序,胎儿的基因组的准确性可以达到93.7%,就是基本上能够准确复原出胎儿的全基因组。不光是了解他的基因组,还可以发现相关的遗传变异,我们以现有的疾病相关基因中的277个致病位点作为验证集,可以看到胎儿基因准确性可以达到99.6%。以这个例子,我们希望能够作为一个案例,给大家一些启示,能够探索更多可以在临床上应用的场景。

(图示)这是另外一个工作,这个技术可以帮助我们了解一些同源基因。这里举的例子是脊肌萎缩症的致病基因,这两个基因分别是SMN1SMN2,实际上可以看到在5号染色体,是紧挨着的两个基因,而且大小序列基本上都一致。如果只用标准的全基因组分析的时候,会很困难,我们可以看一下这个图就知道了。下面是这两个基因,我们选取了27KB的窗口,可以看到就是因为这两个基因的同源性非常高,所以序列是非常有限的,但是采用长片断读取的技术,可以很好地区分这两个基因的相关信息,这对于很多由于同源基因相关的一些疾病研究,我想可能会有很大的帮助,到底这个技术如何应用,我们也希望和在座的各位进行长期的探讨和合作。

接下来最后一个议题就是碱基识别。(图示)这张图是我们在测序的时候最害怕看到的,NGS测序反应中碱基质量逐步下降,其中一个重要的原因就是由于相位异常导致的。举个例子,以现有的聚合测序为例,每个模板分子经过扩充以后可以达到五千,甚至是更高,比如说一万个拷贝。那么理论上最理想的情况下,这一万个拷贝的模板分子,在每一个Sanger中都加入同样的信号,这是最有效的,但是会有一些分子掉队,这就是Dephasing。掉队的这些分子和大部队所携带的荧光信号肯定是不同的,所以会增加每个Sanger读取它的噪音。随着测序Sanger数逐渐增加,这种性噪比就越来越不理想,所以这是非常重要的影响读长的原因。这种限制读长的主要因素,是因为我们现在在合成过程中使用的dNTP是经过修饰过的dNTP,并不是自然状态下的dNTP。我们可以看到其中这个例子,经过修饰过的dNTP,比如说现在最流行的Reversible terminating group,在碱基上会挂一个荧光燃料,但是并不是直接和荧光燃料相连,中间有一些linker分子。那么在每个测序的循环完成之后,会把燃料切掉,切掉之后,黄色的信号会保留在上面,你可以把它叫做疤痕,每个Sanger都有疤痕的存在,反应积累多了之后,这种疤痕就会影响它的效率,最终会影响NGS聚合酶的聚合效果,效果会更差一些,所以这是目前基于合成测序的技术读长受限的一个非常重要的因素。当然,除了碱基上挂的荧光基长以外,对于三顶端整合的综指基团(音译)也会影响聚合反应,所以这些因素加起来,就是导致了现在基于合成的测序平台质量下降,测序读长有限的一个非常重要的因素。在这方面,测序的化学方面,我们也在进行一个内部的研究,希望能够尽量地降低修饰过的碱基对测序质量的影响。

(图示)这是前不久可能在座老师有的也注意到了,华大有一个新闻说我们现在在做这个技术,当时的报道说是无损,但是我仔细琢磨了一下,并不是完整意义上的无损碱基,实际上还是有一些修饰的。它和之前的修饰不太一样,是在dNTP的三顶端加了一个综指基团,荧光基团并没有挂在中间,经过循环之后,会在引物链上,在模板的指引下会有对应的碱基整合到这个延长链上,之后会有一些碱基特异性的对(英文)依赖性的抗体,会和整合进去的dNTP进行结合。这时候,荧光分子实际上是挂在这个抗体上,并没有标记在碱基上。每个循环之后,多余的抗体会被洗脱,这时候再来进行信号的读取。读取之后,经过化学反应以及洗脱,挂了荧光的抗体会被洗掉,同时dNTP综指基团也会被还原,最后我们在系列上得到的实际上是一个自然的没有经过修饰的碱基。我们希望通过这样的方式,尽量减少修饰碱基对测序质量和读长的影响。由于它在抗体上挂的荧光分子不止可以挂一个,可以通过这个方式来提高信号的强度,也可以得到更准确的序列,因为它的信号会更强,也会更亮,所以能够更好地识别。同时,又因为留在延伸链上的dNTP是天然的,所以理论上会获得更长的读长。

(图示)这是我们初步测试的一些结果,上面是修饰过的核酸,它会随着每个Sanger的增加,在信号读取上会有一些偏移。但是采用这种非修饰的dNTP,信号应该说是比较均衡的,所以我们希望借助这个方式帮助我们获得更长的读长。右边是早期一个概念性的测试,我们首先完成了一个30碱基的整合,然后读取每个Sanger的信号,然后延伸1-200个碱基,再测70个未修饰的碱基。可以看到,前30个是最后70个的碱基,它在各种参数上包括错误率上是比较接近的,所以现在以这个方法已经证明它是可以工作的,而且是在一张芯片上可以工作的,目前可以读到150-200个碱基,我们在测试的时候也可以做到300个碱基。但是这个方法能否像现有的技术一样,能够非常稳定、非常可靠地在实践中得以开展,这还需要更多的时间,我们也希望今年在NGS大会上,可能会有更多的数据和大家分享。

实际上,我们刚才提到的这些,无论是针对StLFR这种新的建库策略,还是Cool1NGS这种新的测序方法,其实都是为了能够获得一个比较完美的结果,如果没有达到完美,我们也是希望尽量接近完美。(图示)这是我们早期的一些工作,是希望能够借助于现有的一些技术、现有的一些策略和平台,能够实现Perfect Genome,能够提供一些相关的解决方案。这篇文章大家如果有兴趣也可以看一下,我们把对Perfect Genome的一些理解,还有一些技术的思考都总结在这篇文章里,大家如果有兴趣可以看一下。

当然,测序技术发展到现在,走过40多年的历程,现在已经不仅仅是满足一个普通的测序,大家肯定希望测序的结果更加理想,能够提供除了在序列上的一些信息,还可以了解到单倍体型,因为人类就是单倍体型,因为有些疾病和单倍体型也是密切相关的,也是和印记相关的一些疾病,因此这个信息对于我们来说,特别是疾病的研究,都是非常非常重要的。所以,我们的目的是要实现一个完美的基因组,当然我们现在还在路上,还有很多的工作需要做。我们华大智造的途径就是给大家提供更好的工具,包括平台、技术,当然还有更加系统的解决方案。华大智造2016年注册到现在,刚刚走过了三年的历程,我们除了现有的拿到药监认证的几款测序仪以外,实际上从它的上游,包括核酸的提取、建库,包括下游的数据分析,实际上都有了一个产品家族,相关的一些设备以及一些软件、试剂盒,现在已经开始对外提供相关的服务,也是希望大家能够关注和了解,有感兴趣的同事们也可以试一下。

(图示)这是我们的一些关于读长和碱基识别方面近期的一些工作,华大智造的使命是为生命科技领域提供核心的工具,如果各位想有更进一步的了解,可以到A13的展台。除了一些基本的展示以外,这两天还有一个主题的讨论,就是从LDPIVDNGS如何从服务走向产品,也是希望能够和大家探讨一些新的合作方式。我们接下来还会组织一些NGS的技术峰会,也请大家可以关注。

以上是我分享的内容,谢谢!

主持人:由于时间关系,就不提问了,因为展台就在旁边,大家可以去现场交流。下一位是来自哈佛&麻省理工Broad Institute的谷博士。我当时看到谷博士简历的时候,我就看到了RRBS,看来于老师讲甲基化,讲了很多RRBSWGBS甲基化相关的趋势技术,而谷博士是RRBS的发明人,待会儿谷博士还有提问,不知道会不会一会儿针对于老师讲的内容,会做一些点评。

谷红仓:首先感谢郝总这次和大家见面的机会,我也是在美国20年,第一次回国内参加会议,做的幻灯片也大部分是引文的,只是标题翻译成中文,翻译可能也有许多错误,如果有错误请大家原谅。

我今天要跟大家讲的是单细胞甲基化和转录组RRBS-SMART技术在干细胞和肿瘤细胞演化中的应用。我最近刚刚入职浙江圣庭生物科技公司,另外我还参加American Board of Medical Genetics and Genomics(ABMGG),这是第一届LGG fellow,希望将来回来以后开自己的基因诊断实验室。

今天向大家介绍三个方面:一、表观遗传/DNA甲基化修饰背景介绍,于教授讲很多了,很多地方不再详细讲;二、RRBS技术,我从2002年做到现在做了十几年,还有一种是RRBSSMART技术结合起来;三,重点介绍一下用同一个细胞做甲基化和RRBS-SMART的技术应用及应用前景。

大家都知道我们人都是从一个单细胞发育而成,具有200多种不同细胞组成的个体,我们的基因组只有一套。但是为什么干细胞、脑细胞和血液细胞形状和功能都不一样?背后的原因就是表观遗传调控所造成的。

表观遗传调控主要有两个方面:第一个方面,DNA的甲基化;第二个方面,组蛋白的修饰,我们今天重点讲DNA的甲基化。DNA的甲基化,主要起基因沉默的重要,沉默的方式有两种:一种方式,甲基化的修饰。

甲基化的修饰。转录因子结合到启动因子,一个是直接的,另外一种是间接的,间接的是另外一种专门用蛋白,叫做Methylated CpG Binding Domain,结合到Methylated CpG 上以后,其他的转录因子就无法结合,这是两个不同方面的原因,就造成基因转录的沉默。

组蛋白的修饰比较复杂,大约有上百种修饰,这个修饰主要是通过调节结构,然后把基因沉默或者把基因的开启。

在哺乳动物里面的甲基化,我们刚才提到甲基化有一个特点:一般是在CpG共同出现的时候,它在C里面,当然后来发现也有别的位点,但是这种比例非常低,而且生物学意义不是特别明确,所以我们这边就不过讲这个东西。

大家可以看到DNA甲基化主要是70-80%CpG位点,如果CpG共同出现了,它是甲基化修饰的,就是说(英文)。但是有一段区域叫CpG岛,一般是CpG共同出现(英文)。在老鼠里面,大约有1.6CpG岛,在人里面有2.7万个CpG岛,60%人的基因是有CpG岛的。

DNA甲基化有什么功能?我刚才也介绍了,第一个是细胞和组织特性基因的表达是由甲基化进行调控的,另外女性有两个染色体,其中一个染色体是沉默的,它的沉默原因是染色体基本上被甲基化了。另外DNA甲基化对基因稳定性起到很重要的作用。在疾病包括肿瘤上会看到非常严重的反常甲基化。

在肿瘤中反常的甲基化表现为两个方面:第一个方面,大家看到在你们的右边,肿瘤抑制基因会增甲基化。增甲基化,就是说把肿瘤抑制基因关闭了,这是一个显著的特点。另外一个显著特点是重复区域,但是在重区域,一般情况下manslencen(音)程度非常高,但是在肿瘤细胞里面,它的程度会降低。降低以后,基因组的稳定性就要降低。所以在肿瘤细胞,会发生很多改变。

我下面介绍一下我自己做RRBS技术以及RRBS-SMART结合的技术。RRBS技术,我从2000年开始做,我们当时选的是Msp1。我们选Msp1的原因是因为我们做了很多实验,发现这个酶得出的位点特别多,这个酶对甲基化是不敏感的,而大部分的Msp酶对对甲基化是敏感的,也就是说就不能切了。这个酶切了以后,我们最初泡电容胶,选择不同大小的片段,用这些片段来预测。这是我们当时的预测值,大家可以看到如果我选择40-220BP的片段,我们能对CpG岛区的伏击,倍数接近50倍,这是老鼠的,如果对人的话,能达到30倍的伏击,原理就是我们用很少的测序,得到很多CpG岛的信息。刚才我也提到CpG岛主要是基因调控有关,这就是基因调控的核心,也是甲基化研究最重要的区域。

这是我们发表的文章。大家可以看到实验值。如果我要用RRBS,我们可以得到老鼠和人都是接近70%左右的Genen Prometer,而且增强值信息也可以得到20%左右。

这是RRBS。我做RRBS一直做了十几年,我2006年从哈佛医学院做了两年博士以后,到Eric Lander负责高通量基因测序,就是在甲基化测序的工作。当初最初做的时候,我们是用鼠式(音),读长比较长,是300-500。但是用胶原性测序(音),处理DNA的过程中DNA得到大量讲解,超过500BP以上的片段很少了。所以我做了三个月以后,我就放弃了。然后是Solexa第一代测序仪,当时我就把我的样本送到英国去做RRBS。大家可以看到经过这十几年,我们最初DNA用量是10的微克,因为这个方法应用越来越广泛,经常有很多人问能不能用量更少一点,我一直在做方法优化的工作。在2010年我们就写了一个Nature Methods,当时就把DNA微量从4微克降到30纳克。发表Nature Methods以后,还经常有人发邮件问我到底怎么做,我就不停给大家解释怎么做,后来我们就想干脆写一个方法,所以就写了Nature Protocol,大家都知道Nature Protocol比较详细,包括从哪个公司定的试剂盒、样品,都写得非常清楚,所以后来应用越来越广泛。

最近我们又用这个方法,把第一用量降到10纳克,其实10个纳克的量也是非常大的。我们也是用老鼠,我们合作者就说能不能降低一下量。我从2013年开始做单细胞的RRBS,最终把用量降到单细胞。大家可以看到在2017年的时候,我们把RRBS又和SMART结合到一起,对同一个样本同时测。最近我们发了篇Nature文章,把RRBSSMART结合起来可以测单细胞。从用量上,大家可以看到我们最初是10微克,我们现在可以做单细胞,就是说有一个细胞,可以做单细胞。

在讲我们这个技术以前,我想给大家简要介绍一下,因为有很多专家可能比较熟悉,有的年轻的可能不是特别熟悉。我们为什么要做单细胞测序?因为常规细胞的测序,无论你拿到主样本或者培养的细胞里面可能不止一种细胞类型,培植组织有不同的细胞类型。如果拿到共同测,你会得出平均值。大家可以看到在你们左边的图就是平均值,如果population用单细胞测序,也可以得出两个不同的population。样本经过处理以后,population如果要用常规的方法,也是一个平均值。但是你要用单细胞测序,你就会发现上面和下面有明显的不一样,它的机理可能也是不一样的。

我做单细胞测序,目前市场上也有相关的方法。在市场上有手工的,还有自动的,有很多方法,包括流式细胞仪、激光辅助单细胞分离、微流控芯片单细胞分离仪,已经应用比较广泛了,而且细胞仪1个小时可以收集上千个细胞。所以从分离细胞的角度来看,已经非常成熟了。另外还有循环肿瘤细胞分离仪,你可以把取出来看癌细胞的甲基化和转录组的情况。

这个幻灯就讲我们的原理。你拿到样本以后,首先用磁珠和mRNA结合起来,先把mRNA拉下来再做处理。因为我刚才讲到了在DNA上面有很多组蛋白结合,如果你用酶切的话是切不动。把拉下的DNA,我们做RRBS,用Pull-T结合磁珠,用mRNARNA-seq测序。整个建库周期是2-3天,而且这种方法可以是自动化的。

我们第一个实验做的是早期老鼠发育,当时样本就是提取500-1000个细胞。大家可以看到技术的稳定性,我们首先做了技术稳定性的检测。大家可以看到我们用500-1000个细胞,能得到CpG数量是2.7million,刚才于教授也提到在人体表达有2.8million,相当于10%CpG RRBSRNA-seq,我们基本上和通常的RNA-seq得出的结果非常相近,我们能拿到上万个基因表达情况。大家可以看到Pearson非常高,也就是说样本的重复性非常好。这是样本之间重复性的比较,可以看到值是非常接近的。

在这个技术成熟以后,我们用小鼠做模型,做靶细胞,做不同阶段,样本收集到500-1000的细胞,然后进行基因建库,建库以后分析RNA表达的情况。文章比较长,我不详细介绍,就讲和临床相关的结果。就是说我们从上胚层到胚外谱系发育中,我们通过找信号通路,改变基因表达,我们发现大约有500个基因是增甲基化的修饰。发现500个基因从体细胞向癌细胞转变,改变了500个基因,然后我们就得出结论:胚外谱系发育过程中,和癌症的发育有许多相似之处。

刚才讲的是用500-1000个细胞做的RRBS-SMART测序,这边讲一下单细胞的情况。单细胞的相对难道大一点,因为大家知道单细胞里面老鼠有5 parte gream(音),人是6parte gream,量是非常小的,所以做起来相对比较难一些。我们首先用化合物把细胞膜破裂,把MRA释放出来以后,结合磁珠把MAR拉下来,拉下来做单细胞的INC(音)建库。上清(音),我们再用蛋白酶消化一下,把组蛋白去掉以后,用磁珠把DNA拉下来,拉下来来做单细胞的建库。

这是我们技术稳定性重复性实验的实验结果。大家可以看到我们当时做RRBS,我们也做了很多不同的工作,我们发现如果读3.5million测序,我们就可以得到大概50万个CpG信息。做RNA-Seq这一块,如果我们做3.1million,可以得到大约14千个基因表达情况,我们认为效果还是可以的。

这是我们做的RRBS和另外一种方法(scTro-seq*)的比较,另外一种方法也是用了我们的RRBS,但是用了不同的反应体系。RRBS的读取,大家可以看到我们有3.5million,我们也拿到50万个CpG信息,他们的方法是用23million,才能拿到相同的CpG。主要的原因,他们用了Transcripts Detected,我们的方法在detected上进行了加工。做单细胞RNA细胞测序,也可以看到3.1million就可以拉到14千个,用另外一种方法可能需要比我们多一些才能拿到14千个。

技术成熟以后,我们就开始和哈佛医学院进行合作,我们合作的样本用的就是慢淋和正常B细胞。我们测了两千多个慢淋和正常细胞,然后进行对比。对比以后,我们就找一些表观突变规律。大家可以看到在正常细胞里面,表观突变文章里面有详细的介绍,我们起了一个名字叫变化,正常表观遗传突变率相对比癌细胞高,但是慢淋的癌细胞里面细胞之间的差异是比较小的。从氧化的角度来讲,这也是合理的,因为正常B细胞的慢淋细胞发育相对比较晚,细胞之间的差异值比较小一点。但是我们看突变速度,大家可以看慢淋、B细胞表观突变率比Normal B Cells快得多。另外,M-CLL,我们也发现细胞通路和基因改变情况和正常细胞不一样。

刚才讲了我们自己的一些工作,因为我们是NGS技术大会,我就想讲一下这种技术别的用途,当然大家做各种不同的研究。对于早期发育,是我们合作的实验室一直要重点做的东西,所以我们一直想把这个技术做优化、做早期发育。因为很多遗传病的发育,如果是最初一个细胞出现突变,可能对后来的影响非常大,这是我们关注早期发育重要的原因。在一个早期发育,因为细胞数量特别少,取得的数量特别少,所以这种方法可能有很多应用的前景。

另外在肿瘤上应用,应该是比较多的。大家知道在目前来说有三个不同的机制讲肿瘤细胞的演化。一个机制是随机的,正常细胞随机突变转化成肿瘤细胞,无限扩增造成肿瘤,这是一个机制或者假说。另外一个机制是肿瘤干细胞,在肿瘤上存在的干细胞。为什么做手术、化疗、放疗以后肿瘤会复发,因为肿瘤的干细胞没有去掉,肿瘤干细胞过一段时间会继续生长,长成肿瘤细胞。另外一个假设,说把前两种结合起来,就是说如果我们大量对单细胞进行测序,各种不同的肿瘤细胞做RRBS表达谱的测序,我们有可能放在肿瘤细胞的测序模式,有可能跟癌症有所差异。另外我们可以用这种方法来监测突变的时间和突变的进度。另外我们可以辨别原因趋势突变基因,另外我们也可以评估治疗效果。

RRBS-SMART技术,大家知道肿瘤上有一些细胞杀死了,有些细胞没有杀死,为什么没有杀死?我们可以把细胞找出来,让它做表观异常和转录谱,找出一些规律性的东西。

因为我和哈佛医学院肿瘤研究所做了五年慢淋的工作,对血液病的研究还是非常感兴趣的。感兴趣的主要原因是血液病特别容易取样,另外是各种不同的细胞,B细胞、T细胞、白细胞的(英文),(英文)很容易做纯的population。通过做RRBS-SMART,就可以看甲基化修饰的改编和转录谱的表达,可以找出一些规律,包括用药治疗前、治疗后。因为我马上要到公司里面,我们就想把这种技术在公司里面开展。如果有哪位医生对我们的技术感兴趣,我们可以回一下他。

以上是我们的工作。当然这里有很多人,光靠我一个完不成。首先要感谢eric Lander,我当时加入他的团队就负责NGS的开发。最初我们开发RRBS,我们为什么开发RRBSRRBS,当时做的费用非常高,一个样本的量在当时是是20万美元。Eric Lander2亿的课题,4年了,但基本上尽管我们有这么多经费,我们还是做不起,所以这是开发RRBS的初衷,也感谢Eric Lander的支持。Andreas Gnirke是我的老板,大家知道靶向测序就是他的技术。PatrickBoyleAnnan是我的助理。合作的大部分项目,主要是和Alexander Meissenr教授合作。刚才讲到的慢淋工作,主要是和catherine J.Wu合作。另外还有博士后叫DAN A.Landau,他现在是教授。我今天演讲到此结束,如果大家有问题可以问我。

提问:非常感谢报告!我终于见到RRBS真人。RRBS我自己的理解,您一直在做这个东西。当然您提到RRBS会符合一些资源,但是我觉得RRBS最主要的资源是RRBSMAP,因为酶切位点是确定的。所以RRBS做的结果,往往是准的,和其他比起来。虽然他的MAP低一点,但是我一直觉得RRBS为什么后面能够做,最主要的是MAP是准的,所以尽管它测得少,但准。这是它后面发展应用非常重要的东西,不知道理解对。

第二,我也看过最早用单细胞甲基化测序,确实用RRBS。但是我也看到一些人,有的结果做了以后,我看到做的结果,其实很多是我自己觉得还是有很多问题。比如说他做的很多甲基化单细胞测序,其实没有他想象中的好,比如说讲到它的变化,其实是很低的,但你通过统计看它的值还很好,但是我觉得在实际应用中会有非常多的问题。再有我觉得单细胞甲基化测序确实有很多瓶颈,您如何看待细胞甲基化将来要解决的哪些问题,你觉得可能非常重要,使这个技术应用非常好。

谷红仓:谢谢于教授,感谢您指出了这一点,我忘记了这一点,RRBS当时最大的优点就是MAP特别高。为什么MAP率比较高?因为你用(英文)就知道切的位点,而且我们第一篇native文章的时候用MAP和(英文)进行make back,最后MAP率非常高。

第二个问题,RRBS单细胞测序是有很多问题,刚才也可以看到正常的,如果是完全(英文),我们应该能拿到几个millionCpG,但是如果是单细胞,平均能拿到50万左右,这样就相当于五分之一。为什么这样?大家都知道甲基化精标准测序是胶原化测序(音),就必须对提出的DNA进行化学处理。化学处理的过程中,大量的DNA会降解。我刚刚做这个东西的时候,我们用的量非常大,当时没有任何一个试剂盒,我们自己买,而且(英文)变化幅度特别大。尽管是这样,我们当时计算了一下,90%以上的DNA是会降解的。但后来很多公司推出了试剂盒,像(英文),降解率逐渐降低,我们大概能提升到到30%,这就是为什么我们只能拿到50万的CpG。您的评价很精确,这是有一定问题。但是因为你做单细胞,你不可能做一个单细胞,有做50个,有做100个,所以还是可以看到MAP很重要的规律,就是说量还是起挺作用的重要。而且现在的RRBS-SMART费用很低,美国成本价,我计算一下就不到1美元,这是做建库的费用。测序的费用,美国应该比国内高,国内要低一点。所以你如果测上千个,规律的东西还是能做到的。

提问:古老师好,RRBS是我博士期间发表的第一篇文章,就是用NGSRRBS,当时我和丹麦奥普斯大学的李健(音)博士一块发表的,您好像已经忘记了,当时确实还给你写过邮件,咨询RRBS酶切方法的技术。RRBS方法,在我看来它有非常大的优势,刚才于老师和您都提到了,当然它有一些缺陷,很多实验室实际上很难把它做得很稳定,它有很多要注意的地方,特别是酶切不完全,包括后续的丢失率也很高。我想您把它商业化也处于这方面的考虑,把它做成试剂盒。

我想问的是您为什么选择白血病作为切入点,是基于之前文章的考虑还是有别的客观,因为我对白血病领域的甲基化不是特别了解,这是不是一个特别明确的需求,RRBS方法应用进去有什么样的优势?

谷红仓:谢谢!我们做白血病,我刚刚讲是我有一个医生一直在做白血病,慢淋有一个好处,就是收集样本特别全,美国医疗体制和中国不一样,你一般找这个医生,就会一直找这个医生。所以他收集样本,从一个健康人到慢淋早期,他都有样本。另外的优势是他的细胞,你可以分得很细,用药、突变等分得很精细,这样的话你想找一些规律的话,可能相对比较容易一些。你想做什么样的事,你最好是越纯的样本越好;如果用几种不同的细胞,得出来的结论的话,有些东西准确,有些东西有误导,主要的原因是population相对纯一些,我们很容易拿到。

支持人:下面请大家用茶歇。

(茶歇)


主持人:下面有请下一位演讲嘉宾,中国科学院神经所研究员杨辉博士!有请!

杨辉:很荣幸参加这个会议,也是我第一次参加这种类型的会议,非常好地可以和很多公司、企业、投资人都接触,大家相互学习。

我们实验室主要还是比较偏技术的,想必大家很多是做测序的,测出的疾病怎么治疗,我们主要是关心各种各样的测出来的一些基因方面的用基因测序的方法来治疗。

基因本身有许许多多的基因,这些基因都是由ATCG组成的,人类内有31个碱基对,但是往往这些基因有细小的差别就会引起巨大的影响。每个人的基因差异都是非常少的,可能相互之间即便我们和爱因斯坦之间,也是基因组的1%都不到的差异,即便和猩猩也是1%多一点。所以说,基因任何一些序列的改变,都会影响巨大。一个极端的情况就是一个碱基的变化,就能够破坏基因功能,比如说一个点突变影响了蛋白的结构,或者直接引入了一个中子密码子,这样的话,某个基因破坏了,就会对机体产生巨大的影响。比如说地中海贫血、白化病这些都是由于单碱基。

科学家早年就一直在探索,是否有一个工具能够将单碱基修复,但是要实现这个目标,科学家早在发现DNA双螺旋之后就一直在追寻,但是没有实现。为什么那么难实现?因为DNA非常小,第二是因为我们经常要对这个突变,我们发现哪个突变,然后检测它是否被修复了很简单,只要通过PCR测序就好了,但是我们有31个碱基对,你只对它进行了修复之后,那么另外31个是否被破坏了,这是一个非常巨大的挑战,你要看它是否改变,现在在基因编辑领域是非常简单的,但是对于其他的部位,你要检测它是否改变还是非常困难的。刚刚大家也说了,任何一个基因组的突变对它的影响都是非常巨大的,所以它如果引起一些其他位点的变化,很可能带来不好的影响。

首先,我们要了解一些基因编辑整个过程,基因编辑对基因组本身进行改变,比如说基因的插入、基因的敲除、基因的替换,其实很多单碱基突变的疾病其实是关注在这块。但是,任何这三块都有一个共性的过程,首先我们是需要找到这个位点,在31个碱基对里找到我们精确所需要编辑的位点。另外,要对它进行DNA断裂的切割,第三是切割之后有一个模板对它进行修复。

随着基因编辑技术几十年的探索,基因编辑技术手段也在不断革新。从第一代的聚合酶,它可以对DNA进行切割,但是识别的位点非常的局限,只能识别少数,所以对于绝大多数疾病都没有任何作用。而到了2005年,真正现代意义上第一代的基因编辑,就是锌指酶。它可以识别各种各样的位点,通过蛋白同源的结构,识别不同的位点,但是它需要不同的蛋白结构才能识别不同的位点,所以非常的复杂。经过第二代的过度,直到CRISPR出来以后,几乎每个实验室都可以做,为什么?识别的功能和切割的功能一切为二,这样不同规则来进行。这样的好处就是我们可以非常简易高效,而且可以进行多位点的作用,但是这个过程仍然需要DNA双链断裂,而且你需要DNA的模板,这还是非常的复杂,一是效率比较低,二是DNA双链断裂有非常多的问题,比如说DNA双链断裂会引起大片断的缺失,最近的报道可以高达几百K或者几兆,这是非常危险的。第二个就是染色体的易位,虽然它发生突变比较低,但是我们同时编辑很多个细胞的时候,总有一些细胞非常可能会成为癌症易感的细胞。自从这个技术2012年报道以来,大家觉得DNA双链断裂还是非常危险的,所以在2016年的时候,美国哈佛的一位教授发现了第四代基因编辑技术,就是单碱基编辑。它一不需要DNA双链断裂,二不需要修复模板,直接把核酸酶突变,然后融合一个端口,这个端口的作用就可以将C变成M,可以相互转换,就不需要通过化学修饰将一个碱基变成一个碱基,而不是需要一个模板来切割、替换、修复,这样的好处是没有DNA双链断裂,而且不需要模板,这样可以达到非常高的效率。

单碱基突变占所有DNA疾病的50%,所以它的应用在前期还是非常高的。而且通过单碱基编辑可以实现基因敲除,因为我们通过单碱基可以将一个不是中子密码子的变成中子密码子。所以我们实验室主要的目标是将这些基因编辑技术如何应用在罕见病的治疗,虽然说是罕见病,但是它的市场是非常巨大的。全球有7000多种,占所有疾病的10%,病人有3亿,儿童占50%80%是单基因遗传病,这给了我们非常多的机会。比如说唐氏综合征是我们最常见的新生儿的疾病,以及血友病、白化病等等都是由于一些基因的因素导致的。

整个基因药的概念是从70年代就有人提出,现在的药都是通过这种方式来实现的,既然内源基因破坏了,引入了突变,就讲到一个非常简便的方法,不是将它修复,而是将这个基因外源直接导入到细胞,来弥补这个缺陷的细胞,达到基因治疗的目的。但是通过各种方式导入的细胞,维持的周期大概是几周、几个月到几年不等,最长是可以达到2-3年的周期。如果通过人体整合的方式,它是非常危险的,因为它会发生随机的整合,当时90年代就因为这个方式死了两个孩子,整个基因编辑治疗领域降温了十几年,所以现在大部分都是采用一些非整合的方式。大家也说了,可能2-3年对于小鼠来说足够了,但是对于人来说,50%疾病都是由儿童时期发病的,所以效果还不是太好的,而且通过这种病毒的方式,能导入的因素,两三年后继续给药就是了,但是经常会产生抗体,就需要换一种血清型的病体,所以这是非常难实现的。所以基因编辑出来,似乎大家都找到一种完美的方式,基因突变之后,直接用个CRISPR-Cas9修复,可以达到很好的效果,因为DNA一直是稳定存在于整个细胞生命周期里的。

但是最大的问题,因为它非常的活跃,所以一旦DNA引入了不好突变的时候,也是终生的。现在成体治疗最关心的突变不是导致细胞功能的异常,因为突变的概念即便是千分之一、万分之一的话,其实死掉的这些细胞关系不大。但是经常有一个致癌的风险,如果这些突变发生在一些癌基因或者易癌基因的时候,如果要达到一定的治疗效果,我们经常对几千亿、上万亿的细胞进行修改,即便脱靶的风险是万分之一或者千万分之一,都有大量的细胞产生了各种各样的突变,特别是一些癌症高发和经常常见的一些染色体的缺失和易位。因此解决脱靶问题,其实整个基因编辑技术出来以后,大家一直关心的问题。

早期的基因治疗,大家还没有那么关心,因为你不是对内源的DNA进行修改,但是因为基因改变技术太强大了,对内源技术进行修改以后,所以大家日益关注它。但是现有检测脱靶的方法,都是依靠DNA双链断裂,就是早期一二三代技术的核心,就是要DNA切割了以后再修复。但是DNA双链断裂的方法,大家通过这种方式可以复制它,然后通过高通量测序来做,不过这种方法需要大量的细胞,而且需要DNA双链断裂的产生才能捕获到这个位点,而且受各种各样基因背景的影响。

但是新一代的单碱基技术发现以来,通过这种技术检测的话,大家都无法观测到,因为单碱基的技术不产生DNA双链断裂,所以各种检测方法检测出来都认为它是非常安全的,但是它又是一个脱氨酶,它本身有致癌的风险。所以我们也很关注这个问题,就建立了一个新的脱靶检测体系,这套脱靶的检测体系有几个不一样的地方:第一,基因背景完全一致。受精卵大家知道,它的分裂以后可以变为两个细胞,这两个细胞理论上最多由DNA复制产生,理论上它的DNA是几乎一模一样的,所以它们的遗传背景是非常类似的。然后我们对一个细胞可以进行编辑,一个细胞不进行编辑,因为受精卵非常大,是唯一可以体外做检测的细胞。我们编辑之后,因为不像体外基因组扩增,因为它会引发很多的突变,所以我们让它自我产生大量的细胞,再将这些编辑的细胞和不编辑的细胞同时进行高通量的测序,这样就可以进行比较,这样的好处是基因背景完全一致,而且不需要基因组体外扩增,全基因范围检测,没有偏向性。

通过这种方法我们比较了,如果这两个胚胎来源于一个受精卵的话,大家可以看到通过这种方式,它的背景是非常低的,我们只能检测十来个SNVs的产生。如果这两个胚胎是来源于不同的细胞,遗传的背景差异有几千个,所以说遗传背景一旦非常高的时候,就会掩盖基因编辑会产生的突变。这个方法就是非常灵敏的,和自然突变一模一样。通过这种方法我们发现CRISPR-Cas9不会产生单核苷酸的突变,因为它是通过DNA双链断裂产生的,而通过以BE3单碱基编辑会产生大量的SNVS脱靶突变,所以说现有的技术是非常不安全的,可以产生20个突变,每次会产生几百个突变。大家可以想象,如果我们做地贫,可以分离很多的细胞,一个细胞就产生一百个突变的话,有大量的细胞就可以产生无数个突变,是非常危险的,而且是不可预测的。这种突变都是完全随机分布的,就是因为APOBEC会融合一个APOBEC1,就是因为融合这个APOBECD导致的突变。因此,目前BE3技术存在非常大的隐患,不适合作为临床技术。

所以我们建立了一种非常高效的突变方法,这样的话,我们首先通过这种灵敏的技术可以检测到以前大家普遍认为安全的,但是其实它是不安全的,因为我们的检测方法不够灵敏。但是一旦有了这个灵敏的方法以后,我们就可以建立一个新的行业标准,通过在这个基础上开发一个更安全的基因突变手段。

在上周nature报道,单碱基编辑技术不仅会造成DNA脱靶,还会导致大量的RNA脱靶。其实我们的工作发现也有类似的效果,发现类似效果之后,我们通过生物工程基因编辑的手段进行改造的话,我们可以去除它。所以说虽然通过非常灵敏的方法进行检测之后,然后对它进行改造,是有可能获得更安全的基因编辑工具的,而不是说这个方法以后就不可以用了。所以说,我们通过这些手段首先要建立一个非常好的方法,之后就可以建立新一代的高保真基因编辑工具,我们也申请了一批高保真基因编辑工具的相关专利。

我们实验室关心的,首先是更安全的基因编辑工具的开发,建立一些人源化动物模型生产平台,建立这些模型之后,利用这些新的工具对它进行基因改造。这些功能检测以后,我们最大的瓶颈就是如何建立一些GMPAAV的病毒生产与安全评价平台,这是我们自己在开发的,也在寻求一些合作,这样我们就可以从基础科研做到病人身上去。所以,我们在去年年底成立了辉大生物治疗公司,也是聚焦于罕见病基因药的研发,也希望和大家合作。

我们公司主要关注于三个系统,一个是神经系统,任何神经性的疾病或者运动神经的凋亡,其次就是眼睛和耳朵相关的疾病,我们都有自己相应的研究。

目前,公司主要是研发一些GMP的生产平台,小鼠动物实验都已经完成了,现在正在等待一个适合的GMP药物,最终申报临床。

谢谢大家!

提问:我首先提一个非常尖锐的问题,刚才您的PPT里,头发丝直径的单位用错了,是微米而不是纳米。开个玩笑。

第二个问题,您是基因编辑的专家,您对贺建奎教授的行为怎么看待?因为我知道在2017年曾经发过一篇论文,一下激起了众怒,所有人都在反对,所以您是怎样的观点?

杨辉:大家的观点比较一致,无论是学术界也好,社会也好,政府机构也好,国内外也好,都是一致强烈反对这件事的,这是有违伦理的。第二,基因编辑技术本身就非常不成熟。

提问:咱们谈技术,不是伦理、观念、法规,您的观点就是对脱靶的风险有过高,您有一个非常棒的验证脱靶率的方法,您有没有去验证(英文)。还有一个问题,(英文)做这个是不是和不同的人有关,你做脱靶率就高,或者他做脱靶率就低,或者说大家都是近似的,这是一个什么样的概念?

杨辉:基因编辑胚胎有两个问题,一个是脱靶,还有一个是效率的问题,就是无法保证100%的编辑,等于有些细胞被编辑,有些细胞不被编辑的话,这个人出生出来就是个怪物,如果疾病的病灶没有被编辑,就会被患病,所以说就无法预测。现在这个技术远远还没有成熟,在胚胎方面。

提问:脱靶,到底怎么样?

杨辉:脱靶也一样的,其实每个人的基因背景不一样,这造成脱靶可能预测的就不一样。真正用在人身上,容忍性要好一些,但是对于胚胎来说,每个人的背景不一样,一旦造成一些有功能的特定序列就会有危险。脱靶的问题,现在整个领域特别在胚胎上。

提问:您刚才是用单细胞在研究?

杨辉:我的单细胞研究是动物,动物的单细胞我们还在体内进行扩增。

提问:您观察到了它是一个细胞在这个细胞上脱靶率高,在那个细胞上脱靶率低,一个细胞和一个细胞不一样,能有这个现象吗?

杨辉:不是,关键就是基因编辑工具本身,就是现在没有一个单细胞非常好的测序技术,我们的细胞虽然是单细胞编辑,大家它要发育成很多个细胞,然后再去做分析。但是人的胚胎很难,人的胚胎最多到(英文),所以你无法获得足够量的细胞。如果有谁测序技术能够在单细胞水平做成非常稳定,没有引入突变的,我现在也在寻求和很多人的合作,这样真正到人的胚胎上,至少在脱靶验证方面就可以了,现在人的胚胎,贺教授做的就是取几个细胞,然后说它没有脱靶,但是经过了层层的过滤,都是不可信的。

提问:所以您是很担心脱靶率,认为脱靶率很可能存在?

杨辉:对,很担心,现在的技术不可靠,你说它有或者没有,都是不负责任的事。

提问:您提到的2017年的争论,您是持什么样的态度?是确实存在脱靶?

杨辉:要看实验的目的。有些脱靶其实做动物的话,脱靶关系不大,因为你会得到很多个动物。到了人的时候,胚胎是要求最严格的,胚胎如果脱靶到一些正常的基因。

提问:所以您的观点是确实存在脱靶?

杨辉:脱靶肯定是存在的,概率不一样。

主持人:刚才杨老师也提出了一个需求,就是说测序技术的精准度如果非常高的话,其实在今天存在很广阔的应用场景,下面我们从另外一个视角,我们请广州医科大学范勇教授,他是做生殖类基因编辑相关的研究,看他做的工作。我们从工具的研发,从医生临床的角度来讲,大家都从不同的视角来评价相关的技术和应用,有请范教授!

范勇:非常感谢郝总的邀请,来跟大家交流一下我们在生殖方面的应用,以及实验室作干细胞和基因编辑的内容。因为我们医院主要在生殖方面胚胎方面做的研究,所以跟大家做一个简单的汇报。

中国人口众多,每年出生儿一千多万,可能比欧洲一个国家还多,但同时面对的问题就是我们的出生缺陷人口非常多,我们以前的数据可以看到我们每年大概90万的出生缺陷婴儿的出生,比美国发达国家高非常多。

其实我们国家每年投入很多的钱,对人口素质的提升,那就是出生缺陷,尤其是在广东、南方地区的单精病非常常见,以广东为例的话,人群的携带率高达百分之十几。还有更多的是遗传性耳聋,现在很多地方的政府作为公共的检测,耳聋出生率也非常多。

其实我们国家对出生缺陷非常重视,每年各种医院做产前诊断等各方面的干预措施,但是我们也能够发现很多疾病尤其是我们国家人口众多的情况下,耳聋可能是没有办法完全避免,尤其是我们存在很多聋哑人的情况。还有一个问题是我们随着年龄的增长,女性的卵子会逐渐老化。最后一个问题是生殖率的下降,会带来线粒体遗传疾病的发生。我们现在很多的情况,大家可能知道2016年美国已经出生了“三亲婴儿”,通过捐卵来去掉疾病,这里存在很大的伦理问题。

我们以前在没有基因编辑技术出生的时候,要做基因治疗是非常困难的,所以CRISPR出来以后,对基因的编辑或者修复效率大大提高。

我们以前实验室在没有基因编辑技术出来以前,我们做干细胞的修复,我们做地贫的使用率非常低。现在技术出来以后,我们在人的地贫干细胞,能够把基因很精准的修复,而且是做无痕修复,为以后的地贫安全治疗有一定的基础。我们知道最近英国人的iPS治疗上了临床,在眼睛方面。我们知道这是对出生以后的地贫治疗,我们必须要靠造血干细胞移植。

很多人就想到在没有出生之前,地贫能不能通过服药来进行修复?怎么办?我们知道在2015年的时候中大教授在多精受精卵里面做了这方面的研究,但是存在一个问题,它的效率非常低,而且存在脱靶的情况,脱靶是非常严重的问题。

我们实验室通过捐卵,在受精卵里面做了报道,当中用了蛋白来做。当时我们通过CRISPR方法没有检测到脱靶,但是我们又做了神经组,刚才落实也说了你这个检测的方法或者精度适合,而且我们做的量也非常少,所以在未来情况下也存在很大的挑战。

我们后面实验室还做了大家非常关注的基因编辑婴儿,我们在2015做了基因,我们是用分析平台来做,对平台里面42个碱基做了精准的去除,当然我们当中可能没有做全精测试,只是对一些脱靶位点、高风险的脱靶做了验证。但如果做神经组测序的话,可能也会有不同的SNPR的关联。所以我们的文章只是从一个概念上,证明我们在胚胎已做成基因编辑,对基因的精准编辑是可行的。

除了基因组的遗传病以外还有一个很重要的问题是线粒体的遗传病,在女人的卵子里面。在女性躯体中,存在线粒体遗传疾病。我们现在对线粒体遗传病的治疗,或者出生健康婴儿最多出于成熟的方法,最多是用线粒体置换,用正常的卵子把线粒体换掉,出成一个正常的婴儿出生,我们知道最早是英国赞同这种方法的出生。我们最开始在2015年加拿大也出生这样的线粒体的婴儿,通过胞质注射的方法,把正常的线粒体注射里进去。突破性的是2016年在美国做的“三亲婴儿”,就是通过两个母亲的遗传物质构建的“三亲婴儿”。

其实这个技术,对我们做胚胎来说非常简单,只是要在人上找到卵子来源,正常的卵子人员是比较困难的。

我们知道正常的胞质置换或者是“三亲婴儿”,其实被科学家证明存在一定的风险。因为我们知道来自两个不同正常人的线粒体,可能存在线粒体的瓶颈效应,但有可能在后期不断复制的情况下,突变的线粒体有可能再回复。所以美国科学家通过人的胚胎干细胞的实验,在猴子上证明胞质置换“三亲婴儿”可能存在一定的风险。有了基因编辑技术以后,我们知道线粒体是在胞质里面呈现单环状,我们可以通过基因编辑的手段可以把突变的线粒体去除,这是美国科学家做的,在老鼠上,他们证明了这样的情况。我们实验室在人上,选择病人突变的线粒体,构建iPS细胞,在iPS细胞上,我们发现通过基因编辑的手段完全去除突变线粒体。后来我们又构建人在猪卵突变线粒体,我们可以通过基因编辑的手段,我们在正常人卵里面如果把突变线粒体去除,我们就可以不用再找正常人捐卵,有可能可以减低伦理的问题。我们也做了人类胚胎发育修复,但是发育率和正常率还是存在问题,发育率虽然高,但效率是非常偏低的情况。所以在这方面,未来的应用还存在很大的问题。

我们都知道做人的胚胎进行操作,最主要的问题除了技术上的问题,另一个问题就是伦理的问题。当初大家很关注的一个问题就是说这种技术能否应用在人的胚胎上。我们最开始通过2015年我们国家的胚胎基因编辑出来以后,当初在国际上引起很大的讨论。我们最后得的结论,大家都会看美国到底是什么情况。美国科学院发了一个通知,是对基因编辑技术临床应用是非常谨慎的,它也没有完全否定基因编辑在胚胎上的遗传病的治疗,它说在某些疾病上完全没有替代方法治疗的情况下,在安全性得到足够证明的情况下,允许这方面进行胚胎基因编辑。

大家都知道如果美国允许这么做,为什么贺建奎这件事会得到这么大的反对?贺建奎的事情,完全是因为没有按照我们说的大家通行的伦理、通行的法则,完全是欺骗、伪造的手段,所以才会引起这么大的反感。我们在这里也跟大家说一下,我们做任何事情尤其是做这种敏感的事,一定要按照国家的法律法规做事。因为这个事件一出,对我们的基因编辑或者是基因治疗,其实在这个行业是很大的打击。国家的监管,虽然说会按照审批,当然我是深有体会的,科技部到过基金委,当然已经拿过了项目,然后我们到广东省去做。以后我想在做这方面的研究的时候,基本上可能很难拿到钱,而且以后的监管非常严。我们知道国家政府宁可不批,它也不愿意出现问题。所以以后要做这方面的事是非常困难的,所以它对我们这件事情是非常大的灾难,以后我们做这方面的研究。现在国家在这方面的监管非常严,如果以后要想做好一件事情是非常难的,我想说的是大家做任何一件事情一定要按照国家的法律法规走,如果为了利益或者为了钱做,最后的下场非常悲惨。

他违反了什么原则?其实在GAMA上发表的这篇文章,就是说如果对人类胚胎进行操作要遵循什么原则?第一,我们知道哪些情况是现有技术不能治疗的,才必须用,而且是要充分试行,还有其他方面的条件。所以我们按照这一条对,贺建奎的事完全没有一条是遵守这个情况。

出了这个情况,我们的技术是否完全被阻断了?我想可能我们现在近五年、十年不可能,很难保证十年、二十年以后技术完全成熟了,这个方法还能不能用,我想以后十年、二十年或者五十年,说不定变成一个常规的技术。按照现有的情况来说,如果真正以后要应用,应该要关注哪些地方?一个是有效性,尤其在人的胚胎上操作,它的有效性和在老鼠细胞上是有很大的区别,所以它的效率是很重要的一个问题,我们在临床上应用看重的是效率。第二是安全性,安全性如果不能得到保证的话,是不可能上的,刚刚讲到的脱靶的问题不能解决,很难通过伦理的问题。再是动物模型评估,我们现在用老鼠,但是小鼠很难代替人的评估。最后是能够形成一个标准的实验流程,我们原来在这方面做的是领先,但是到了后面,我觉得往后做的话,我们可能有可能落后美国,因为美国有很多是走在我们前面的,一个是基因治疗,我们现在在单细胞基因治疗、成体细胞基因治疗,在中国很难批,但是我们知道美国地贫都上了临床,所以对我们是很大的挑战。

最后我们的工作,也感谢我的合作伙伴,有了国家基金委的支持,谢谢大家!

主持人:谢谢范教授!刚才范教授提了很多他的数据,我比知道大家有没有相关的问题。

于文强:其实基因编辑这一块,不管怎么样,到目前为止我觉得作为一种技术的发展是没有任何问题的,当然你的基因编辑生殖细胞学是不允许的,体细胞是可以的。其实我觉得基因编辑对临床应用,包括我们做很多临床的应用是非常遥远,因为很多问题我压根就不知道。比如说最简单的,原来讲基因编辑,后来讲修饰,包括杨辉也讲了,原来我们觉得修饰以后,有的DNA还是可以修饰,但是现在的文章说不仅修饰DNA,还修RNARNA变化这么大,我说RNA,挺高兴的,变化这么大。其实我们对它不知道的非常多,包括现在技术检测的限制,包括还有很多未知的东西在这里面。如果一般人的RNA,比如说RNA的变化没有什么太大的问题,但你不知道RNA可以作为模板、做基因修复,一样还会带来很多的问题。所以我不知道从你做这个的角度来讲,对基因编辑技术在临床的应用这块,你觉得在哪些方面,可能前面可以先走,哪些方面压根就不可能去做。

范勇:现在我们对在临场上的应用,第一个要讨论的就是安全性,你在安全没有得到绝对保障的情况下,你根本就不可能上到临床,因为现在很多事情必须要经过伦理。现在不同人问的第一个问题是安全性,如果伦理过不了,就根本做不了。我们现在可能在胚胎水平上,大家说做研究,其实研究监管非常严,临床从现阶段不能考虑。更多是体细胞,比如说现在大家做很多的cati(音),因为以后这可能是最快来做这方面的,因为很多也是通过基因编辑,也是对体细胞进行修饰。因为它不可能有传递到下一代的问题,我觉得在这方面很快会有发明和应用,因为国外做了很多,我们国内很多公司、很多临床研究也是开展了非常多,这方面的体细胞的治疗应该是比较多的。

主持人:今天上午最后一个演讲者,他把这个演讲当作他的首发,把最新的基因编辑技术和NGS技术结合起来,做一个新的自动化检测的解决方案。下面有请杰毅生物的CEO王珺博士,有请!

王珺:非常感谢向稳,很高兴今天有这个机会到这里和大家分享一下我们过去两年的一些工作,也非常感谢向稳同意我坚持使用这个标题。我们希望能够搭建一个新一代的分子诊断实验室,很多东西是首次向大家展示。

分子诊断主要的应用场景是三个:肿瘤、遗传和感染,今天我们来讲讲感染。2018年,中国的综合性医院门急诊人数是33.6亿,有2.4亿的住院病人,有大约三分之一的病人最后是因为各种各样的感染。大家都知道,很多疾病最后死亡的原因也是感染,在这些海量的门急诊病人和住院病人里,大量的病人在没有得到明确诊断的时候就开始使用抗生素等等各种各样的治疗,最后造成了抗生素滥用非常严重,也造成了各种超级细菌。为什么会造成这个现象呢?我们可以看到,常规的要去诊断感染的病原体检测的流程是怎样的,基本上要进行一个接种、培养、鉴定、药敏的过程,大概时间是四天,这还是建立在这个微生物能够被培养出来的前提,培养出来的概率在临床上不到20%。这就造成整个病原体的检测流程,行业现象是又繁又慢,经常还没有结果。

什么样的指标是病原体检测的理想指标?我们的总结,病原体检测的理想指标是快、准、全。我们可能在座大家都是做分子诊断技术的,我们会非常熟悉似乎分子诊断技术是非常好的技术,但是在临床分子真的解决所有问题了吗?当你走进一家中国的三甲医院或者第三方医检所的时候,你会发现除了分子技术以外,其他的技术基本都有自动化的方案,而我们的分子技术基本是手工方法来操作为主。

(图示)图片中的一个板,是所谓的96PCR板,这是1996年在药物筛选领域,因为希望进行各种高通量的各种化合物筛选制定的标准,从此成为了分子诊断领域的标配。我们想象一下,如果我们的提取、配置、检测都是基于这样的板式,我们的任何环节一旦错过了就要等下一波。这样现象就造成了在中国顶级的三甲医院,一天做这样最常规的荧光电量PCR最多做两次。在这样手工的方法要解决感染的问题,可能要解决多个指标的时候,操作会更困难。我们经常在讨论一个板式化学发光,左边的图是板式的概念,通量非常高,一次性可以检测很多的样本,缺点是不够灵活,非常适合一次性检测同一种类型的同一个板标。管式是采用流水线的技术,会更灵活,更适合中国三甲医院的使用。我们就一直在想,有什么技术、有什么方法可以把分子检测做成流水线呢?我们找了很多很多技术,各种各样的方法,显然荧光电量不合适,因为它需要不停检测它的荧光周期。再后来,我们发现了一篇文章,是2016年发的文章,这篇文章讲的是C2c2蛋白可以用来做RNA-targeting,它的原理挺有意思的,这个蛋白的复合物和CRISPR聚合在一起,当有targeting RNA存在的时候,它一识别这个RNA,自己的构型会发生改变,这个蛋白本身变成一个有特异性的RNA酶活性,从而去切割所有体系内的RNA。在这个体系内,我们加入了一个探针,左边是荧光基团,右边是萃敏基团(音译),中间用RNA去进行连接,刚才被激活的蛋白就可以把这个序列切割掉,从而爆发出荧光。

(图示)下面的图是我们实际测试的图,我们当时很兴奋,有流感病毒做了大量的测试,但是我们发现这个技术的检测灵敏度还不够,只到了tm级别,不足以完成临床的分子检测。他们实验室非常厉害,一年以后发了这篇文章,用C2c2来解决病原体,这个技术被命名为夏洛克技术。其实所有后部的检测原来都是C2c2那一套,只不过在前面加上了RPA或者是RTRPA,把整个检测灵敏度从tm级别提到了rm级别,上升了10的六次方。夏洛克这家公司也在推广像图上这样可以提取、等温再做检测的产品,其实国内有很多公司在做这样的事情。

但是我们一直想解决的是自动化的问题,也做了很多的尝试,也直接把这套东西想用来做自动化。简单介绍一下RPA,它是英国一家公司的专利技术,是有5个酶的反应体系,它对反应条件非常好,只要37度就可以,灵敏度很高,效率也很好。RPA+C2c2检测DNA会是非常好的技术,当提好的DNA放到一个试管里,再加上RPAC2c2以后,就可以非常灵敏地检测到DNA是否存在点突变。刚才我也提到灵敏度也非常好,速度也很快,但是首先这个RPA是有专利的,刚才我说的夏洛克整套也是有专利的,我们不想侵犯别人的知识产权。同时,可能是我们能力的问题,我们把这套东西用在我们的自动化上,我们想在一个密闭的空间进行反复测试的时候,我们觉得RPA整套东西太灵敏了,还是会造成污染,稳定性还是不够。最后,我们把整套反应体系全部打散,今天做了自己全新的扩增体系、探针体系,这是一套针对RPA的扩增体系,所以更适合我们想解决的病原体的问题,能区分死菌和活菌,抗污染能力更强,速度也很快,通用性也很好,整个反应条件也是等温的,便于我们实现自动化。

(图示)这是我们的一个测试,我们对合胞病毒进行了测试,也把我们技术的灵敏度提升到了am级别。到这里,我们找到了一个属于自己基因编辑的核酸检测方法,整个流程还是需要提取、等温扩增、检测,我们就在想能否把他们串在一起,同时要解决感染问题,就需要在短时间内同时去检测多个指标。如何来进行多联检?下面我给大家郑重介绍一下我们第一个设备,流水线分子监测仪SMAP,我们重构了所有核酸提取的流程,采用了流水线的方式随到随检,每个样本90分钟内出结果,还可以进行灵活的组合。通量也很高,一天8个小时可以检测400个样本。和几个国际老大哥对比一下,这里我举了两个老大,一个是赛沛,它的理念是把样本加进去以后,推到机器里完成了DNA的提取,荧光电量PCR的检测,基本上会检个5个指标。它已经几乎成为了结合诊断的精标准,检出率非常高。中间是梅里埃,它是一个模式的POCT的卡盒,检测指标会更多,在20多个。2018年,这个产品全球卖了5亿欧元,我们和他们一样,我们涵盖了提取、等温扩增和检测的环节,不管是通量和成本、速度,都不亚于他们,甚至远远高于他们。

(图示)回到定向已知所有的检测里,我们X轴是应用性,Y轴是通量。我们可以看到,基于手工方法的常规荧光电量PCR的方法,不管是通量,还是检测方法,都是最差的。中间还有一堆现在非常新潮的各种POCT设备,他们也做的非常好,但是我们希望不管是用应用性上还是通量上,都能够做到最好。这是一个定向的检测方案。但是我们要解决我们的感染问题,常规定向组合的方式真的能解决所有的感染问题吗?显然不是的。因为据各种各样的文献显示,80%的脑膜炎,50%的肺炎,40%的败血症,到最后还不知道是什么病原体,经过测试也不知道是什么。我们在座非常熟悉的NGS就来了,针对各个部位的样本通过NGS的技术进行一次高通量的测序就可以知道是什么病原体。那么病原体测序现在做的好吗?我们觉得最大的挑战是时效性,现在我们是以送样的方式来做,需要3-5天才能出一个报告,但是我们面对的是危重的感染病人,需要和时间赛跑、抢生命。所以时效性非常重要,那为什么时效性会有问题?我们分析下来,实验流程显然是比较复杂的,又不像NGS第一个非常成熟的产品只有一个样本类型,而如果做病原测序的话有各种各样的样本类型,显然临床信息也更复杂、分析也更复杂,那么如何来解决?现在还基本上以手工的方式来做,也有自动化的,就是这样常规的非常常见的自动化工作站(图示),这样的自动化工作站通量非常高,但是到每一个点,我们同时有这么多危重的病人一起来,同一类型的样本,这样的自动化工作站一旦开始运作,再来一个新的病人,需要等这个工作站结束以后。

在这里我给大家介绍我们的第二款仪器,全自动化建库仪CubicsDx,这个设备比微波炉稍微大一点,每个是独立的通道。我们把样本放到这个塑料卡盒里,推到仪器里,仪器会全自动地完成核酸提取、建库等。优点是他们是完全独立的,密闭的,没有污染的可能,又因为是独立,可以处理不同类型的样本,机器可以自由的叠加,可以灵活地部署。我们也很荣幸,这台机器获得了工业设计界的大奖,德国红点奖。我们的想法是通过这样的自动化设备和台式的测序仪在医院的检验科或者第三方的检验所快速部署下来,能够让自动化的建库仪把人工的波动降下来,大大提高整个标准化的流程,配套的测序仪可以是多种多样的。

完成了这些流程以后,其实还有一个很大的挑战,是数据分析。病原体的数据分析远比我以前的经历要更复杂,因为临床信息非常复杂,不同的病人同样的菌可能是完成不同的表现,那么我们现在启动了metAI的智能辅助分析系统,我们希望通过不停的训练,能够训练出非常高水平的训练师,这是人工智能的辅助系统。

针对感染性疾病,我们的方案是什么?常见的、一线的、需要筛查的,我们用基于基因编辑的方法快速进行大量的定向检测,疑难杂症,各种各样不明原因的感染,上NGS

回到我的题目,新一代分子诊断实验室,这是我们的目标,我们心中分子诊断实验室不应该是手工的,应该是高度自动化的,更重要是高度灵活的。当有NGS加持的时候,它又需要AI的控制和分析。所以,我们心中的想法是要通过我们的努力,也邀请大家和我们一起,不管是在试剂、仪器、软件、AI各方面,一起要推动整个分子诊断技术的更快速的应用,让大量的门诊病人、住院病人,不要在没有得到明确诊断之前就开始使用抗生素,让各种危重病人及时抢救回来。也许在未来这个新一代的分子诊断实验室不是靠这样的六轴机器人,也不是常见的流水线的方式,但是我们心中想的是不遗余力推动分子检测的时效性,这对社会是有价值的,我们也一直坚信创新检验未来。

谢谢大家!

提问:大家好!您刚才非常强调时效性,也提到两种方法,一种是采用基因编辑的方法,另外一种是采用NGS的方法。请问,这两个方法的周期可以分别做到多少?实验室是在哪里?

王珺:先说技术。从技术上讲,基于基因编辑的方法,我们的时效性在90分钟之内,大概是16个指标。如果是基于NGS的方法,如果是基于(英文)平台,最快可能需要24小时,如果基于(英文)平台可能会更快一点。

第二个问题,我的实验室在杭州。

主持人:我刚才听的时候非常的陶醉。今天上午的演讲到此结束,谢谢大家!

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发