《转》访:王伟业教授 生物样本库的建设关键在于信息化架构和管理
导读 | 随着"十二五"国家科技计划的推进,我国的生物样本库建设蓬勃发展。上海交通大学医学院附属新华医院王伟业教授作为国外引进的样本库信息化管理专家,主要从事生物样本库建设和信息化管理方面的工作,指导多家医院生物样本库基本的建设工作。近日,转化医学网走进新华医院,对王教授进行了专访。 |
《转》访是转化医学网的品牌专访栏目,是业内专家、大佬、知名企业智慧交流碰撞的平台,也是促进行业健康发展的重要力量,《转》访致力于打造转化医学领域最知名的专家访谈栏目。
引言:随着"十二五"国家科技计划的推进,我国的生物样本库建设蓬勃发展。上海交通大学医学院附属新华医院王伟业教授作为国外引进的样本库信息化管理专家,主要从事生物样本库建设和信息化管理方面的工作,指导多家医院生物样本库基本的建设工作。近日,转化医学网走进新华医院,对王教授进行了专访。
在新华医院的科教大楼见到王教授,刚刚从一大堆工作中脱身出来,但依旧神采奕奕。简单的问候后,我们就开始了今天的访谈。
转化医学网:请王教授简单介绍一下我国现有的生物样本库概况?
王伟业:我国生物样本库的建设和发展,与欧美国家相比,虽然起步晚些,但是在短时间内的发展速度非常惊人。据我所知,2009年,样本库的发展是一个大的起点,大部分三甲医院都有或者已经计划建设自己的生物样本库。 相应的此领域内的各种活动也随之发展起来,尤其是生物医学发展快的城市。像北京,上海等地也有多家医院做一定范围内的联合发展形式。比如北京的重大疾病生物银行,上海交通大学医学院附属医院的十多个共同建设与规划发展的样本库。
转化医学网:我国医院样本库和企业样本库有什么区别?
王伟业:区别当然是从两个方面来看,优势与差距。简单地说,优势体现在资源丰富,种类多,相关部门的支持也是一个方面。不需要比较,只要从我们自己认识的角度来看待差距,我认为主要是三个方面的差距:1. 认识(理念)不足, 2. 缺乏机制,3. 缺乏模式。三者缺一不可,没有认识,不可能提出合适的模式,没有相应的机制,模式也实现不了。就我所接触而言,把样本库建设仅仅作为一种资源长期储存,或者把保存有多少份样本来评估样本库的建设目标的理念还不少。不突破这种认识,是一个差距,也显著影响规划和发展的目的。
我个人非常认同欧美国家采用的联盟(Consortium)方式在遵从规章制度的前提下,联合解决一些时间存在的问题。比如国际上的P?G(The Public Population Project in Genomics and Society)联合项目,其目的是促进群体遗传相关的研究者之间的国际合作。采用的是联盟的会员制,目前有大约40多个国家参加其中。发展的基本方式是共同研发并提供免费的研究性的信息工具和方法学来帮助建立样本库。统一讨论决定样本库建设的规划和应用样本资源相关的科研项目,而且会员可以按照联盟制定的规章制度申请样本和相关信息等。这样的例子还不少,比如欧洲的联合BioSHaRE计划等。我们目前这方面的差距还是很显著的。
缺乏模式可以用数字1和10来看模式与量区别,同时启动做10件事情,那么1到10各自差距加起来会造成很大的异质性(Heterogeneity),如果1完善了成为模式,其余按照模式做再根据个别需要改动,这对主要方面的统一起关键作用。所以我认为,我们需要探索符合我们的模式。所以我做的工作皆为探索模式。
转化医学网:我国对样本库的认识有哪些误区呢?
王伟业:如果说我们中国在自2009年开始重视样本库的建设,我2012年初回国,正好赶上了我国样本库建设的发展高峰时机。在回国后这两年多,我获得参加很多会议和与多方面的交流机会,也有幸加入众多的国内外在此领域内的交流。这些经历使自己能够在较短的时间内了解到了方方面面的现状和问题,所以我谈谈我自己的感受与认识来探索一下这个误区的说法。首先,我前面提到认识问题时提过的把样本库建设仅仅作为一种资源长期储存,或者把保存有多少份样本来评估样本库的建设目标,这应该算一个。我这两年多接待过许多来参观和交流的兄弟单位,也包括国际上来访的,单从提到的问题来看,也可见不同,或者也算是一个误区:把规划建设样本库的条件集中于硬件,包括空间大小,仪器多少,冰箱多少等等,没把相关问题集中到其他关键方面上,比如样本的信息化和样本库的信息化建设。我一直以来就不断强调信息化建设的问题,因为样本库的真正的价值不在样本而是其中的内涵,这就是信息,样本只是一定时间内存在的一种形式, 是转换方式。如同一个化学反应,样本是底物和中间产物: 一定时间后,样本的价值会消失,而其信息价值还是继续存在。可喜的是,近来从我交流的经历,现在,想要了解并研究的同志,逐步转到要求参观和了解样本库的信息化建设方面上来了。
转化医学网:我知道我们生物样本库最关键的是信息化管理系统,您能谈一下我们国内管理系统的现状和发展方向么?
王伟业:我在此方面的经验和知识比较专长,这里我倒是可以多谈一点。首先,我谈一下我国信息库的特点或者说弱点。总体来说,我国生物医学的研究远远超过其相应的信息化发展,也就是说信息化发展滞后。自然而然,样本库的信息化管理系统的研发也没有跟上样本库建设发展的速度。原因或问题是多方面的,其中主要的问题来源于两个方面,一是研发者,二是使用者。现在我国做样本库信息系统的IT企业缺乏懂得样本库信息化建设的人员,而基本将使用者需要的功能看作是研发的方向,结果是一个个要求的功能通过计算机的功能“堆积“成为一个管理系统。并且这样做有一个最明显的问题,就是缺乏样本库建设所必须的工作和管理流程,并缺乏相关的逻辑。虽然一个系统也许很快就能够满足要求,相应的也许是能够按照使用者的要求达到目的。另外,在不少人的认识里,样本库的信息化管理系统就是跟踪样本的出入储存管理等。因为这样比较容易或简单,但是这样的结果会造就多样的样本库信息管理系统。目前样本库建设国际上面临的问题之一就是不同样本库之间的信息相互不兼容,如此会更加造就我国样本库信息化发展的异质性或多样性,只会使统一的可能性越来越远。
另外一个方面,大家都知道样本和信息资源整合或共享,也常听到这是他们样本库建设的目的。但共享的前提是要能够交流,自然信息化就是样本资源共享的最基本,也是最为关键和最具有挑战性的问题。虽然现实中样本资源各自保留,阻碍了共享的发展,但其实我认为这是仅仅一种认识方面的问题,却并不是难于共享的关键问题。其关键问题是,假如我们先抛开这个认识问题,而设想两个或多个样本库都确实想共享,那么问题的关键是(1)怎么共享?共享不是一方给予另外一方简单的方式,而是信息交流的方式。(2)共享什么?(3)最关键的是样本库的资源能够或者合格共享吗?所以信息化建设和发展是共享之前必须做好的关键点。我目前研究方向的重点是探索信息统一方式和共享模式,其中当然包括生物样本资源,我希望能够在生物样本资源信息化在样本和信息资源的信息化建设方面,我和团队的项目能成为科委和科技部支持的科研项目。我目前研究方向的重点是探索信息统一方式和共享模式,其中当然包括生物样本资源,获得资助的科研项目里就同时包括了这样的工作内容,以国家合作的方法,希望能够在生物样本资源信息化在样本和信息资源的信息化建设方面做些研究性的探索工作。
转化医学网:关于his-lis整合,您能谈下你的观点么?
王伟业:如果说我们处于的时机是第四次技术革命,那么就是信息革命。生物样本资源的最大特点就是一个样本既有丰富的临床信息也有逐步容纳全面的研究信息,作为当代研究需求的重要资源,就是因为其内涵丰富的信息,目的就是把其内涵信息正确表达出来,为指导科研和为改善健康起作用。
很多样本库在建设初期便开始与临床HIS、LIS 等数据库整合,这是发展的正确规划和方向,但是关键的是具体整合的定义和方式是什么?目的是什么?根据我所了解的,现实中不少这样的整合就是与临床数据库通过某个特定的编码如住院号之间一种连接(Hyperlink)而已,换句话说,实际应用中,就是通过样本数据库里某个样本或病人的编码可以看到临床报告的详细信息。这种方式的链接不是信息整合,因为临床信息不能够用到样本库的管理与应用之中。了解什么是整合之前,要明确样本库管理为什么需要临床信息,其目的有几个方面,但是最基本的,简单点说:一是通过临床信息查找符合研究需要的样本;二是查找符合研究需要的病人或受试者,获取样本或进行随访调查。所以临床信息的管理应该将样本库变作科研资源作为其目的。
临床与样本库信息整合中的另外一个现象是,临床信息没有选择性地储存到样本数据库中,临床和样本数据库的目的或功能显然大有不同,这样的结果,与上述现象没有太大的区别,临床的数据只是为样本库提供详细的临床信息报告,而没有能够为样本库应用和管理功能提供帮助。所以临床信息应用到样本库中首先要将临床信息以比较结构化的方式构成相应的数据元素并组成对应的数据集,后者能够以注释或注解的方式(Sample and Subject Annotation)表达样本资源信息特性,从而运用到样本库的信息化管理之中,这才是正确的发展方向。
转化医学网:建立国家层面的标准有必要么?
王伟业:就这方面而言,我个人认为现在还没有必要,也不可能。因为做事情首先要有模式,然后要有相应的机制。模式方面我们可以借鉴已经有效的样本库,但机制方面需要慢慢摸索。现在需要的是一个比较认可的指南,而这个指南要逐步在实践中得到认可并得到广泛应用,这样才能确定标准。而标准就要成为需要遵守的规定了,现在还没有这样的时机,因为我们都在探索中。
转化医学网:您理想中的样本库是怎么样运行的?
王伟业:我认为理想的样本库应该具有:确定的模式,比较宽松的机制和企业管理模式,专业人做专业事情。目前存在的现象,能够支持比较全面和规范建设的经费都以分配的方式进入多个样本库,而这样的经费困难之能够用于基本建设,加上一定的比例用于购买仪器要求。其结果是资源分散,计划想做的事情没有能够实现。这样的例子挺多,购置的仪器因为两方面的主要问题,可能长期闲置下来:(1)仪器的消耗品没有经费支出;这部分费用通常不会有明显的支持;(2)因为每个样本库每天的样本量不足,仪器使用不经济,而只能够继续手工作业;(3)因为分配到的经费不足以承担能够提高效率和加强质量管理的自动化设备,所以不能够建设有力的技术和管理平台。
所以理想的样本库可以采用联盟(Consortium)集中相应需要的资源,而相应的策略,信息化要求,相关规定都有联盟成员讨论决定,但是一旦确定了,会员就必须遵守。像前面提到的国际P3G项目就是这种方式。还必须具备完善的管理制度,如通常研究者所有担心的问题按照规定都有严格的文件约束签署等。自动化和实用性的装备可以流程化,这样设备的利用率最高。同时成本降低,有效性也得到提高;集中处理和运作,按照运作成本收取费用用于维持系统运行,并实行服务收费的机制; 专业人做专业事,分工明确,具有一定的企业许可和管理方法; 提供全面的功能:设计,收集,咨询,指导,各种工作业务(申请检测,申请收集,申请收集+检测等。所以集中就两点:资源集中应用和专业人就做专业事。
转化医学网:随着NGS的成本进一步降低,这为样本库的建设和发展带来哪些机遇?
王伟业:NGS的样本和所获得的信息应该是生物资源与信息资源完整性的典范,以前是DNA序列信息是脱离样本来源存在的,最初的人类测序解码是通过多来源获得的样本,而且测序也不可能普及化。现在能够做到,其实也就没有什么特别,样本的信息量增加而已。当然也不仅是信息量上的变化,而是信息更加完善与全面了,更重要的是相应的信息和更深入的研究信息会相应产生。
1. DNA的序列信息就是样本特征的一种表达,测序的样本可以保留以便以后应用。不断发展的技术和分析方法可以改进对样本内涵信息的了解。2. 相应的DNA信息可以与其临床表现结合,家族疾病史,其他类型的样本信息谱关联进行综合性分析,3. 对临床个体化治疗的指导性,和危险性分析和随访观察起到关键的作用。
转化医学网:目前我们看到的样本库大多是肿瘤方面的,关于罕见病的样本库比较少。罕见病的样本其实是非常珍贵的,但是散落在各个地方,不像肿瘤标本比较容易收集。作为第二届国际罕见病大会的发言嘉宾,请王老师谈一下罕见病的样本库应该如何规划和建设和使用?国外这方面有没有可借鉴的经验。
王伟业:罕见病方面,我不是专家,只能谈谈自己的一点粗浅看法而已,仅供参考。罕见病的因为罕见,所以相应病例和资源少,而且病因都不太清楚。对其他疾病来说,即使病因不明,但是资源丰富(病例、病理、研究成果和药物治疗观察等)。可以通过临床和流行病,新药研发等方面综合性分析来探索一定的诊断和治疗规律,而不是等待。但是罕见病因为病例,也就是资源少,更多是采用排除法来诊断,研究也相应迟缓,尤其药物研发也因为种种原因(临床试验,市场大小,新药研发的投入,受重视的程度有限)而缓慢。但是罕见病对人类健康又非常重要,尤其是病因学方面的研究,病因学的特征就是需要一定的量才能够研究。罕见病病因学研究不可能有一个项目能够承担的,不像其他资源,人力和物力够的话还可以有某个机构或项目承担。即使人力和物都有,而罕见病样本资源对于研究而言也是缺乏,所以这种生物样本资源只有整合应用才可能有希望。
因为我本人不是研究罕见病的,虽然对国际相关方面了解甚少,但是我也了解到如ISBER(国际样本库协会)在增加了众多的工作组后,2012-2013年之间专门增加了罕见病工作组(Workgroup of Rare Disease)。罕见病资源很珍贵,需要整合起来利用。这点不像其他多发病,样本很容易寻找,尤其是在我国,可以在短时间内重新积累。但是罕见病的样本资源不允许浪费,应该保护我们国家的罕见病资源。
转化医学网:据我们所知,样本库也是本次大会的重点之一,王教授能否谈谈,您希望借助本次会议,呼吁和邀请什么样的人参加到会议的讨论中呢?
王伟业:参加的人员与其他相应的会议一个没有什么不同,当然既然是大会的主题之一,更要体现保护资源重要性包括病例资源,其特点:信息全面,要合作,统一,不浪费资源。这样的资源积累需要时间,但是研究和治疗不能够等待。我仅从样本资源的角度来说下我的看法。样本资源是研究性资源,无论做生物医学什么领域研究都不可避免需要的基本资源,相关的会议也越来越多,但是这次会议的主题是罕见病,除了诊断,治疗,病因学研究是最大的挑战。 所以参加会议的人员首先是能够获得并保护资源的人,比如临床医生。还有利用资源的人,比如全职类研究者。有的比较珍贵的罕见病资源反而在小些地方,知道了才能够懂得保护资源。再者样本库工作者,信息化建设人员,还有相关的管理者;另外社会的宣传媒体也很重要,相关媒体参加,可以让社会认可,引起重视。
后记:没有样本库就没有转化医学,通过王教授的介绍,我们意识到我国的生物样本库信息化建设还有很长的路要走,对于罕见病样本库建设更是缺位,我们也呼吁更多的研究人员、专家、志愿者能加入到罕见病样本库的建设中来,也衷心希望我国转化医学的进程越走越好!
-
游客2015-01-16 13:20:30王伟业是真正懂样本库的专家,他一语中的,一针见血