《转》访李亦学教授:生物医学大数据助力精准医学大发展
导读 | 《转》访是转化医学网的品牌专访栏目,是业内专家、大佬、知名企业智慧交流碰撞的平台,也是促进行业健康发展的重要力量,《转》访致力于打造转化医学领域最知名的专家访谈栏目。 |
导语:10月上旬,美国国立卫生研究院(National Institute of Health,NIH)对外公布启动精准医疗队列研究,计划入组100万18岁以上的志愿者参与该项研究,最终将精准医疗的概念引入临床实践和科研中。然而庞大的样本必定产生庞大的数据,大数据助力精准医学的发展不言而喻。转化医学网特此邀请到上海生物信息技术研究中心主任,中科院上海生命科学研究院生物信息中心主任,中科院系统生物学重点实验室副主任李亦学教授为我们带来大数据与精准医学的思考。
转化医学网:李教授您好!非常荣幸能做这次访谈。您是生物信息界的行家,我们都知道生物信息学在精准医疗中扮演着重要的角色。国内生物信息学还需要怎样发展来为精准医疗添砖加瓦?
李亦学:其实在近十多年的时间里,国内生物信息学已经发展起来。海外也有越来越多的优秀人才回国,国内一大批年轻人也都成长起来,基础科研领域也已经有了很好的准备。目前国内,生物信息学的主要问题在于需要很好的和临床结合起来,即做生物信息研究的科研团队需要和临床很好沟通。临床需要了解生物信息能干什么的,生物信息学也必须了解临床需要什么信息,需要解决什么样的问题。一句话:了解临床所需,为临床所用。但生物信息学与临床之间的对接绝不仅仅只是彼此互相理解,它们需要深度合作,从源头上的深度合作。如果这种深度合作能够做好,那么对精准医学的发展将会有巨大的推动作用。做精准医学研究,生物信息学一定不能和临床脱节,这是关键,同时这种深度合作也是不容易的,需要花时间和很多精力。
转化医学网:自奥巴马提出精准医疗,国内也掀起了精准医疗的浪潮。但“精准”需要很多病例和数据的积累及分析。如何实现大数据是目前精准医疗的瓶颈之一,在这方面您有什么看法?
李亦学:不可否认,科学的发展,数据是基础。但这些数据是怎么来的,产生数据的实验是怎么设计的,即数据的来源是非常重要的问题。首先我们需要一定量的病人和健康人群为样本,然后获取各个层次的数据,包括组学、影像等方面。除此之外,我们还需要知道详细的病人的病理表型。但数据分析不是简单地把所有病人相关的数据都拿来用做精准医疗的数据基础。数据是怎么产生的,产生到什么程度是非常重要的,也就是说需要很好的实验设计,这实验设计需要生物信息学和生物统计学的人提供建议,也需要临床提供它所要研究的科学问题。实验方案设计出来后,在此基础上有一定量的临床样本以产生实验数据,甚至数千个或数万个样本,这些数据通过深入的分析后才能推动精准医学在临床上取得突破性的进展。
转化医学网:当个人相关的生物医学信息存储在云端,不可避免涉及到信息安全的问题。您认为在生物信息安全和大数据之间,如何实现共赢?
李亦学:我个人觉得生物信息安全是非常重要,亟需解决的一个问题。因为数据量大,存储的需求也很大。这时候任何一个单一的机构,单一的研究人员,单一的实验室,甚至医院、研究所,都可能没有能力去维持一个非常大的计算能力和一个非常大的,而且不断增长的存储资源。所以,把大数据上传到云上,或通过云计算的方式来解决这个问题是大势所趋,是必须要做的。因此就不可避免存在信息安全的问题。但这个信息安全问题不仅仅是技术层面问题,而且还是一个需要从法律层面来考虑的问题,是需要通过立法来解决的问题。也就是说放在云端的生物医学数据,特别是临床数据的安全、泄密、伦理风险、所有权和知识产权,使用规范,都需要立法来为此做规定,现在就要开始研究起来。目前为国外已经开始探讨这个问题,比如生物医学大数据,到底哪一个层面的数据可以上到云上,哪个层次的数据不能,或者都能上到云上,但是会有法律条文来对它的安全性进行通盘考虑。我们国家目前还没有开始考虑,但相信不久的将来会开始考虑--生物医学大数据怎么利用云计算,怎么放到云端。说到底,生物信息安全需要法律来支撑和保驾护航。
转化医学网:前不久,华大前任CEO王俊曾表示要通过筹资100亿人民币来为100万人做免费的基因检测等,从而得到100万人的生物信息。您觉得这种方式对于形成大数据,对助力精准医学有怎样的好处?
李亦学:首先,我需要为王俊他们解释一下。当时100亿这个新闻出来后,我曾经向李英睿求证过,不过当时李英睿是这么跟我讲的。他说, “筹资100亿为100万人做基因检测”这件事其实是媒体误读了,原话是“如果要为100万人做一个全面的生物医学信息的收集,需要100亿的人民币才能完成”,因此说到底还是媒体误解了王俊他们团队的意思。但针对这件事而言,如果真能为100万规模的中国人做一个全面的生物医学信息的收集,包括各个层次的组学信息,生理病理信息等等,那么它所产生的数据当然是十分可观的,对中国临床医学研究,精准医学研究而言一定会有极大的推动作用,这些数据对药物研发、制定临床诊疗标准具有非常大的价值。但是这100万人也并不是说只要个人愿意就可以的,还是要根据具体情况对入选人群进行筛选,要做一定的设计。如果真的实施肯定会为社会带来很大益处。
转化医学网:目前国内外各大机构都在陆续建立自己的数据平台,但实现数据共享的少之又少。你对这个问题怎么看?
李亦学:数据不能共享是一个很大的问题。当然,如果是公司自己投入产出数据不能共享还是情有可原的。但如果说科研机构有自己的数据却不能拿出来共享,就肯定存在着机制上的问题。所以目前我们也在探讨如何通过一个好的机制,我们也在推动政府是不是能够拿出一部分投入建一个国内的生物医学大数据的设施,然后通过这个设施制定一个规则。而这个设施要有相当的能力,比如:大的计算能力、大的存储能力。由这么一个专业团队把分散在各个研究课题组、科学家个人等零散的数据集中起来,同时也希望这么一种设施能制定一些规则去接收国家重大科技项目产生的生物医学数据,存放到国家支持的大数据基础设施中。这样既保证了数据产生者的利益,又能让其他科学家在一定条件下共享这些数据。这样的话,无疑能对我国生物医学行业带来很大的推动作用。而国家投入来建设这么一个数据共享平台其实在以后收益是非常大的,就如美国人类基因组计划,投入30亿美元,但却是146倍的收益。所以,无论从哪个角度讲,国家做这么一件事情都是值得的。
简介
李亦学,研究员,博士生导师,中国科学院上海生化细胞所研究员,上海产业技术研究院生物医学研究院院长。上海生物信息学会理事长,国家“十五” 863计划生物和农业技术领域生物信息技术主题专家组组长,国家“十一五” 863计划生物医药技术领域专家组专家。1996年10月获德国海德堡大学理论物理研究所理论物理学博士学位。1996年11月至1997年3月在德国斯图加特大学第三计算机应用研究所从事计算数学博士后研究。1997年4月至2000年6月在欧洲分子生物学实验室(EMBL)从事生物物理博士后研究。现任上海生物信息技术研究中心主任,上海交通大学生物信息学和生物统计学系主任,中科院系统生物学重点实验室副主任。也是国家蛋白质科学研究重大专项《模式生物和细胞等功能系统的系统生物学研究》、《代谢生理活动与病理过程中信号转导网络的系统生物学研究》两任专项项目首席科学家.在专业领域共发表200余篇SCI收录科学论文,获得上海市自然科学一等奖、二等奖,教育部自然科学一等奖,第一批入选上海市科教兴市领军人才,上海市劳动模范,全国五一国际劳动奖章获得者,享受国务院特殊津贴。
(转化医学网360zhyx.com)
还没有人评论,赶快抢个沙发