基因探秘:HPC创新是基因测序普惠万众的捷径
导读 | 将有望变为现实,而基因技术则是这一切的基础之一.原来做一次完整的基因测序在几年前需要数万美金,但现在一套基因测序只需要... |
来源:老尚看科技
著名未来学家库兹韦尔在《奇点临近》中,预言在2045年随着基因、纳米和机器人三大技术实现革命性突破,技术力量会以指数规律快速发展,人类亘古追求的“永生”将有望变为现实,而基因技术则是这一切的基础之一。
原来做一次完整的基因测序在几年前需要数万美金,但现在一套基因测序只需要一千美金左右,那么未来基因测序在价格上还有多大的让利空间?一套完整的基因测序动辄会产生数GB基本的庞大数据,在后期分析这些基因样本时需要怎样的计算力去做支撑?现在做基因检测大概要等一周甚至更长的时间,那么未来有没有可能像做血液检查一样,可以在数小时内就得到检测结果?
在2018年联想全球智慧超算峰会的生命科学圆桌会议上,带着以上诸多问题我们采访了诺禾致源副总裁吴俊和联想数据中心业务集团制造行业总监许子牛,在他们的解答中,我们可以看出超算已经成为了基因技术进一步发展的重要推力。
基因测序行业再次印证“螺旋加速定律”
有人曾把基因碱基链,比作破解生命密码的终极钥匙。其实现在基因检测已经不再是阳春白雪般的存在,利用基因测序技术,可以对孕妇进行无创伤的产前先天遗传缺陷检测,也可以通过检测肿瘤基因特征片段提早预防癌症,还可以通过基因技术来寻找最优的药物治疗方案。基因技术已经被公认是,有可能改变人类命运的关键技术。
基因技术站在了自然科学的风口,而诺禾致源则站在了基因行业的风口之上。据吴俊介绍,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。其中科研服务的内容是为大专院校、医院、药企提供测序的服务,从测序到后续的数据分析,最后给到客户分析报告,客户根据相应的实验设计挖掘出数据具体的生物学意义。目前诺禾致源已在全球运行25台NovaSeq、20台PacBio Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq 500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。
在半导体产业有著名的摩尔定律,而基因测序技术的技术更新甚至超越了半导体发展的速度。有相关统计数据显示,2007年全球基因测序市场规模仅为800万美元,而到2018年全球基因测序市场规模将有望达到117亿美元,这是典型的指数级增长实例,也是高新技术常出现的性能飞速提升、价格快速下降、用户规模几何级数增长的“螺旋加速定律”的鲜活案例。
吴俊在采访中表示,在几年前测一个人的基因组需要一万美金,现在大概只需要一千美金,整体的测序成本降速是非常快的,相比于半导体产业著名的摩尔定律,整个基因测序产业的成本降幅速度甚至超过了摩尔定律的。这就面临一个亟待解决的现实问题,在基因测序成本降得迅速、测序样本数量又在快速增大的前提下,找到能满足基因测序行业特定需求的HPC解决方案就成为必须解决的问题。
基因测序应对爆发性成长,需要HPC有新突破
据吴俊介绍,基因测序行业因为自身的业务特性,所以对HPC的选择上有鲜明的行业特征要求:
第一,要满足大数据量需求。基因测序产生的数据量都是TB级别,以诺禾致源为例,每台测序机器一天产生的数据量是6TB,按照目前60台测序机器产生的数据量,2018年产生的数据量将达到30PB,这就必须要求HPC系统具有海量数据存储能力。
第二,对内存需求量大。在后期基因序列分析时,往往会进行序列对比,这就要求要将海量数据一次性的载入到内存并加以处理,而不适宜分批导入,这就对内存有了非常严苛的容量要求。
第三,对计算力要求高。根据实际测试,目前基因测序所用的专用软件,用GPU来跑还不够成熟和稳定,所以对CPU的性能要求就变得更高。
经过缜密的选型,最终诺禾致源选择了联想HPC。据了解,联想提供的刀片是高性能运算系统,配置超过10PB的存储空间,单节点配置了最高达2TB的超大容量内存。并且通过统一的集群监控管理、作业调度,不单保证了整套系统的稳定性,而且还可以利用调优来不断释放系统的计算潜力。经过改造升级,如今诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。
吴俊在采访时表示,在不考虑成本、投入巨量算力的前提下,现在基因测序的后期数据处理周期可以从2.5天缩短到20分钟,所以诺禾致源对HPC的算力提升有殷切的期待,尤其是当E级计算实现之后,软件不断会针对GPU加速和多核调优,那么做一次基因测序后期比对的时间缩短到一个小时内是可以期待的。
许子牛在接受采访时表示,联想作为计算工具提供商来说,当提供的工具越好、商业化程度越高,对客户来说采购风险就会越低。未来基因测序需求大爆炸,会对HPC有更多要求,联想认为HPC跟普通的个人计算机不同,它往往担负着核心业务或者尖端科研计算的重任,所以单纯去谈HPC的价格没有意义,而是应该考量HPC在整个生命周期的成本。就比如,现在基因测序的数据中心不像传统IDC的数据中心,可以建在像内蒙古等能源丰富的地方,而更多地建在重点中心城市,这就对单位能耗、对节能有更高的要求,所以联想的重点会放在切实降低用户整体成本上。其实对于一个HPC数据中心而言,峰值计算能力有多高仅仅在设计和验收时有意义,更多时候是考验HPC的稳定性和耐久性,联想计算团队在后期维护和技术保障上有口皆碑,会帮助用户不断调优,从而能让用户以经济的投入获得更高的算力回报,联想认为这才是能给用户带来持久价值的选择。
HPC不只是巅峰算力,还决定人类探索未知的新边界
在过去,人类是用双脚丈量世界,但在探索太空的过程中,人类可以利用射电望远镜、HPC来探测更遥远的太空奥秘。让我们引以为傲的“神舟十一号”载人航天工程中,联想HPC提供了强大的技术保障。尤其是在轨道计算、模拟仿真、航天器设计等关键事件中,承担了大量重要的计算工作,稳定可靠的品质完美匹配“航天级”苛刻要求,大量节省了实验经费,大大缩短了计算周期,提高了航天器设计的可靠性。
过去监测海洋环境主要依靠依靠人工采样,不但耗时费力,而且时效性也不佳。而利用HPC和遥感技术,则可以实时动态地对海洋环境进行监测。联想为国家海洋局搭建的高效海洋环境监测预警高性能平台,大幅提高了监测数据的计算、分析、处理功能,充分满足了国家海洋局的科研需求。
联想联想集团高级副总裁、数据中心业务集团中国区总裁童夫尧在做主题演讲时表示,在前不久刚刚结束的世界超算大会(ISC2018)上,联想凭借117套入围的成绩,成为HPC TOP500榜单中全球最大的HPC解决方案供应商。作为首家获此殊荣的中国厂商,联想正在以“科技创新”赋能行业变革,为科研、教育、航天、气象、汽车、石油石化、生命科学等多个领域提供领先成熟的解决方案。
正如国防科大计算机学院院长廖湘科所言,拥抱新技术是HPC继续辉煌的必由之路,未来的智慧超算时代,必然离不开HPC、大数据与人工智能的融合创新。在峰会当天,联想发布了自主研发的AI产品家族,其中包括专为HPC和AI优化的全新人工智能服务器ThinkSystemSR670、Think SystemHG680、ThinkSystemHG690;全新的LiCO GENE Edition;此外,联想还推出第三代温水水冷解决方案“海王星”系统,走在了HPC与AI融合创新的行业潮头。
人类被称为万物之灵长,与动物最大的区别,就在于人类能够利用和发明工具。人类在陆续发明蒸汽机、电动机、计算机和互联网等重要发明之后,人类改造世界的能力在不断增强。从某种程度上来说,HPC现在代表的已经不只是人类的巅峰计算力,而是人类探索未知世界的新边界。我们也衷心期待联想为代表的中国HPC力量,在不久的将来能够第一个实现E级计算的历史性突破,中国HPC产业能够在硬件、软件、应用等方面不断成熟,从而建立起更加有竞争力的智慧超算新生态,也让HPC成为中国未来科技发展和融合创新的基石。
免责申明: 本文小编鄢老师,来源于老尚看科技、网络,不作商业用途,版权归原作者,如有侵权敬请谅解,联系我们删除。(转化医学网360zhyx.com)
还没有人评论,赶快抢个沙发