推荐活动

医疗健康第一直聘平台
Asia Pharma R&D Leaders Summit 2017
2017肠道微生态与健康国际研讨会
创新与仿制 生物药聚技起航

DNAnexus完成世界上最大的泛癌症数据的重分析

首页 » 研究 » 组学 2016-12-15 基因慧 赞(2)
分享: 
导读
DNAnexus 在12月9日宣布它已完成在世界上最大的泛癌症数据集上的统一重分析和突变检测,数据来自TCGA(癌症基因组图谱)的10,487个患者,涵盖33种癌症类。

2016 年12 月 9 日 | DNAnexus 今天宣布它已完成在世界上最大的泛癌症数据集上的标准化的重分析和突变检测,数据来自TCGA(癌症基因组图谱)的10,487个患者,涵盖33种癌症类型。突变数据经过了额外的质量控制和过滤,现作为开放阅读数据集可在 NCI Genomic Data Commons 和Synapse下载。也可以通过 DNAnexus或 GitHub库重现这个TCGA 突变结果。

TCGA 图片来自:ocg.cancer.gov


“在过去,TCGA 样品的突变检测主要是对于个体的肿瘤类型,项目使用不同的变异检测工具或不同版本的变异检测工具,这意味着数据不统一”,项目主任Carolyn Hutter博士在NHGRI的基因组医学部门的声明中说,“我们现在认为最好的(癌症数据)分析对象通过多个变异检测工具分析,然后经过质量控制和过滤,涵盖多种癌症类型得到的数据。这就是为什么 TCGA 团队决定回过头重新分析TCGA中10,000 多个外显子,并且分析得到这种多个变异检测工具得到的体细胞突变(somatic mutation)数据集。”

TCGA成员机构不具备跨越多种癌症类型的突变分析所需的计算资源。突变检测包括病人信息的安全、可以处理数以万计的外显子,可扩展的环境,和可重复的结果,这里采用了DNAnexus 平台。

DNAnexus工作原理 图片来源:smartplanet.com


“这是一个巨大的挑战,也是DNAnexus平台的优势体现的一个典型例子,”DNAnexus 的首席执行官Richard Daly说到,“在四个星期内大约 180 万单位CPU(core-hours)的计算时间用于处理400 TB 的数据,以产生可重复的结果。目前得到的一致性的数据可让全球的研究人员用来解释多种类型癌症共享的基因组特征、致癌标志物和潜在治疗目标”。

“用一种单一的方法在新的标准突变检测上重新修正 TCGA 数据将使肿瘤数据更加方便研究人员使用。DNAnexus 通过版本控制的分析及工具创建统一的,敏感度高的分析处理,这对在一定的时间范围内在单一的设施上重复很具有挑战性,”贝勒医学院的分子和人类遗传学部门的教授David Wheeler博士说,“有这套通过几个变异检测工具获得的标准化突变检测集,我们将能够识别非组织来源多种肿瘤之间共享的癌症的遗传变异因素。我们乐观地认为,获得这些信息将推动精密医学的进步。”

现在研究人员除了 GitHub库也可以通过DNAnexus 平台途径访问 TCGA。DNAnexus 工作以确保数据访问请求的机制,和当请求者符合云端 dbGaP和TCGA数据的安全标准时批准出售数据。

数据下载地址(需要先免费注册synase)

https://www.synapse.org/#!Synapse:syn7214402/files/

数据集(syn5917256 )WiKi网址:

https://www.synapse.org/#!Synapse:syn7214402/wiki/405297

参考文献:

http://www.bio-itworld.com/2016/12/9/dnanexus-reanalyzes-cancer-genome-atlas-data.aspx

(转化医学网360zhyx.com)

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发