推荐活动

ENCODE相关30篇论文摘要 聚焦人基因组功能研究(一)

首页 » 研究 1970-01-01 转化医学网 赞(2)
分享: 
导读
<p align="center"><img src="http://www.bioon.com/biology/UploadFiles/201209/2012090815344098.jpg" alt="" width="488" height="348" border=&quo...
<p align="center"><img src="http://www.bioon.com/biology/UploadFiles/201209/2012090815344098.jpg" alt="" width="488" height="348" border="0" /></p>
DNA元件百科全书(Encyclopedia of DNA Elements, ENCODE)项目旨在描述人类基因组中所编码的全部功能性序列元件。它于2003年9月正式启动。来自英国、美国、西班牙、新加坡和日本的32个实验室中442名科学家参与这个项目。9年后的今天,他们在<em>Nature</em>(6篇)、<em>Genome Research</em>(18篇)和<em>Genome Biology</em>(6篇)期刊上发表了30篇论文。<!--more-->

<br/><strong>1. 转录因子的足迹分析</strong><br/>

对41种不同的细胞和组织类型进行基因组DNase I足迹分析(genomic DNase I footprinting),研究人员在DNA调节区内鉴定出4500万个转录因子结合事件,从而代表着这些转录因子与840万个不同的短DNA序列元件存在差异性地结合。他们还发现影响等位基因染色质状态的基因变异体集中分布在这些足迹之中,并且这些序列元件优先得到DNA甲基化的保护。他们鉴定出一个固定不变的50个碱基对长的足迹,并且这种足迹精确地确定着上千个人启动子内的转录起始位点。最后,他们描述了一个新的调节因子识别基序集合,其中这些基序在序列和功能上是高度保守的。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11212" target="_blank">10.1038/nature11212</a>)

<br/><strong>2. 人基因组DNA元件集成百科全书</strong><br/>

ENCODE项目系统性地描绘出人基因组上的转录区域、转录因子结合、染色质结构和组蛋白修饰。根据这些数据,研究人员将生化功能分配到80%的人基因组,特别是在已得到很好研究的蛋白编码序列之外的区域。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11247" target="_blank">10.1038/nature11247</a>)

<br/><strong>3. 人细胞转录全景图</strong><br/>

RNA是基因组编码的遗传信息的直接输出。细胞的大部分调节功能都集中在RNA的合成、加工和运输、修饰和翻译之中。研究人员证实,75%的人基因组能够发生转录,并且观察到几乎所有当前已标注的RNA和上千个之前未标注的RNA的表达范围与水平、定位、加工命运、调节区和修饰。总之,这些观察结果表明人们需要重新定义基因的概念。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11233" target="_blank">10.1038/nature11233</a>)

<br/><strong>4. 人基因组中可访问的染色质全景图
</strong><br/>
DNase I超敏感位点(DNase I hypersensitive sites, DHSs)是调节性DNA序列的标记物。研究人员通过对125个不同的细胞和组织类型进行全基因组谱分析而鉴定出大约290万个人DHSs,并且首次大范围地绘制出人DHSs图谱。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11232" target="_blank">10.1038/nature11232</a>)

<br/><strong>5. 人基因组调控网络结构</strong><br/>

为了确定人转录调节网络的作用原理,研究人员在450多项基因组实验中研究了119个转录相关因子的结合信息。他们发现转录因子的组合性结合是高度环境特异性的:转录因子的不同组合结合在特异性的基因组位置上。他们对所有的转录因子进行组装而产生一个层次结构,并且将它与其他基因组信息整合在一起而形成一个严密而又庞大的调节性网络。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11245" target="_blank">10.1038/nature11245</a>)

<br/><strong>6. 基因启动子的远距离相互作用全景图
</strong><br/>
在ENCODE项目中,研究人员选择1%的基因组作为项目试点区域,并且利用染色体构象捕获碳拷贝(chromosome conformation capture carbon copy, 简称为5C)技术来综合性地分析了这个区域中转录起始位点和远端序列元件之间的相互作用。他们获得GM12878、K562和HeLa-S3细胞的5C图谱。在每个细胞系,他们发现启动子和远端序列元件之间存在1000多个远距离相互作用。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1038/nature11279" target="_blank">10.1038/nature11279</a>)

<br/><strong>7. 果蝇和人的转录因子结合位点变异分析</strong><br/>

研究人员将ENCODE项目产生的转录因子结合图谱、他们之前发布的数据以及其他的人和果蝇等基因系中基因组变异数据来源结合在一起,来研究转录因子结合位点(transcription factor binding sites, TFBSs)的变异性。他们引入一种TFBS变异性的衡量标准和依据不断出现的每个人的转录因子结合数据来证实TFBS突变,尤其是在进化保守性位点上发生的那些突变,能够被有效地缓解从而确保转录因子结合水平保持一致性。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r49" target="_blank">10.1186/gb-2012-13-9-r49</a>)

<br/><strong>8. 转录因子TCF7L2通过GATA3结合到基因组上</strong><br/>

TCF7L2转录因子与很多人类疾病相关联,如II型<a href="http://www.bioon.com/Search.asp?Field=Title&amp;ClassID=&amp;keyword=%CC%C7%C4%F2%B2%A1">糖尿病</a>和癌症。研究人员利用高通量测序技术ChIP-seq在6个人细胞系中对TCF7L2进行分析。他们鉴定出11.6万个非冗余性TCF7L2结合位点,但是只有1864 个位点在这6个细胞系中是相同的。他们还证实被H3K4me1和H3K27Ac标记的很多基因组区域也被TCF7L2结合。对细胞类型特异性的TCF7L2结合位点进行<a href="http://www.bioon.com/Search.asp?Field=Title&amp;ClassID=&amp;keyword=%C9%FA%CE%EF%D0%C5%CF%A2">生物信息学</a>分析揭示富集多种转录因子,包括在HepG2细胞中富集HNF4alpha和FOXA2基序,而在MCF7细胞中富集GATA3基序。转录组测序(RNA-seq)分析提示着TCF7L2通过GATA3结合到基因组上从而抑制转录。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r52" target="_blank">10.1186/gb-2012-13-9-r52</a>)

<br/><strong>9. 构建定量模型研究染色质特征和基因表达水平之间关系</strong><br/>

通过构建出一个新的研究染色质特征和基因表达水平之间关系的定量模型,研究人员不仅证实之前在多个细胞系的研究中发现的一般性关系,而且还对它们之间的关系提出一些新的建议。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r53" target="_blank">10.1186/gb-2012-13-9-r53</a>)

<br/><strong>10. GENCODE假基因资源
</strong><br/>
作为GENCODE标注人基因组的一部分,研究人员基于大规模的人工标注和计算机运算来第一次针对蛋白编码的基因进行全基因组假基因分配。他们将假基因标注和广泛性的ENCODE功能性基因组学信息整合在一起。特别的是,他们确定了每个假基因的表达水平、转录因子与RNA聚合酶II结合以及与之相关联的染色质标记。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r51" target="_blank">10.1186/gb-2012-13-9-r51</a>)

<br/><strong>11. 对人启动子的转录因子结合位点进行功能性分析</strong><br/>

为了大规模地描述转录因子结合位点功能,研究人员预测了人启动子中的455个结合位点,并对它们进行突变。在四个不同的永生化人细胞系中,他们利用瞬时转染和荧光素酶报告检测在这些位点上对主要的转录因子CTCF, GABP, GATA2, E2F, STAT和YY1进行功能性的测试。在每个细胞系中,36%到49%的结合位点提高启动子活性,并且在这些细胞系中的任何一个当中,观察到这种提高启动子活性的功能的整体发生率为70%。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r50" target="_blank">10.1186/gb-2012-13-9-r50</a>)

<br/><strong>12. 基于转录相关因子的结合位点对人基因组区域进行分类</strong><br/>

研究人员通过机器学习方法构建出统计学模型来捕获三种匹配类型的区域的基因组特征:活性结合或不活性结合的区域;极端高程度共同结合区域(high degree of co-binding, HOT)和极端低程度共同结合区域(low degree of co-binding, LOT);位于基因近端或远端的调节性组件。总之,这种区域在染色体位置、染色质特征、结合到它们之上的转录因子和细胞类型特异性上存在复杂的差异。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1186/gb-2012-13-9-r48" target="_blank">10.1186/gb-2012-13-9-r48</a>)

<br/><strong>13. 利用RegulomeDB标注个人基因组中的功能性变异
</strong><br/>
研究人员开发出一种新的方法和数据库,即调节物组数据库(RegulomeDB),从而能够指导人们理解人基因组中调节性序列上发生的变异。调节物组数据库包括来自ENCODE和其他来源的高通量的实验数据,以及利用计算预测和人工标注来鉴定出潜在的调节性序列变异体。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1101/gr.137323.112" target="_blank">10.1101/gr.137323.112</a>)

<br/><strong>14. 制定ChIP-seq工作标准和指导准则
</strong><br/>
根据研究人员进行ChIP-seq实验的经历,ENCODE和modENCODE(model organism ENCODE, 模式生物ENCODE)为经常更新的ChIP-seq实验制定出一套工作标准和指导准则。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1101/gr.136184.111" target="_blank">10.1101/gr.136184.111</a>)

<br/><strong>15. 利用RT-PCR-seq和RNA-seq统计所有人基因组编码的基因元件
</strong><br/>
在ENCODE项目中,GENCODE旨在通过人工管理和计算方法来准确地标注人基因组中所有编码蛋白的基因、假基因和非编码性的转录座位。利用一种被称作RT-PCR-seq(即先进行RT-PCR扩增,然后进行高通量多重测序)的方法可以来预测外显子连接(exon–exon junction)。研究人员验证了73%的预测结果,从而证实了1168个新的基因,其中大多数是非编码性的。&lt;&lt;&lt;参见原文(<a title="" href="http://dx.doi.org/10.1101/gr.134478.111" target="_blank">10.1101/gr.134478.111</a>)
评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发

相关阅读