核小体结合模体的预测及它们在人类基因功能位点附近的分布

来源 :内蒙古大学 | 被引量 : 5次 | 上传用户:tjunu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因调控的复杂模式和人类基因组的普遍转录以及丰富的非编码基因,“DNA元件百科全书”计划的这些发现使得人们对基因概念的认识更加广泛,对转录调控系统和调控机制产生了新的理解,并开创了人类认识基因组全部序列功能的新开端。最近,人们对挖掘非编码序列中可能存在的功能片段以及非编码序列的演化和进化方面做了大量的工作。75-90%的真核生物基因组都被组装成作为染色质基本重复单元的核小体。DNA序列上核小体的准确定位在基因转录,mRNA剪接,DNA复制和DNA修复中扮演着重要的角色。尽管有许多因素可以影响核小体的定位,但现有的核小体定位数据显示,核小体对特殊的DNA序列有高度的亲和力,DNA本身的序列在体内核小体定位中扮演很重要的角色。非编码序列在人类基因组中占绝大的比例,所以研究它们的特征和偏好模体对理解非编码序列的功能和核小体定位是非常重要的。很多理论和实验的分析指出,核小体在基因组上的分布是非均匀的,核小体分布在特定的功能位点附近表现特殊的形式。还有实验数据揭示在一个核小体中,组蛋白和DNA相互作用有三个作用很强烈的区域。所有这些信息暗示,DNA序列中存在一个与组蛋白相互作用的模体集合,我们称之为“核小体定位模体”。我们相信这些模体是核小体定位、分布和重塑的主要决定因素。转录调控是诸多因素相互作用的复杂过程,如特殊的转录因子,非编码调控元件和调节蛋白因子结合的核小体缺失区域等。核小体定位和动态的染色质重塑调节蛋白因子与DNA序列的可接近性,表明核小体定位是转录因子结合的普遍决定因素。核小体在基因转录调控和其他细胞过程中的重要作用,使得探索核心组蛋白与基因组DNA序列之间的相互作用成为目前分子生物学的热点课题。基于调研,其他研究者以前的一系列工作仅限于研究基因临近区域的核小体组装模式,这些与基因转录调控相关。但很少有研究者从全基因组水平上寻找与组蛋白相互作用的DNA模体。目前对核小体定位的实验研究是分散的,未完整的。采用穷举法来完善核小体定位研究是不现实的,必须借助系统的理论分析。已经发现人类基因组序列的k-mer分布是多峰分布。尽管人们对基因组序列的k-mer分布做了很多的研究,这些研究侧重于研究概率模型或频数最少和频数最多的模体,k-mer的调控作用等。但鲜见有人将它们与组蛋白相互作用和参与核小体形成的功能联系起来。所以从理论上研究DNA序列的k-mer构成与核小体的关系具有重要意义。基于这个指导思想,在论文中主要研究了以下几个方面的内容:1.运用统计理论,分析了人类基因间序列的k-mer构成和分布,预测了可能与组蛋白相互作用的所有DNA模体,模体集合共有23,880个8-mer。这个模体集合分为两类,分别命名为P1-mers和P2-mers,并统称为“核小体结合模体”集合。P1-mers共包含2,632个8-mer; P2-mers包含21,248个8-mer。通过分析发现这些模体具有较高的GC含量和柔性,在实验给出的核小体定位序列中,它们出现的频率非常显著。结合已有的理论和实验数据分析,验证了我们得到的模体集合就是核小体结合模体或与核小体紧密相关的模体。2.探索了这些预测的模体在人类编码基因和非编码基因不同功能位点附近的分布模式。分析的功能位点包括:转录起始位点,转录终止位点,起始密码子,终止密码子,内含子和外显子连接处等。核小体结合模体在这些功能位点附近表现出了特异的分布,且在上述五种功能位点附近模体分布形式各不相同,而且分布形式和他人的实验结果吻合。这给我们预测不同功能位点提供了新的思路。我们还分析了核小体结合模体在不同序列上的距离分布。分析的序列有:基因间序列、内含子序列和编码序列等。核小体结合模体在这三类序列上的平均距离依次减小,表明核小体在这三类序列上的平均密度也是依次降低的,这与他人的研究结果吻合。这些结果进一步证明了我们所预测的模体是核小体结合模体的观点,而且暗示核小体结合模体不但参与基因的转录调控,它们的分布可能参与不同类型的序列和不同功能位点的区分和识别。核小体结合模体特征和它们在不同功能位点附近序列上的偏好强度显示,P1-mers很可能参与核小体定位,P2-mers可能与核小体的重塑紧密相关。3.分析了人类看家基因功能位点附近的核小体结合模体的分布,并与Ensemble基因比较了它们之间的相同点和差异。看家基因和Ensemble基因功能位点附近的核小体结合模体分布图形相似,但它们在看家基因上的出现频数显著高于Ensemble基因。这个结果表明,看家基因功能位点附近的核小体定位和重塑信号比Ensemble基因强烈。看家基因转录边界和翻译边界区域,核小体结合模体在转录起始位点附近序列上出现频数最高。核小体结合模体出现频数统计显示,不同功能位点附近的序列对核小体结合模体的依赖程度有所差异。单条看家基因上核小体结合模体的精细分布表明核小体结合模体在DNA序列上分散分布,有利于支配核小体定位和重塑;而且不同核小体单元所包含的核小体结合模体密度有所差异。4.核小体结合模体在不同功能位点附近都表现出了偏好性。但对核小体结合模体的相对偏好性进行比较后发现,转录起始位点、转录终止位点、起始密码子和终止密码子附近±500bp的序列所包含的偏好的核小体结合模体模式数各不相同。转录起始位点区域包含的偏好模体模式数最多。转录起始位点序列和起始密码子做比较时,它们共有的偏好模体的数目为2,489;各自的特异偏好模体模式数分别为257、847。转录终止位点序列和终止密码子做比较时,它们共有的偏好模体的模式数1071;各自的特异偏好模体模式数分别为52、1,371。这些功能位点之间不但所偏好的核小体结合模体的模式数有所差异,具体的模体形式也有差异。核小体结合模体的相对偏好性差异表明,不同功能位点序列上的核小体定位和重塑特征不同。各个功能位点附近序列上核小体结合模体出现频率的相关性分析结果显示,P1-mers和P2-mers两类模体在多个功能位点附近序列上的出现频数呈现显著正相关性,表明强烈定位的核小体周围可能也存在较多的核小体重塑信号。
其他文献
随着海南省国际旅游岛建设以及本土房地产市场化进程的加快,许多实力雄厚的大型企业集团纷纷涌入海南房地产市场,商品房供应放量,而当地需求紧缩以及消费者的观望态势将导致
近年来,随着城市化进程的不断推进,城市人口急剧增加,城市可利用土地减少,城市居住密度问题也逐渐凸现出来,成为人们关注的焦点,因此政府部门不断出台政策强调土地集约利用。
我国《侵权责任法》明确将受害人故意作为免除行为人侵权责任的一类事由。而对于受害人故意的内涵,实务界与学界一直鲜有探讨,这直接导致该事由在适用上的失范。部分案件中,受害人无视危险与警示劝阻,我行我素,最终遭受损害,已尽到注意义务的行为人却仍要承担赔偿责任,如此裁判显然有违公平正义。作为免责事由的受害人故意,仅指直接故意,还是也包括间接故意?回答这一问题,诚有必要。笔者经研究认为,《侵权责任法》过错责
伴随着我国经济的快速增长,城市化水平不断提高,人们对住房的需求也在不断的增加,这也促进了房地产企业的快速发展,使其成为近年来国民经济新的增长点。但是,我国的房地产企
轮状病毒、疟疾和绦虫病继续在全世界,特别是在发展中国家造成相当大的突发公共卫生事件。本论文进行了两项研究:一是考虑接种的轮状病毒和疟疾协同感染传播模型,二是具有公
<正>随着自动跟踪与无线传输技术的进步,高空摄影被逐步应用于纪录片的拍摄中,成为了一种崭新的纪实手段。它的出现带来了新一轮的视角创新。在创造全新感官体验的同时,航拍
虚拟化技术作为实现云计算的关键技术之一在近年来受到了广泛关注与研究。虚拟机资源的部署、迁移以及物理服务器的整合等是亟待解决的重要问题。现有研究主要考虑服务器之间
活性污泥是胞外聚合物(Extracellular Polymeric Substances,EPS)、细菌、菌胶团等物质经过复杂的聚合过程而形成的聚集体,EPS被认为是活性污泥絮体中除了水和微生物细胞之外的
本文以中国东北地区三江平原为研究对象,利用研究区2000年、2006年和2012年多季相Landsat TM/ETM+影像,建立了湿地分类系统,结合野外调查数据,应用多尺度分割算法,根据影像的丰富
针对一般无线通信系统抗干扰、抗噪声以及抗多径性能力差的缺点,提出了一种基于FPGA的直接序列扩频系统设计。该设计采用63位的pn码作为扩频调制的码序列,在发送端,对信息码