真核基因转录调控元件识别及转录调控关系构建

来源 :南京大学 | 被引量 : 1次 | 上传用户:ll19870627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物细胞的分化、发育以及对环境变化的响应等基本生物学过程决定于时空特异性的精确的基因表达,基因转录是基因表达的第一步,也是最有效的调控环节。因而,基因转录调控信息的发现和调控关系的获得对认识生物体发育和病变等各种生物过程的分子机理十分重要,转录调控网络的结构、逻辑和动力学规律将是描述生物过程的基础性内容。过去十多年中全基因组序列数据的积累和高通量实验技术的发展已经为人类揭示转录调控信息及其组织结构和功能提供了大量数据。对于高等的哺乳动物和植物,虽然迄今已有不少工作对一些局部生物体系或特定过程进行基因调控网络研究,但其结果的可靠性在很大程度上还取决于是否能够获得充足的数据和识别调控信息的准确度。至于如何完整、准确地获得一种反映某生物体全局性基因转录调控关系网络仍然是当前系统生物学领域的一个重大挑战,也是当前国际相关领域的一个新的研究热点。本文以揭示真核基因转录调控关系为目的,围绕转录调控元件的识别,在系统研究转录调控元件在基因组序列非编码区富集性质和建立统计模型的基础上,发展了一个新的转录调控元件预测方法,在提高稳定性和对噪音数据的适应性方面进行改进,为构建局部转录调控网络提供方便、普适的数据分析软件工具;同时,基于全基因组范围保守性转录因子结合位点搜索,构建了人基因组全局基因转录调控网络并对网络特性进行了初步探索,为各种规模的转录调控网络研究分析提供了基础的参考平台。具体包括以下三个研究内容:1.转录调控元件在启动子区域的富集性分布是其最重要的特性之一,也是许多预测算法中使用的基本原理,本文第二章中,通过研究转录调控元件在基因组各不同区域以及各类不同大小基因组中的分布规律,基于调控元件在特定基因组区域出现频率与全基因组或外显子区域出现频率的统计比较,建立了合理的表述元件富集性的数学模型和富集度评估指标。应用该模型对酵母、果蝇基因组进行了分析,发现多数已知的转录调控元件在酵母Saccharomyces cerevisiae基因组的基因间区富集,特别是,在酵母基因组中,调控元件在基因上游600bp的区域显著富集;而在较为复杂的果蝇基因组中,大约70%的已知转录调控元件在基因间区和内含子区域中的分布仅相对于外显子区富集。这些结果表明了富集度作为调控元件评估指标的实用性。2.针对目前调控元件预测算法对直系同源数据要求偏高、影响实用性的问题,本文第三章中提出了一个改进的调控元件保守性计算模型,并结合上述转录调控元件富集度模型,开发了一个新的整合富集性和进化保守性的、不依赖进化树的转录调控元件notif预测方法。利用人工模拟进化关系序列对新方法的测试表明,该方法在不同进化距离情况下都具有较好的特异性;使用本方法对实际生物数据7组拟南芥共表达基因的分析结果显示,本方法比其它同类方法具有更好的motif识别能力;进一步对直系同源序列噪音数据的测试表明,本方法的性能受杂序列的影响最小。总之,与已有6个被广泛使用的算法相比,本方法在保证预测灵敏度和特异性的条件下,明显提高了对直系同源数据噪音的稳定性,且在使用中不需要输入进化树信息,从而提高了对不同质量的实际数据的适应能力,为各种实际应用情形下的局部基因调控网络构建提供实用的计算工具。3.全基因组尺度上的大规模基因转录调控网络依然是当前系统生物学研究中的一个重大挑战,本文第四章基于功能性的转录调控关系具有保守性的假说,利用转录调控元件的保守性和microRNA结合位点的保守性,通过在人基因组启动子序列保守区域搜索已知转录调控元件motif的匹配,建立了转录因子与靶基因之间的调控关系;并基于microRNA在其靶基因3’UTR上结合位点的保守性和序列互补性,借助多种预测工具获得了microRNA与其靶基因的作用关系,从而初步建立了基因组尺度上的全局人基因转录调控网络。进一步利用组织的基因表达谱数据和microRNA表达谱数据推断出肾、肝、脾和心脏等6个组织的基因转录调控网络,首次尝试了对组织水平的各转录调控网络和基因组全局网络特性的比较分析。为了解基因组范围全局基因转录调控网络和各组织转录调控网络的拓扑结构和网络特性奠定了初步基础,为表达谱数据分析诠释提供一个完整、详细的参考网络。
其他文献
In this PhD thesis. I mainly discuss two topics: Strange Stars (SSs) and Gamma-Ray Bursts (GRBs).The concept of neutron star is proposed as early as in the 1930s, and pulsars were discovered and ident
学位
自1940年Waksman从放线菌中发现了一个具有划时代意义的天然产物——链霉素之后,放线菌作为一类明星微生物,经历了半个世纪的发展黄金期,从中分离出大量抗生素,使人类的生存质量大大提高,放线菌对人类做出了巨大的贡献。进入二十一世纪后,人们更多地把目光投向海洋放线菌和特殊生境下的陆生放线菌及其产生的生物活性物质,并不断发现结构新颖的生物活性产物,使放线菌天然产物的研究焕发出新的活力。本研究从活性出
21世纪引领人类进入不同于20世纪的新纪元。二战后的20世纪为美国霸权所主导,21世纪初期见证了世界经济和政治领域小部分国家的崛起,使得全球经济重心由发达国家向发展中国家转移。这些小部分国家的傲人之处在于他们并不是发达国家,相反,这些均为发展中国家,被世界称之为金砖四国。主要成员国为巴西、俄罗斯、印度和中国。这四个国家拥有全球20%的陆地面积,约有40%的全球人口。金砖四国崛起后,越来越多的发展中
淋巴管系统在维持哺乳动物体液平衡和转运大分子或免疫细胞的过程中扮演着非常重要的角色。从淋巴管内皮细胞发育成为成熟的带有正常平滑肌细胞覆盖和瓣膜的淋巴管系统是一个非常复杂的过程,受到各种不同基因的调控。近几十年来,借助于转基因和基因敲除技术,淋巴管相关的研究也取得了长足的发展,很多基因以及相关的信号通路都被发现在淋巴管发育过程中起作用。丝/苏氨酸蛋白激酶Akt(也被称之为蛋白激酶B, PKB)被认为
论文探讨了‘套适用于台风边界层内的动力学方案,这套方案是基于尺度优化的方法下做出的,即优先考虑大尺度运动,随后是中尺度运动,最后是小尺度运动。通过尺度优化的方法,很好的结合了前人对大尺度运动的贡献,即大尺度运动采用四力平衡的地转动量近似方案,在这个基础上,假定台风边界层内中小尺度运动中满足径向气流远小于切向气流,实现了尺度优化。同时论文认为一些现存的方案没有处理好台风边界层动力学的原因在于,过分地
学位
控制流劫持常被用于系统攻击。内核拥有更高的权限,因而内核层的控制流劫持攻击更具威胁性,破坏性更大。保护控制流完整性是防御控制流劫持攻击的常用方案。然而,现有的许多内核级控制流完整性保护方案,使用软件插桩技术,在内核的间接转移指令前插入验证程序。内核程序运行期间,在执行间接转移指令前,对间接转移指令的目标地址进行合法性验证。这种方式,当验证操作较多时,会引入较大的性能开销。因此,本文研究基于硬件的内
插画具有独特的表现方式和设计风格,相比于普通的包装,插画在包装中的运用更能够吸引消费者的目光。因此,插画在包装设计中占据着重要的地位。近些年来,产品包装设计开始朝着情感化设计方向发展,其独特之处则是将情感化插画融入包装设计,产生一种独特的视觉体验和全新的视觉效果。情感化插画可以将人们的感情联系起来,满足人们的精神需求,从而提高产品的附加值,最终促进商品的销售。基于此,在分析包装设计中插画应用的基础
红梅岭-长源坞研究区位于赣东北塔前-赋春成矿带中部,近年来在该区发现了红梅岭等多个金矿床(点),显示出具有进一步找矿的潜力。本次工作对区内物化探特征、岩浆岩特征、矿床地质特征、构造控矿作用等进行了初步的研究,对找矿前景进行了评估。红梅岭-长源坞研究区在大地构造位置上处于扬子板块与华夏板块碰撞拼接的钦杭结合带东段。论文开展了地面磁法、水系沉积物和土壤元素地球化学研究工作,圈出了 6个物化探综合异常,
“英帝国”(British Empire)曾是世界上最大的殖民帝国,英帝国研究一直以来是国内外学术界研究热门领域,而英帝国史又是英国中学历史教育中不可或缺的重要内容。牛津大学出版社是英国教材出版的权威出版社,本文选择该社出版的中学第三学段历史教科书作为主要研究对象,并选择英帝国专题予以重点考察,以此对英国中学教育中的历史书写有一个更加深入的了解。本文主要分为三个部分。第一部分是绪论,介绍了本文的研
目的:探索镉、铬、钴、铅、锰、铊这6种重金属元素在人体中的骨含量、血含量与年龄的关系;探索上述6种元素的骨、血含量与骨量减少之间的关系。方法:通过全髋关节置换术中取股骨大粗隆部位松质骨,以及前交叉韧带重建术中取胫骨松质骨,分别获取老年人与年轻人的骨组织样品,称重(湿重)并记录。术后第三天抽取相应患者静脉血2~3ml并使用双能X线吸收骨密度仪测量骨密度(BMD),区别骨量正常组与骨量减少组。松质骨样