论文部分内容阅读
系统生物学思想是一种生命科学研究新的工作模式,它从多数据源整合出发,以网络分析为基础,通过统计学、信息学、人工智能等各种手段,对各种生命现象做出预测并指导传统生物实验对预测做出验证,这种新的工作模式极大的促进了生命科学研究的发展.非编码基因是指转录后无需翻译成蛋白质,而直接以RNA形式行使生物功能的基因.随着大量非编码基因的发现以及对各种非编码基因功能研究的进展,非编码基因的研究越来越受到大家的重视.本文以系统生物学的思想为指导,对非编码基因的三个不同层面进行了研究:整合各种非编码基因数据,探索生物网络分析的新方法,计算预测并结合传统实验研究microRNA-encoding非编码基因.
随着对非编码基因的关注和各种实验技术的完善,非编码基因的种类由rRNA,tRNA,snRNA几种,发展到至今上百类各种形态的非编码基因.对于非编码基因的生物功能的认识也由最初的参与蛋白合成发展到参与DNA复制、RNA加工、mRNA稳定、蛋白质稳定和蛋白质分泌等.大量的非编码基因数据,以及它们的二级结构信息、功能研究文献、基因组定位信息等大量知识即给系统研究非编码基因带来了机会,同时也对如何有效整合管理这些知识提出了问题.而且由于没有一个有效的管理系统,非编码基因研究中出现了如命名体系混乱,一种基因多种命名,多种基因相同命名等许多令人棘手的问题.为了有效地利用这些知识,我们提出了全新的针对非编码基因的分类系统,并以此为基础建立了一个整合多种数据源的非编码基因综合知识库.
由于其复杂性,生物体系被抽象表示成为一个巨大的网络,在网络中生物分子,如DNA、RNA、蛋白质,表示为节点,它们之间的关联表示为边(无向边,如蛋白相互作用)或箭头(有向边,如基因调控关系).系统生物学指出这种网络关系正是生命复杂性的源泉,各种复杂的生命现象都是由网络中的不同相互作用,调控关系的组合和动态变化产生的,因此对于生物网络的研究有着重要意义.在本文中我们提出了一种研究网络中关键节点和网络子图关系的新方法,并将它应用到啤酒酵母转录调控网络的分析中.我们发现不同基因对于这些子图具有不同的偏好性,并且随着环境和发育过程的变化它们会改变这种偏好.同时,我们还发现有些在网络中广泛存在的子图并不被任何基因所偏好,它们的广泛出现可能只是网络演化机制造成的一种系统偏差.
几个重要模式生物的全基因组芯片实验和全长cDNA文库建设都发现,基因组上存在着大量的长的非编码转录本.它们和编码蛋白的mRNA有一些相似之处:长度都很长、都由RNA聚合酶II转录、转录后都存在剪接、加帽加尾现象,但是又没有蛋白编码框,因此被称为mRNA-like非编码基因.已经发现的mRNA-like非编码基因的数目惊人,比如在FANTOM的小鼠全长cDNA文库中它们占了近一半的比例.但是除了少数mRNA-like非编码基因的功能已经得到证实,大部分mRNA-like非编码基因的功能仍然未知.本文中我们通过计算分析预测有很多mRNA-like非编码基因的功能是作为另一种非常重要的非编码基因microRNA的载体,我们给它们命名为microRNA-encoding非编码基因,然后我们通过设计基因芯片和RT-PCR加测序的方法验证了我们的预测.