基于系统生物学的非编码基因研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:fjlmh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统生物学思想是一种生命科学研究新的工作模式,它从多数据源整合出发,以网络分析为基础,通过统计学、信息学、人工智能等各种手段,对各种生命现象做出预测并指导传统生物实验对预测做出验证,这种新的工作模式极大的促进了生命科学研究的发展.非编码基因是指转录后无需翻译成蛋白质,而直接以RNA形式行使生物功能的基因.随着大量非编码基因的发现以及对各种非编码基因功能研究的进展,非编码基因的研究越来越受到大家的重视.本文以系统生物学的思想为指导,对非编码基因的三个不同层面进行了研究:整合各种非编码基因数据,探索生物网络分析的新方法,计算预测并结合传统实验研究microRNA-encoding非编码基因. 随着对非编码基因的关注和各种实验技术的完善,非编码基因的种类由rRNA,tRNA,snRNA几种,发展到至今上百类各种形态的非编码基因.对于非编码基因的生物功能的认识也由最初的参与蛋白合成发展到参与DNA复制、RNA加工、mRNA稳定、蛋白质稳定和蛋白质分泌等.大量的非编码基因数据,以及它们的二级结构信息、功能研究文献、基因组定位信息等大量知识即给系统研究非编码基因带来了机会,同时也对如何有效整合管理这些知识提出了问题.而且由于没有一个有效的管理系统,非编码基因研究中出现了如命名体系混乱,一种基因多种命名,多种基因相同命名等许多令人棘手的问题.为了有效地利用这些知识,我们提出了全新的针对非编码基因的分类系统,并以此为基础建立了一个整合多种数据源的非编码基因综合知识库. 由于其复杂性,生物体系被抽象表示成为一个巨大的网络,在网络中生物分子,如DNA、RNA、蛋白质,表示为节点,它们之间的关联表示为边(无向边,如蛋白相互作用)或箭头(有向边,如基因调控关系).系统生物学指出这种网络关系正是生命复杂性的源泉,各种复杂的生命现象都是由网络中的不同相互作用,调控关系的组合和动态变化产生的,因此对于生物网络的研究有着重要意义.在本文中我们提出了一种研究网络中关键节点和网络子图关系的新方法,并将它应用到啤酒酵母转录调控网络的分析中.我们发现不同基因对于这些子图具有不同的偏好性,并且随着环境和发育过程的变化它们会改变这种偏好.同时,我们还发现有些在网络中广泛存在的子图并不被任何基因所偏好,它们的广泛出现可能只是网络演化机制造成的一种系统偏差. 几个重要模式生物的全基因组芯片实验和全长cDNA文库建设都发现,基因组上存在着大量的长的非编码转录本.它们和编码蛋白的mRNA有一些相似之处:长度都很长、都由RNA聚合酶II转录、转录后都存在剪接、加帽加尾现象,但是又没有蛋白编码框,因此被称为mRNA-like非编码基因.已经发现的mRNA-like非编码基因的数目惊人,比如在FANTOM的小鼠全长cDNA文库中它们占了近一半的比例.但是除了少数mRNA-like非编码基因的功能已经得到证实,大部分mRNA-like非编码基因的功能仍然未知.本文中我们通过计算分析预测有很多mRNA-like非编码基因的功能是作为另一种非常重要的非编码基因microRNA的载体,我们给它们命名为microRNA-encoding非编码基因,然后我们通过设计基因芯片和RT-PCR加测序的方法验证了我们的预测.
其他文献
交换结构和调度算法的性能分析是交换机研究中的核心问题.在理论分析和仿真实验这两种分析方法中,仿真实验因具有良好的可操作性而被广泛使用.传统仿真方法基于个别流量负载
随着2D图像通信系统应用越来越广泛,具有立体感和可交互性的自由视点视频系统(FVV,Free Viewpoint Video)逐渐成为下一代多媒体系统的研究目标.本文探讨的自由视点视频系统采
由于并行传输电路在高速传输方面的不足,串行传输技术得到了迅猛发展,中科院计算所曙光5000高性能计算机的交换芯片就采用了这一技术以满足芯片间的高速通信需求.对于高速串
机群系统以良好的可扩展性、可用性、可靠性和性能价格比占据着高性能计算机领域的主导地位.大规模的机群系统由于节点量大存在诸多问题,如管理的复杂程度高、可靠性降低、整
目前,数据挖掘的理论和技术蓬勃发展,以缓解由数据库技术的普及带来的"数据过剩而知识匮乏"的问题.数据挖掘不仅已成为生物信息、计算化学、地理信息等科学领域的重要研究手
随着互联网的普及和发展,各种新兴的Internet业务不断涌现,占用越来越多的网络资源,致使网络流量激增,网络常常表现出容量不足.因此,网络管理和维护人员有必要及时了解网络容
随着计算机的应用日益增多,各行业对软件系统的健壮性和稳定性提出了更高的要求,使得软件测试在整个软件项目中的地位日益重要。基于FSM模型的系统测试是一致性测试的重要研
本文的主要背景是中国科学院“十五”信息化建设重大项目—科学数据库及其应用系统。科学数据库经过二十多年的发展,积累了大量的科学数据资源,如何对这些分布、异构的数据资源
学位
深层卷积神经网络是人工神经网络在图像识别领域的一个研究热点,其目的是通过多层的网络结构进行复杂特征的提取并给出图像所属类别等属性。cuda-convnet深层卷积神经网络算法
随着网络技术地日益成熟,网络提供给用户的服务和应用越来越多。对服务供应商来说,如何深层次地分析用户的通信行为,进而提供更好的服务质量和计费活动显得尤为重要。   本课
学位