基于全基因组内重叠基因的保守性分析原核生物基因组的系统发育关系

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:ttmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
原核生物通常缺乏可用于系统发育分析的表型特征如形态和行为等特征标记。随着越来越多的原核细菌基因组的完全测序,系统发育领域中基于基因组数据来推测原核生物间进化关系的需求也日益增长起来。相比单基因的方法,基于全基因组序列的新方法通常能够抓住更多的系统发育信号,也因此将产生更加可靠的系统发育树(phylogeny)。系统发育树的构建有很多种方法,如基于基因含量、基因顺序、基因的串联组合等,也包括一系列物种间共有的综合特征,即稀有基因组变异(raregenomicchanges),如插入和缺失、反转座子的整合及内含子的位置等。在本文中,我们探究一种基于距离矩阵构建系统发育树的方法。该方法主要基于已完全测序的原核基因组间共有的重叠基因(overlappinggenes)来定义物种间两两的进化关系,然后应用距离法整合距离矩阵来推测系统发育树。 由于系统发育标记的分类分辨率(taxonomicresolution)普遍不高,使得我们很难系统地学习大规模数量的物种或基因组间的系统发育关系。为了解决这个问题,我们试图通过检测基于全基因组序列的一类二级结构的特征重构原核生物的系统发育树。我们将该方法应用到366个已完全测序的原核物种上,通过全面深入地分析和证明,发现这种基于全基因组内共有重叠基因对的方法能够构建出一个比较可靠的系统发育树。进一步地,通过比较基于重叠基因对和传统的基于小亚基核糖体RNA(small-subunitrRNA)构建的两类系统发育树的性能,我们得出基于重叠基因构建的树除了在一些有争论的分枝上出现歧义外,大部分分枝都符合已公开发表的系统发育树的分类信息,而且能够比较容易地大规模应用于已完全测序的原核物种上。这些结果表明重叠基因作为一类稀有的基因组变异标记用于系统发育树的构建是相对可靠的,不但能够为一些难以解决的分枝提供更多的分类信息,也为构建一个全面可靠的基于全基因组特征的原核生物分类系统提供一个可靠的框架。 除此之外,我们还构建了一个重叠基因相关的伞面、互动的开放式数据库BPhyOG(BacterialPhylogeniesbasedonOverlappingGenes)。该数据库不但包含了177个原核生物的所有重叠基因对(79855)的详细注释信息,也是一个动态推测系统发育树的平台。用户通过网址http://cmb.bnu.edu.cn/BPhyOG/即可免费访问BPhyOG。
其他文献
该文在对Motorola 68HC05 CPU指令集进行深入分析的基础上,按照自顶向下的数字ASIC系统高层次设计流程,对CPU核进行了顶层功能和结构的定义与划分,并逐步细化了各个层次的模
该文简述了PIM的基本概念和基本分析方法.利用合居干扰模型,对包括PIM干扰在内的总干扰的统计特性进行了数学分析和数值模拟,对PIM的阶数和频率的预测方法进行了简 要介绍.使
该文提出了一种对红外热成像设备进行激光有源侦察的新技术.利用热成像设备的光学系统与背景对入射激光反射特性的差异,可以区别出目标和背景;再利用热成像设备的扫描系统对
SOI(Silicon-Insulator)技术作为一种全介质隔离技术有着体硅技术不可比拟的优点,它在低压、低功耗、高频IC领域占据独特的优势,这使得它有可能在不久的将来取代体硅 技术成
“人类肝脏蛋白质组计划”(简称HLPP)是我国科学家牵头的重大国际协作项目。其中,人类肝脏蛋白抗体库的构建为高通量抗体芯片、蛋白质的生理功能及不同生理状态或病理状态下
细胞从静息期(G0)进入细胞周期的过程,即G0/G1转换,具有重要的研究价值,但目前人们对其复杂的调控机制却知之甚少。其中一个重要原因是缺乏理想的细胞周期模型。我们通过血清饥
寻找合理的理论方法对金刚石的低压生长过程进行定量化的研究是人们一直关注的课题.王季陶等人在1990年提出了非平衡热力学耦合模型(早期称化学泵模型),认为在常温常压下,石
蜜环菌属(Armillaria)真菌具有重要的经济和生态价值,该属既包含了严重的林木病原菌,也有美味的食用菌,还有与名贵中药天麻的伴生菌,对天麻的生长起着至关重要的作用。蜜环菌物种形
脂肪细胞过度增殖和肥大是导致肥胖发生的主要原因,研究前脂肪细胞增殖与分化有助于深入了解脂肪组织发育的生理学和病理学的机理。RAS是一个具有内分泌特性的调节机体血压的
该论文主要对矩形栅格排列的由开口波导组成的有限单元相控阵及由波导端头裂缝组成的有限单元相控阵作了深入的理论研究,首先对孤立单元和两个辐射单元的互耦等问题作了分析