NJ进化树构建方法的改进及其应用

被引量 : 39次 | 上传用户:hanjzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子系统发育分析是生物信息学中的重要研究领域,它的主要研究手段是从一组同源的DNA或蛋白质序列出发,计算各个序列之间的进化距离,从而得到反映物种进化关系的进化树。进化树通常是一棵二叉树:树的叶节点,代表了某个具体序列;树的拓扑结构表现了各物种之间的亲缘关系远近;树的分枝长度刻画了进化距离的大小。构建进化树的方法主要分为三类,即距离矩阵法、最简约方法和极大似然法。虽然距离矩阵法以结构简单、具有良好的理论基础等特点获得了广泛的应用,但是这种方法在某些情况下会产生两个或多个拓扑结构不同的“等价”进化树,也就是文献上所说的“tied trees”。邻接法(Neighbor-Joining,以下简称NJ)是一种比较常见的距离矩阵法,也存在“tied trees”问题,尽管其设计目标是对同样的序列数据产生与输入顺序无关的唯一进化树。对于NJ法的“tied trees”问题,大多数流行的分子系统发育分析软件并没有进行有效的处理,通常仅根据算法实现方式的不同,只给出其中一种进化树的拓扑结构。本文详细分析了NJ法产生“tied trees”问题的原因,提出并实现了一种改进邻接法(Improved Neighbor-Joining algorithm,以下简称INJ)。INJ是NJ的一种扩展,而NJ可以看作INJ的一个特例。在迭代计算过程中,NJ总是任意选取两个具有最小速率校正距离的序列或种群进行合并来生成新的分类单元,而INJ则允许把多个(目前限制为3个)具有相同最小速率校正距离的序列或种群进行合并,因此它所产生的进化树可能是多叉树。在NJ树不唯一时下,INJ树通常是一棵唯一的多叉树;而在NJ树唯一时下,INJ树则与NJ树完全一致。因此,INJ法较好地解决了NJ法的“tied trees”问题。此外,本文还实现了一个包含完整INJ法和传统NJ法的分子发育分析软件——Multi-Tree。该软件是一个基于Microsoft .Net framework 2.0平台构建的客户端应用,其中包括:多序列比对和编辑、距离矩阵计算、多种进化树构建方法和显示模式。Multi-Tree软件系统采用了基于插件的程序结构,从指定位置的一组程序集中动态获取系统的界面元素与业务逻辑,具有良好的扩展性与可维护性,还可支持多语言的界面显示。
其他文献
近年来,由于经济、环境等方面的条件约束和电力市场化的影响,致使电力系统的运行日益接近其稳定极限,系统出现电压失稳的可能性不断增加,而传统的最优潮流优化目标一般为经济
本文中,作者综述了人工髋关节置换术围手术期常见并发症的中医药防治研究进展。
近年来,重庆市将次级河流综合整治工作作为一项"重过程、重民生、重实效"的系统工程来抓,次级河流整治取得明显成效。但也面临一些问题,如污水处理基础设施仍不完善,农村面源
以Petri网作为小型/中型系统网络建模和分析工具的柔性制造系统设计、调度和优化是近年来工业自动化领域的一个热点研究方向。以宝洁公司牙膏产品研发柔性自动化系统实现为背
针对环境生物修复技术的研究,介绍了中国生态环境现状,论述了在治理环境污染方面的优点,探讨了环境生物技术的进展,包括污染土壤的生物修复技术、水环境污染的生物修复、白色
蹇先艾的短篇小说创作富于地方色彩,从中可挖掘出丰富的地域文化内涵。首先,作家善于选择有家乡地方色彩的材料为小说题材,表现了家乡贵州从自然景观到社会制度再到人物个性
明朝末年至民国初期,山东地区的科举官宦家族为数众多,它们各有不同的特点,又存在很多共同的属性。本文试以具有代表性的临沂大店(旧称莒州朱陈村)庄氏家族为例,探讨始于明末
目的:分析与研究中医辨证治疗便秘80例的临床疗效。方法:资料选自2013年3月~2014年3月在本院接受治疗的80例便秘病人,将其设置为实验组,给予中医辨证治疗,再随机选取80便秘病
华南板块在海西构造阶段以板内运动为主,处于拉张伸展构造环境下,发育了一系列具有拉张或左行拉分性质的裂陷盆地,特别是在二叠纪,拉张活动剧烈(即峨眉地裂运动),并已延伸到盆地内部
从现代到后现代、从工业社会到后工业社会的更替,最显著的标志是计算机信息技术的高速发展。除了具备报刊、广播、电视等传统媒体的功能外,互联网是具有实时、互动、跨境、跨