基于距离的进化树构建算法研究

被引量 : 0次 | 上传用户:gonyen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进化树是描述物种进化顺序和进化关系的一种拓扑结构。构建进化树在生物学中有重要的应用,研究高效准确的构建进化树算法有实际的应用价值。本文针对进化树构建问题进行研究。进化树构建问题是一个NP完全问题,因而构建算法都是启发式的。通常使用的方法分为三大类:(1)距离法,(2)最大简约法,(3)最大似然法。本文使用基于最大似然法的距离法构建进化树,主要分为两个阶段:首先估计所有分类群之间的进化距离,只有序列进化距离越精确,构建的进化树才会越准确;然后基于这些距离值之间的关系构建进化树。本文工作主要包括以下两个阶段:在第一阶段,对距离估计方法和最大似然法进行了研究,改变了传统的进化距离估计方法,把序列比对由两个序列比对扩大到多重序列比对;利用基于quartet的最大似然法对进化模型进行优化并使用最小二乘法快速重构所有可能的quartet拓扑结构,并优化其分支长度,对两两序列间距离进行估计,为进化树的构建提供了更加准确的距离矩阵。在第二阶段,主要对邻接法构建进化树进行改进,改进工作分为两部分:一是针对在第一阶段得到的距离矩阵并不总是满足可加性的问题,引入了距离的方差和协方差,采用加权的计算公式更新距离矩阵,使算法构建的拓扑结构更加准确。二是改进了邻接法的贪心特性,由于邻接法每次只聚合速率校正距离最小的两个分类单元,进而导致整个体系的偏差,实验证明速率校正距离最小的配对并不一定是在真实的进化树中进化距离最近的,基于此,改进算法每次聚合速率校正距离满足“neighbor”的两个分类单元,使算法不总是搜索分支长度之和最短的进化树,很大程度减少了这种体系偏差对真实进化关系的影响,并通过实验验证了该算法的准确性。最后,基于以上的研究成果,实现了一个进化树构建系统。
其他文献
以清代服用丝织品纹样为研究主线,通过对这一历史时期,典型的丝绸服装款式与结构的相关分析,总结出由服装为主导因素所影响的丝织品纹样构成与设计制作等相关性,和由织物纹样
运用扎根理论对B2C业务中的代表性企业苏宁电器的资料进行分析,探讨苏宁电器在科技转型、开展网络零售业务这一时期商业模式要素的构成,从而总结实体与网络零售协同下商业模
<正>为了加强新《安全生产法》的学习宣传,提高安全生产责任意识,强化安全生产管理,杜绝安全生产责任事故发生,2015年1月16日下午,盘锦市总工会与市安全生产监督管理局联合组
社会观是人们对社会的总的看法和根本观点,在马克思之前,西方传统的社会观是实体化的。实体化的社会观在古代主要表现为整体论的社会观,在近代表现为原子论的社会观和有机体
在基于虚拟手与虚拟物体的交互技术中加入力反馈技术对于增强交互的沉浸感、指导虚拟手对虚拟物体的操作、预测虚拟物体的行为以及提高交互的真实感等都起着非常重要的作用。
超临界水氧化(SCWO)技术是一项具有很大潜在优势的环保新技术,但设备的腐蚀问题成为制约其发展的关键瓶颈,尤其在处理含Cl、S、P等原子的有机废水时,腐蚀更为严重。若将有机
粮食问题始终是关系我国国民经济发展和全面建设小康社会的重大战略问题,玉米是中国乃至全世界最重要的粮食、饲料、经济兼用作物,因此玉米的高产稳产关系到我国粮食安全的问
专家辅助人制度在新刑事诉法中的确立无疑将有助于推动鉴定人出庭作证效果的实现,确保鉴定意见的真实性和法官对鉴定意见的正确认定。在此之前,民诉法的有关规定和司法实践的
我国证券市场在短短的20年间取得了飞速发展,但是我国证券市场仍然存在很多问题。这些问题的存在表明了我国证券市场监管功能不完善以及监管效率低下,揭露出我国证券监管体制