PQ-树断点中心问题算法研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:hyx19841101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算生物学是一门综合性很强的学科,它涉及到生物学、计算机科学等多种内容。根据达尔文的生物进化论,普遍认为物种之间存在一种遗传系谱关系,为了生动形象的描述物种之间的遗传系谱关系,科学家们提出了生物进化树。生物进化树是一种树状图表,在生物进化树的分支上,存放的是能代表不同物种的结构或者信息。但在构建生物进化树时,采用何种信息来代表生物物种是值得人类思考的问题,现在普遍认可采用基因组序列代表对应物种来构建生物进化树。伴着生物实验水平的提升,人们利用各种实验手段得到了大量的基因组数据,这些基因组数据对于研究生物进化史有着不可或缺的作用。鉴于此,科学家们提出了利用基因组数据来作为生物进化树的构成元素。在构建生物进化树时,要根据不同物种基因组序列的相似程度来衡量基因组序列所对应物种之间的亲缘关系的远近。对于祖先物种基因组,由于祖先物种已经消逝,人类无法得到祖先物种完整基因组,只能利用现有技术得到祖先物种基因组片段,推测祖先物种基因组中的连续遗传区。因此,在存储祖先物种基因组时,要考虑祖先物种基因组的特点,本文利用PQ-树可以表示排列的集合的特性,采用PQ-树来存储祖先物种基因组,而对于现有物种基因组,则用排列表示。不同物种之间的同源性与物种基因组序列的相似程度有着极大的关系,因此,可以通过比较不同物种基因组序列之间的相似程度,从而了解物种的进化。在衡量不同物种基因组序列的相似程度时,利用序列比对的方法来判定基因组序列之间的差异。在基因组序列比较时,要有一定的标准来量化基因组序列之间的相似程度,本文中,将以断点距离为标准,衡量物种基因组序列的相似程度。在生物进化树中,叶子结点表示现有物种基因组,本文中采用排列表示,内部结点表示祖先物种基因组,本文采用PQ-树结构存储,鉴于祖先物种基因组与现有物种基因组基本组成元素相同,因此PQ-树中叶子结点所表示的元素与排列中含有的元素也相同。为了判断祖先物种与现有物种之间的进化关系,需要衡量祖先物种基因组与现有物种基因组之间的相似程度,即需要求解PQ-树所表示的排列与已知排列之间的距离。本文中,采用断点距离为标准,分析并求解p排列PQ-树断点中心问题。本文主要工作内容如下:1、对p排列PQ-树断点中心问题的复杂性进行了分析以及证明,结论为当p≥2时,该问题的复杂性是NP-完全的。2、本文将证明1排列PQ-树断点中心问题是参数化可计算的,并且本文将针对该问题提出参数化算法,并实现跟验证该算法。
其他文献
第一章主要介绍本学位论文的研究背景和有关的研究方向,并概述本学位论文的主要结果.第二章中介绍了一般子流形的分类包括实超曲面,复子流形,全实子流形和CR-子流形.本章我们
本文研究了图的广义字典积的邻点可区别边染色与邻点可区别全染色,以及图的半强积的点可区别边染色与邻点可区别全染色,并利用图分解技术与构造染色的方法给出了相应染色数的
在科学计算和工程应用中经常需要求解非对称代数Riccati方程的最小非负解.当方程中矩阵的规模越大时,数值迭代方法会更有效.目前,许多专家和学者已经提出了许多具有良好的性
生灭过程作为一族典型连续时间离散状态马氏过程,在随机过程论中起重要作用,同时它在自然科学、生物学、物理学、排队论等领域都有着广泛的应用.随着陈木法院士等概率学者关
本文主要探讨鞍点问题的数值算法.在流体力学、二次优化、Helmholtz方程的域分法、加权最小二乘问题等计算科学与工程学领域中有很多问题可以被再生为鞍点问题(SP),于是鞍点
细菌的双组份信号系统能够感受外界环境变化,通过磷酸化信号的传递,调节体内相关基因的转录,从而对刺激作出应答以适应环境、得以生存。已明确枯草芽胞杆菌5个组氨酸激酶和主
近年来,时标上中立型时滞动力方程非振动解与振动解的存在性问题越来越受到人们的关注.本文分别研究了时标上二阶中立型时滞动力方程非振动解与有界振动解的存在性,以及时标
绝热过程是物理学中十分重要的物理概念,是一种理想的物理过程。它普遍存在于各类缓慢变化的物理现象之中。本文着重研究了加速绝热和绝热捷径过程,其目的是实现光场之间的能
多酚是一类可以帮助动植物抵抗逆境的重要次生代谢产物。在茶树中多酚糖苷是组成多酚化合物的主要成分。本文克隆了一条茶树多酚糖基转移酶基因,并利用重组蛋白技术对基因功
量子信息是信息科学与量子力学相结合的新兴交叉学科,熵是量子信息理论中一个重要的概念,它用来度量物理系统的状态所包含的不确定性.本文主要讨论了广义的von Neumann熵和两