短块移动排序距离和序列拼接问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:vbdelphi1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对基因组的研究深入和逐渐破译,我们的生活发生了巨大的变化。尤其是在医疗界中,随着人们对于基因组的了解迈上了新台阶,很多疾病的病因被逐渐的揭开,医务工作者在设计药物时能够更加科学有效,从而使得通过基因疗法来治疗一些当前医疗手段还无法治愈的疾病成为现实。通过控制人类的某些生化特性,从而达到恢复或者修复人体细胞和器官功能的目的,因此通过对基因组信息的操作甚至可以改变人类的进化过程。在农作物领域,人们可以通过控制基因组来改良果蔬品种,从而快速的提高农作物的品质,我们可以预见将会有越来越多的转基因植物、动物和食品问世,在新世纪里人类可能培养出超级作物。由此可见,在科技发展如此迅猛的今天,对于基因组的研究已然成为医疗、作物等多个生物科研领域中一个十分重视的问题。应运而生的则为计算生物学,科学家们通过数学建模和计算机仿真计算等方式对基因组中的相关操作进行分析,对基因组数据进行处理并从中获取生物信息。其中,典型的问题包括计算基因组间的重组距离、基因组片段的拼接、通过生物测序技术来得到基因组序列中冗余或丢失的信息等。但是由于基因庞大的数目、突变导致的相似性等问题的存在,当前对于计算生物领域的绝大部分问题都是NP-难的,这就要求计算生物领域的研究者们更多的致力于设计出多项式时间近似算法。本文主要针对计算基因组间的重组距离、基因组片段的拼接两类问题进行了分析讨论。对于排列短块移动排序距离问题,使用了基因组重排操作中的转位操作。次转位操作也称为一次块移动。短块移动是最常见的一种块移动。一次短块移动是将一个元素从排列中某个位置移动到最多偏离原来两个位置的块移动,因此也称为3-bounded转位。针对排列短块移动排序距离问题,文中给出了一类称之为双递增排列的特殊的排列,并得出了其短块移动排序次数的下界。以此为依据,分析原始排列中的所有最大双递增子排列,从而给出了任意排列短块移动排序次数的下界,改进了Heath和Vergara的负面结果,并为更好的近似算法的设计打下基础。而对于基于A-Bruijn图的基因组序列拼接问题,本文对Pevzner提出的用于解决单一基因组序列的RepeatGluer算法进行了详细的解释说明,此算法对基于A-Bruijn图的基因组副本进行分组。最后给出了相关步骤的部分代码,以期能够通过对A-Bruijn图的学习与实现,更好的了解并探讨解决基因组序列拼接问题的方法。
其他文献
在科学计算和工程应用中经常需要求解非对称代数Riccati方程的最小非负解.当方程中矩阵的规模越大时,数值迭代方法会更有效.目前,许多专家和学者已经提出了许多具有良好的性
生灭过程作为一族典型连续时间离散状态马氏过程,在随机过程论中起重要作用,同时它在自然科学、生物学、物理学、排队论等领域都有着广泛的应用.随着陈木法院士等概率学者关
本文主要探讨鞍点问题的数值算法.在流体力学、二次优化、Helmholtz方程的域分法、加权最小二乘问题等计算科学与工程学领域中有很多问题可以被再生为鞍点问题(SP),于是鞍点
细菌的双组份信号系统能够感受外界环境变化,通过磷酸化信号的传递,调节体内相关基因的转录,从而对刺激作出应答以适应环境、得以生存。已明确枯草芽胞杆菌5个组氨酸激酶和主
近年来,时标上中立型时滞动力方程非振动解与振动解的存在性问题越来越受到人们的关注.本文分别研究了时标上二阶中立型时滞动力方程非振动解与有界振动解的存在性,以及时标
绝热过程是物理学中十分重要的物理概念,是一种理想的物理过程。它普遍存在于各类缓慢变化的物理现象之中。本文着重研究了加速绝热和绝热捷径过程,其目的是实现光场之间的能
多酚是一类可以帮助动植物抵抗逆境的重要次生代谢产物。在茶树中多酚糖苷是组成多酚化合物的主要成分。本文克隆了一条茶树多酚糖基转移酶基因,并利用重组蛋白技术对基因功
量子信息是信息科学与量子力学相结合的新兴交叉学科,熵是量子信息理论中一个重要的概念,它用来度量物理系统的状态所包含的不确定性.本文主要讨论了广义的von Neumann熵和两
计算生物学是一门综合性很强的学科,它涉及到生物学、计算机科学等多种内容。根据达尔文的生物进化论,普遍认为物种之间存在一种遗传系谱关系,为了生动形象的描述物种之间的
众所周知,P?schl-Teller势在量子力学与分子动力学中的有着广泛的运用,它在非谐振分子势中占有至关重要的一席之地。因此,对于求解P?schl-Teller势能体系的薛定谔方程的能量