基因组重排问题的反转排序算法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:chly31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组重排问题中的反转排序(Sorting by reversals)是研究基因组进化的一种重要模式,因而成为计算分子生物学中被广泛研究的一个重要问题.该问题分为两类:基因有方向的基因组重排的反转排序问题和基因无方向的基因组重排的反转排序问题.前者是多项式时间可解的,而且目前已存在线性时间的快速求解算法;后者已经证明是NP困难问题,因而只能寻求有效的近似算法.该文主要研究基因无方向的基因组重排的反转排序问题,提出了两个求解此问题的近似算法.一个是基于断点图理论而给出的一种启发式算法,它是对Kececioglu和Sankoff(1995)近似算法的一种改进.另一个是基于"一个无向排列π的反转距离等于由π所生成的包含2个有向排列集Sign(π)中最优排列的反转距离"这一事实而设计的求Sign(π)中最优排列的一种遗传模拟退火算法.全文共分四章.作为基础,前两章阐述了该课题研究的意义、当前的研究现状和该课题研究的基础知识.第三和第四两章是该文的主要工作.第三章首先定义了一种新的断点图,并基于这种断点图给出了一个反转可消去排列中一个断点和两个断点的充要条件,设计出一个时间复杂性为O(max{b<3>(π),nb(π)}),空间复杂性为O(n)的启发式算法.其中n为基因组中基因个数,π=(π<,1>,π<,2>,…,π<,n>)表示n个基因的一种排列,b(π)表示排列π中的断点数.数据实验的结果表明,在多数情况下,该算法优于Kececioglu和Sankoff(1995)提出的近似算法.第四章鉴于有向排列的反转基因组重排问题已存在快速有效的精确算法,为此,我们通过对包含n个元素的无向排列π作变换,生成一个包含2个有向排列集Sign(π),并证明π的反转距离就等于Sign(π)中最优排列的反转距离.然后设计出求Sign(π)中最优排列反转距离的遗传模拟退火算法,给出适合于此问题的编码方案,定义了解的邻域结构和相应的交叉算子及变异算子.数据实验的结果表明该算法性能优于Christie(2001)的3/2-近似算法.
其他文献
虽然线性规划单纯形算法在实际应用中是一种高效的方法,然而在理论上它并不是多项式算法,因而吸引了无数学者去试图设计线性规划的多项式算法.1978年,L.G.Khachiyan提出了第
该文以具体股价指数为例研究股票市场的分形特征.发现股票的收益具有长期记忆性、收益分布具有尖峰、细尾等特点,这对预测及管理证券的风险是有极重要的意义的.
Asmuth-Bloom门限秘密共享方案是一九八零年,Asmuth和Bloom提出的基于中国剩余定理的门限秘密共享方案.但是该方案不具有可验证性.所以通过对其它文献可验证方法的研究,本文提
Linux下的完全数据库驱动Web发布平台,实现了网页数据和网站结构数据的完全数据库驱动,充分发挥了数据库强大的管理数据和处理数据的能力,增强了Web数据库技术的功能,扩大了
该文考虑非线性回归的一般形式 Y=Y(e,x,θ) (1) 其中Y是目标变量或称响应(response),x为解释变量或称因素.通常把Y和x简称为因变量和自变量.e是随机误差,θ为p维回归参数,其
学位
切换广义系统是一类重要的切换系统,它是由一族子系统和它们之间的切换规则组成的,但其子系统都是广义系统,因此对切换广义系统的研究需要考虑更多的因素,比较复杂。不确定切换广
学位
4月11日,被誉为世界“杂交水稻之父”的中国工程院院士袁隆平在隆平高科亚华种业研究院院长杨远柱研究员等陪同下,考察了中国科学院亚热带农业生态研究所海南水稻育种基地。
K是一个V点有向完全图,G为一个不带孤立点的简单有向图,K的一个G-设计,记为(v,k,1)-G-GD(其中k表示G的顶点数,v表示的K顶点数),是指一个二元组(X,B),其中X为K的点集,B为K的一