多序列比对中聚类遗传算法的研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:jiangyang0121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是生物信息学中一种基本的信息处理方法,其主要目的在于阐明序列之间的相似关系,以及从已知序列预测新序列的结构和功能,是基因定位、基因分析以及模式识别和预测的前提条件,它还在重复序列的搜索、基因组的拼接以及分子进化分析方面有着广泛的应用。 本文针对遗传算法应用于多序列比对时所遇到的比对数目受限以及寻优速度慢的问题,提出一种新的基于聚类和遗传算法的DNA多序列比对迭代算法,它借鉴CLUSTAL算法的处理方法,应用了k-means聚类来构建一棵独特的比对二叉树,以增强序列组的关联性,降低遗传算法的比对数目;聚类过程中,在一定条件下引入了SVM分类算法对聚类结果加以修正;并在对二叉树回溯处理时采用了选取最优中心点的星比对方法,防止空位过多的情况出现。
其他文献
论文是在研究国标单水平和多水平计数连续抽样检验程序及表(GB/T8052-2002)的基础上对连续型抽样检验进行的几点研究。 第一部分介绍了抽样检验特别是连续型抽样检验的现
本论文是对Lévy连续模定理进一步推广到等间距分段加权和的情形之下,得到了关于标准Wiener过程下的等间距分段加权和的Lévy连续模定理。本文共分为三章。 第一章为引言。
随着生产管理方式的不断发展,人们对质量的要求越来越高,从生产后的检验发展到生产过程中检验。因此,抽样检验也由标准型抽样发展到了连续型抽样。而同时,审计抽样技术还基本停留
本论文构造和分析具最优收敛阶二维自适应多尺度数值积分公式。利用二维三角形区域和矩形区域上具有多尺度性质的小波插值点和小波基,构造多尺度的数值积分公式;然后把自适应思
(k,s)-SAT是命题满足性问题限制在一类特殊的命题公式上,该命题公式具有每个子句只有k个不同的文字且每个变元出现的次数少于s次的特点。已经验明对于正整数k,s,存在一个指数函数
本文运用Nevanlinna值分布理论及其差分模拟结果研究了复差分多项式与复线性微分、差分方程亚纯解的一些性质,改进并完善了前人的结果。全文分为三章。  第一章,简要介绍了复
在经典的古诺特寡头博弈中,企业之间的竞争主要表现为产量策略的选择。然而新兴行业中的企业一般缺乏前期的资本积累,在市场中难以形成完全的产量竞争。本文以企业投资作为决策
本文共由五章组成,主要讨论了时滞微分系统周期解的存在性及其稳定性,退化时滞微分系统周期解的存在性及其边值问题解的存在性。 第一章给出本文所必需的预备知识,介绍了矩阵