论文部分内容阅读
计算机分子生物学是一门交叉学科,以计算机、网络为工具,采用数学、信息科学、生物学的理论、方法和技术来研究生物大分子。生物信息学的目的是揭示遗传和功能信息的根本规律,以及基因组信息结构的复杂性,进一步解释生物的遗传语言。序列比对是生物信息学中基本的信息处理方法之一,可以发现生物序列之间的进化、功能和结构信息,为生物信息学提供理论基础。序列比对分析最初是由生物同源性的研究提出的,后随着技术发展,其应用范围越来越广。本文重点介绍了分子生物学的背景知识、DNA序列比对的基本原理、人工鱼群算法与蚁群算法的基本思想。首先介绍了序列比对涉及的基本问题:基本操作、相关定义、空位罚分和替换矩阵,然后介绍了双序列比对算法:NW算法、Smith-Waterman算法与BLAST算法,针对多序列比对,介绍了基本算法有:渐进比对算法和迭代比对算法。最后将人工鱼群算法应用在DNA双序列比对中,通过实验证明了算法的可行性。同时对经典蚁群算法进行改进,并将改进的智能蚁群算法应用在双序列比对中,通过实验证明算法的速度和准确率都有了明显的提高。本文第四章中,通过对人工鱼群算法的基本思想、运算流程及应用等方面的研究,将其应用在DNA双序列比对中,提出了基于人工鱼群算法的DNA双序列比对的编码模型、运算函数如人工鱼的交叉函数、变异函数等、运算流程等,并通过模拟实验证明了算法的可行性,最后将比对结果与NW算法进行比较,实验结果与NW算法的比对结果一致。本文第五章中,针对蚁群算法搜索时间较长、收敛速度较慢、容易陷入局部最优值等缺点,提出了改进方法。同时结合经典蚁群算法DNA双序列比对模型,将改进蚁群算法应用在双序列比对中。在改进的智能蚁群算法中,动态更新字符匹配矩阵,将二维信息素矩阵变为三维信息素矩阵,使得转移概率计算更加准确;在蚂蚁选择路径时,动态更新随机数,从而使蚂蚁在搜索路径时,可以提高收敛速度并能有效防止陷入局部最优值;在进行信息素更新时,由蚂蚁路径得分确定更新信息素的公式,从而保证更好更快得找到最优值。实验结果证明,该算法与基本蚁群算法、其他改进算法相比,收敛速度和准确率都有明显的提高。