基于遗传算法的基因序列比对算法研究

来源 :湖南师范大学 | 被引量 : 1次 | 上传用户:hscyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是生物信息学中一个重要和活跃的研究领域,是生物信息学研究的基础内容。DNA是生物体中一种遗传物质,它作为一种媒介,将遗传信息从上一代遗传到下一代。所有的生物(除了极少数病毒)都是通过它们的DNA从共同的祖先进化而来,因此,生物体DNA测序是生物信息学中最重要和最基本的要求之一。然而,现在是由高通量测序机器进行DNA测序,每天产生数十亿的测序碱基数据。新一代测序技术的出现,使得测序DNA序列产生了成倍增长,同时降低了几个数量级的测序成本。绝大部分核苷酸数据库有大量实验生成的原始序列数据冗余。结构测定与测序技术相比费时费力,无法与新一代测序方法相适应,导致序列功能测定和结构分析的进度跟不上测序序列的产生速度。因此,研究各种高性能系统分析方法来提高预测核苷酸序列的结构和功能是一个重要的内容。序列比对是生物信息学了解一个未知序列分子系统的第一步。研究出更高效、更准确的多序列比对算法是目前生物学研究的一个热点、难点、重点问题。其中,许多研究人员经常使用遗传算法,他们在研究中发现遗传算法在求解多序列比对的效率和准确度上有很大的优化空间,并取得了一定程度上的优化。本文在以上背景下进行多序列比对算法研究,希望为以后的研究者提供一点参考思路和研究成果。本文对DNA序列比对基础知识进行了介绍,然后分别阐述了遗传算法、模拟退火算法、动态规划算法的相关知识。文中重点对遗传算法进行了研究,在标准遗传算法的基础上,对整个遗传算法的架构重新进行了自己的设计。算法放弃了不适合大量数据编码的二进制编码,采用二维染色体编码方式,交叉方式采用单点横向交叉和多点横向交叉两种横向交叉对比方式取最佳的方法,最后对遗传算法产出的解进行模拟退火操作和动态规划操作。通过分析实验数据,对比改进遗传算法和标准遗传算法以及其他算法的多序列比对效率,找到性能最优的算法。
其他文献
插件机视觉定位系统是实现准确插件的关键,目前异型元件插件机的元件定位大多沿用通用贴片机的底部相机定位方法,由于异型元件针脚长而细,通过元件底部图像的本体区域进行定
随着创意产业的深入发展,推动社会逐步向创意社会迈进,在此基础上加大对于目前社会形态的研究,能够为创意社会发展提供一个可供参考的理论依据。文章共包括四个部分,第一部分
QR码作为移动互联网的入口之一,凭借其制作方便、存储容量大以及扫描稳定等特点,成为人们日常生活中最常使用的二维码。但是,由杂乱无章的黑白块构成的传统QR码,较差的视觉效
近年来,在医疗输液制剂生产行业,由于自动化灌装技术的应用,输液灌装制剂的年生产量极大。而对产品质量的检测环节还处于人工视觉检测的阶段,大大限制了生产效率。本课题通过
随着互联网的快速发展,在线观看和传输视频变得越来越便捷,视频正日益成为人们生活和工作中获取信息的重要渠道。但在利益驱使下,视频的盗版问题正变得日益严重。近年来,数字
土地是农民赖以生存的基础,没有了土地,农民的生活保障程度大大削弱,我国是农业大国,13亿人口中有8亿多是农民,农民的安居乐业保持国家安定、社会稳定的最重要条件之一。随着
大型开源软件项目,诸如:Eclipse和Mozilla这样的开源软件,都配备相应的缺陷追踪系统,因为这样的软件项目系统规模庞大,需求量高,不断有新的功能扩充。缺陷追踪系统每天会产生
鉴于NAND Flash闪存的可擦除次数有限,不均衡的擦除会降低闪存的可靠性,因此,为了延长闪存的使用寿命,设计一个自适应均衡擦除次数的磨损均衡算法至关重要。混合固态硬盘通常
随着我国经济持续高速增长以及基础环境的日益完善,人们的日常支付手段也随着科技的发展不断地发生变化。基于移动互联网的金融创新之下,第三方支付发展迅猛,深刻改变了支付
随着近10年来数字出版产业编撰技术与传播模式的变革,传统出版产业的采编排印发流程开始从实现数字作业向实现协同编撰发展。和之前传统的百科类出版物编撰工作相比,在当下“