基于概率统计粒子群算法的生物多序列比对研究

来源 :燕山大学 | 被引量 : 1次 | 上传用户:thedogstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组研究的深入,生物序列的数量呈现爆炸式增长,迫切需要使用高效的计算机算法对其进行处理。生物序列比对是一个重要的,具有挑战性的基本问题,对于推测核酸和蛋白质序列的功能、结构和进化具有非常重要的意义。但是,当大规模序列进行比对时,现有算法都存在精度低问题,本文对此进行了研究和探讨。  首先,研究了当今国内外各种序列比对算法的现状,系统地阐述和分析了最具代表性的各类算法的优缺点,分析了空位罚分、相似性替换矩阵和目标函数对序列比对的影响。  其次,从标准粒子群算法模型着手,研究了各种改进粒子群算法的优缺点,归纳出粒子群算法的局限性;针对其局限性,结合概率统计学理论和粒子群算法思想,提出了基于概率统计的粒子群算法。引入概率分布模型引导粒子产生新解,增加了粒子的全面学习能力。通过仿真验证了新算法能够有效避免陷入局部收敛,提高了最优解的精度。  再次,将新提出的算法应用到多序列比对问题中,提出了基于概率统计粒子群的多序列比对算法。采用新的编码方法,消除了算法对比对序列条数的限制。引入变异操作,保证了算法的全局收敛性。对基准比对数据库BALIBASE中142个例子进行仿真,结果验证了算法的可行性和有效性。  最后,设计和开发了基于新提出算法的多序列比对软件。该软件整合了多种常用多序列比对算法,具有执行多序列比对、追踪比对过程等功能,为计算机研究人员提供了检测算法准确性的平台。
其他文献
最佳离散信号及其设计在现代通信、雷达、声纳、制导、空间测控以及电子对抗等系统的优化设计中,扮演着越来越重要的角色,结构优良的的信号可以提高系统的抗干扰、抗截获、抗
目前,测控技术在军事、工业等控制领域中的应用已成为研究热点课题之一。 本文系统介绍了随动测控系统的基本理论,并且进一步探讨了嵌入式、实时数据库、工业以太网等关键技
  在以软交换为核心的下一代网络中,CPL作为一脚本语言引入到业务生成环境中,用于终端用户控制和描述IP电话业务。它最大的优点在于简单易用,因此特别适合于业务的个性化定制
随着计算机网络技术、多媒体技术和通讯技术的发展,视频会议的开发和应用已经成为网络应用的热点之一。视频会议系统是支持人们进行远距离实时信息交流、开展协同工作的应用系
本文研究了ABC方法中体系结构风格建模和支持工具的设计与实现,主要工作包括: (1)针对风格对于体系结构模型的指导作用,提出了一套基于风格的体系结构建模框架ABC/SAM,扩充了
.NET平台作为微软新的开发平台,其战略思想就是把所有设备通过一个全球宽带网(Internet)连接在一起,同时所有的软件都将成为在该网络上提供的一种服务。Web服务即是实现该战略
随着人类基因组计划实施的不断深入,生物学的数据信息飞速增长,如何从这些海量数据中提取有用的知识,揭示这些数据所蕴含的生物学意义,是对计算机科学的巨大挑战。从结构上来挖掘
随着校园网信息化建设的深入,对于安全方面的要求越来越高,即需要保证信息的机密性,完整性,不可否认性。而校园网中的网络应用无论是从种类,还是从数量上来看,都是非常繁多的,不可能
近年来,数据挖掘(Data Mining)引起了信息产业界的极大关注,其主要原因是数据海洋的日益增大,我们需要新技术将海量数据转化为有用的信息和知识。分类是数据挖掘的主要任务之一,
  随着Internet技术的发展,以软交换为核心的下一代网络(NGN)技术成为网络发展的必然趋势,它的出现为新业务提供了一个良好的承载平台,这使得以语音邮件服务为代表的各种新兴