生物基因序列比对算法的并行优化研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:logan_lxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在介绍了不同基因序列比对算法及其各自优缺点的基础上,针对Smith-Waterman算法着重分析了一些并行化方法,并结合集群式(Clustering)计算机系统提出了一种全新的并行优化算法.该算法引入了哈希(hash)函数,在将原算法串行优化的同时,减弱了其原有的强数据相关性,并进行了合理的并行优化.该优化算法更快,更具平台适应性,真正充分利用到了近期蓬勃发展的高性能集群式计算机系统,符合当今科技发展趋势.该算法的主要思想是:利用hash函数对欲比较序列进行采样,抽取部分样本进行初期比较.初期比较完毕后得到若干可能相似的序列,此时才进行完整的比较,得到符合用户要求的相似序列.该算法不仅减少了总比较次数,加强了比对效果,缩减了比对时间,而且将原来数据相关性很强、不适合并行化的动态规划算法改变成为可并行化且易于并行化的新的优化算法,使其能够自如地运行在各种高性能并行计算机系统上.该算法是通过消息传递接口(MPI)嵌入C/C++编程实现的,运行在Linux系统平台上.各进程之间的通信由消息传递的方式完成,已成功地运行在自强2000高性能机群上,获得了可喜的结果.
其他文献
在图象处理和计算机视觉研究领域中,对象定位一直是一个饶有趣味并富有挑战性的课题。对象定位技术在诸如工业自动化、智能控制、医疗辅助诊断、人机交互领域、武器精确制导等
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
目前使用的人工抄表方式已日益不能满足管理自动化的需要,故本文提出了若干种实现自动化的方案,其中基于公共开关电话网络的调制解调器通信方式自动抄表是最能体现自动意义的。
人工免疫系统是继人工神经网络和进化计算之后又一种新型的智能计算方法,是生命科学和计算机科学的交叉学科研究领域。生物免疫系统是一个自适应、自组织、自学习的分布式并行
信息检索(Information Retrieval, IR)是研究信息的结构、分析方法、组织、存储、搜索和检索等方面的计算机科学。对检索模型的研究在信息检索领域处于核心地位。不同的检索
现实世界中存在着许多多目标优化问题(MOP),传统的规划算法不能很好求解这些问题。而多目标遗传算法(MOGA)擅长于求解高度复杂的多目标优化问题且通过一次运行可以搜索到一组
多机器人追捕问题是多机器人系统研究中的一个典型问题和重要平台。它研究在特定的环境下,设定怎样的规则,使得多个追捕机器人对资源进行合理的分配、协调与竞争,对一个或多
计算机领域的一个发展趋势是CPU运算速度的提升要大大快于磁盘的数据传输效率的改进,它们之间的差距不断扩大,逐渐成为分布式计算中不可忽视的一个因素。在这个背景下,对并行程
WebServices作为一种新的分布式计算技术,凭借其平台无关性、消息导向性和协议可组性等特点,从其一出现就迅速得到了工业界的青睐,并且形成了多个国际性组织研究和制定各种规范
该文基于作者在四川川大智胜软件股份有限公司实习期间参加的军航系统和其他民航系统的研发工作,主要介绍了空管自动化系统中系统监控模块中的若干关键技术.在以往成果的基础