基于GPU的近似字符串匹配并行算法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:phf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理器(GPU)具有很强的并行处理能力,并且计算成本低,利用GPU加速字符串操作已经成为了当前并行计算领域的研究热点。近似字符串匹配技术在病毒检测、文件检索、计算生物学等很多领域都有着广泛的应用,传统的串行算法运算速度慢,而现存的并行算法都是基于多处理器模式,计算成本很高。因此,在GPU上研究有效的近似字符串匹配并行算法具有重大的实际意义。本文的主要研究内容及贡献如下:首先,对GPU通用计算的编程环境进行了总结,重点研究了NVIDIA CUDA的工作原理,编程模型和存储器模型,以及如何配置CUDA编程环境。其次,对于允许k-mismatch的近似字符串匹配问题,基于CUDA模型,本文提出了三种并行算法,即线程级并行算法,两级并行算法,以及两级并行优化算法。两级并行优化算法在利用GPU强大并行处理能力的同时,使得各线程负载均衡,并且利用GPU的存储器模型减少了每个线程对全局存储器中数据的访问次数。本文使用真实的DNA序列作为实验数据对算法的性能进行评估,实验结果表明,其中两级并行优化算法在GPU上的执行时间对于传统的CPU端串行算法加速比可达到40-80,加速比变化与理论分析一致,其它两个算法的加速比也可以达到10左右。最后,对于允许k-difference的近似字符串匹配问题,基于动态规划的方法,通过消除编辑距离矩阵中同一行数据间的依赖关系,本文提出了一种有效的并行算法。该算法使用很少的线程同步次数,并且具有很高的并行度。本文分别在GPU和多核CPU上对算法进行了实现,并对两种环境下对算法的加速比进行了分析。实验结果表明,本文的并行算法在GPU上的执行时间对于传统的CPU端串行算法加速比可达到7-12,在双核CPU上算法的加速比可以达到1.3,在24核CPU上的加速比可以达到8-13,并且加速比的变化与理论分析一致。
其他文献
在当今信息化高度发达的社会里,人们可以享受到信息化技术所带来的诸多便利,如网上购物、网上银行、远程办公等。同时,各种各样的非法信息,如色情、暴力、反动、封建迷信等,也通过
农业机械化是现代农业的重要基础。在我国,农机作业服务十分普遍,但由于农机作业受价格、天气、面积、距离、路况、作业能力等诸多因素影响,仍然存在着作业地点盲目选择、作业成
作者识别是一个应用广泛的研究领域,可以应用于中外文学作品的作者考证领域,也可以应用于版权保护、恶意邮件识别等信息安全领域。对于近年来在文学创作、论文写作等学术领域
随着国家大力推进互联网、广播电视网、移动网的三网融合,有越来越多的视频数据需要畅游于三网之间。然而,三网间网络带宽、播放设备以及播放软件各不相同,因此需要对视频进行转
随着计算机和网络的普及,我们能方便获取我们关心的所有信息,在很多领域,都存在这些急速增长的以不同形式存在的数据,仅靠人们对数据库的查询或检索得出的数据往往不能得出我们所
三维虚拟人动画涉及到诸多领域,如心理学、人工智能和图形学等,并且虚拟人动画也具有广阔的应用前景。与虚拟人的交互是一个比较有趣也比较有前景的课题,因此吸引了众多人体
目前,随着高校网络环境的改善,图书馆自动化条件的不断优化,很多高校图书馆都已经或正在着手特色数据库的建设工作。其中,学生毕业论文库的建设也是图书馆的一项重要工作。学
人脸检测是指对输入图像或视频序列进行检测,以确定其是否包含人脸,并对包含人脸的数据提取其大小、形状、姿态和位置等信息的过程。人脸检测技术是机器视觉、模式识别和人工智
在过去,传统的奈奎斯特采样定理一直统治着信号处理领域。随着人们对信息需求量的日益增加,信号的带宽越来越宽,在信息获取中对采样速率和处理速度等的要求也越来越高,这无疑
学位