基于GPU的近似字符串匹配并行算法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户：phf

【摘要】

：

图形处理器（GPU）具有很强的并行处理能力，并且计算成本低，利用GPU加速字符串操作已经成为了当前并行计算领域的研究热点。近似字符串匹配技术在病毒检测、文件检索、计算生物学等

【作者】

：

刘宇

【机构】

：

黑龙江大学

【出处】

：

黑龙江大学

【发表日期】

：

2012年期

【关键词】

：

近似串匹配 GPU 并行算法汉明距离编辑距离

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图形处理器（GPU）具有很强的并行处理能力，并且计算成本低，利用GPU加速字符串操作已经成为了当前并行计算领域的研究热点。近似字符串匹配技术在病毒检测、文件检索、计算生物学等很多领域都有着广泛的应用，传统的串行算法运算速度慢，而现存的并行算法都是基于多处理器模式，计算成本很高。因此，在GPU上研究有效的近似字符串匹配并行算法具有重大的实际意义。本文的主要研究内容及贡献如下：首先，对GPU通用计算的编程环境进行了总结，重点研究了NVIDIA CUDA的工作原理，编程模型和存储器模型，以及如何配置CUDA编程环境。其次，对于允许k-mismatch的近似字符串匹配问题，基于CUDA模型，本文提出了三种并行算法，即线程级并行算法，两级并行算法，以及两级并行优化算法。两级并行优化算法在利用GPU强大并行处理能力的同时，使得各线程负载均衡，并且利用GPU的存储器模型减少了每个线程对全局存储器中数据的访问次数。本文使用真实的DNA序列作为实验数据对算法的性能进行评估，实验结果表明，其中两级并行优化算法在GPU上的执行时间对于传统的CPU端串行算法加速比可达到40-80，加速比变化与理论分析一致，其它两个算法的加速比也可以达到10左右。最后，对于允许k-difference的近似字符串匹配问题，基于动态规划的方法，通过消除编辑距离矩阵中同一行数据间的依赖关系，本文提出了一种有效的并行算法。该算法使用很少的线程同步次数，并且具有很高的并行度。本文分别在GPU和多核CPU上对算法进行了实现，并对两种环境下对算法的加速比进行了分析。实验结果表明，本文的并行算法在GPU上的执行时间对于传统的CPU端串行算法加速比可达到7-12，在双核CPU上算法的加速比可以达到1.3，在24核CPU上的加速比可以达到8-13，并且加速比的变化与理论分析一致。

其他文献

基于互信息的网页信息过滤技术的研究与应用

在当今信息化高度发达的社会里，人们可以享受到信息化技术所带来的诸多便利，如网上购物、网上银行、远程办公等。同时，各种各样的非法信息，如色情、暴力、反动、封建迷信等，也通过

学位

互信息网页过滤语料库特征提取

基于农机大数据平台的农机调配算法研究

农业机械化是现代农业的重要基础。在我国，农机作业服务十分普遍，但由于农机作业受价格、天气、面积、距离、路况、作业能力等诸多因素影响，仍然存在着作业地点盲目选择、作业成

学位

农机部门农业机械智能调配紧急调配优化模型

中文作者识别方法研究

作者识别是一个应用广泛的研究领域,可以应用于中外文学作品的作者考证领域,也可以应用于版权保护、恶意邮件识别等信息安全领域。对于近年来在文学创作、论文写作等学术领域

学位

作者识别依存语法词义标记支持向量机主成分分析聚类算法

大规模视频转码调度算法的研究与设计

随着国家大力推进互联网、广播电视网、移动网的三网融合，有越来越多的视频数据需要畅游于三网之间。然而，三网间网络带宽、播放设备以及播放软件各不相同，因此需要对视频进行转

学位

任务调度负载均衡LVS视频转码

基于遗传算法的数据挖掘技术的应用研究

随着计算机和网络的普及，我们能方便获取我们关心的所有信息，在很多领域，都存在这些急速增长的以不同形式存在的数据，仅靠人们对数据库的查询或检索得出的数据往往不能得出我们所

学位

数据挖掘聚类遗传算法k-means

文本驱动的虚拟人动作合成研究

三维虚拟人动画涉及到诸多领域,如心理学、人工智能和图形学等,并且虚拟人动画也具有广阔的应用前景。与虚拟人的交互是一个比较有趣也比较有前景的课题,因此吸引了众多人体

学位

动作捕捉CCD算法文本控制虚拟人动画

基于Lucene的毕业论文库全文检索系统的设计与实现

目前,随着高校网络环境的改善,图书馆自动化条件的不断优化,很多高校图书馆都已经或正在着手特色数据库的建设工作。其中,学生毕业论文库的建设也是图书馆的一项重要工作。学

学位

毕业论文论文提交全文检索系统Lucene

基于AdaBoost算法的人脸检测技术研究

人脸检测是指对输入图像或视频序列进行检测，以确定其是否包含人脸，并对包含人脸的数据提取其大小、形状、姿态和位置等信息的过程。人脸检测技术是机器视觉、模式识别和人工智

学位

人脸检测GentleAdaboostMB-LBP多线程

基于Curvelet冗余字典和免疫克隆优化的压缩感知重构

在过去,传统的奈奎斯特采样定理一直统治着信号处理领域。随着人们对信息需求量的日益增加,信号的带宽越来越宽,在信息获取中对采样速率和处理速度等的要求也越来越高,这无疑

学位

Curvelet冗余字典免疫克隆优化相似测量滤波凸投影

面向图像共享社区的图像标签推荐方法研究

学位

基于GPU的近似字符串匹配并行算法的研究

与本文相关的学术论文