基于GPU的串匹配算法的实现

被引量 : 0次 | 上传用户:hang_925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路技术的发展,GPU(Graphics Processing Unit,图形处理器)的发展相当的迅速。当前,一个典型的GPU的实际程序运算速度可达20 GFLOPS,内存带宽可达25.3 GB/sec,远远超过通用的CPU处理器。由于GPU具有如此巨大的运算潜力,越来越多的应用试图将通用计算任务移植到GPU上来做。利用GPU的SIMD流处理器作为通用计算平台已经得到了广泛的研究和应用,这使得GPU能够成为一个有效的CPU协处理器,获得较高的性价比。串匹配算法是生物信息学、信息检索领域的基础算法。随着近年来基因数据和网络数据的爆炸式增长,对串匹配算法性能的需求也日益增长。但是串匹配算法本身所具有的较强的数据依赖关系和很差的数据重用性的特点极大地限制了该算法在现有的CPU结构上的效率。尽管数据重用性差限制了在CPU上的性能,但是其流式的特点比较适合流媒体的结构,然而其数据依赖关系给在GPU上挖掘其并行性提出了挑战。本文从GPU的体系结构出发,研究如何在GPU上有效编程,如何开发串匹配算法的数据并行性,以及适合在GPU上运行的串匹配算法。本文的主要工作包括:(1) GPU上通用计算编程方法的研究:研究了OpenGL、BROOK、CG等GPU上通用计算的编程方法,以及如何开发基于GPU的数据并行性。在此基础上,进行了GPU数据存取方式的研究,以串匹配操作中涉及的字符串文件为例,研究了充分利用了图形处理中纹理这一数据结构,将一般通用计算的数据结构映射到GPU中去的方法,以及在GPU中利用二维纹理方式高效计算的算法设计方法。(2)适合GPU的串匹配算法的设计与实现:BF算法是串匹配算法中最基础的算法,但它是串行算法,不适合GPU的体系结构。本文对BF算法进行了重新设计,将条件分支语句转化为计算语句,以充分利用GPU的并行处理能力。实验结果表明,基于GPU的并行算法能够取得较好的加速比。(3)研究提高GPU体系结构下通用算法效率的方法:以BF串匹配算法为例,测试了各种参数变化对GPU性能的影响,从而给出了在现有GPU架构上有效实现通用计算的瓶颈,并推导出了在GPU体系结构上提高通用算法效率的一些方法。
其他文献
<正>1引言现阶段汽车行业竞争不断白热化,汽车企业纷纷优化自身工艺流程来降低生产成本,零配件物流成本控制成为了企业挖掘第三方利润源泉的重点,这也是企业生产过程中成本掌
<正>一、教师及教材编者对《桥之美》文体的误读人教版初中语文八年级上册第12课《桥之美》是著名画家吴冠中写的一篇文章。笔者曾听不同层次的十几次教师执教过这篇课文,其
从建设单位的角度出发,综合论述了工程勘察设计阶段、工程招标和合同管理阶段、工程造价管理阶段以及工程施工管理阶段的具体有效措施,为工程项目的管理提供了依据。
详细分析和研究了隔热涂料在汽车领域(汽车挡风玻璃、塑料及皮革内饰件、激光焊接技术)的应用。
分别通过浸渍法和循环污染法对Y型分子筛和FCC催化剂进行镍、钒污染,考察了在干燥和水热条件下镍、钒对分子筛结晶度的影响,采用高级催化裂化评价装置(ACE)评价了镍、钒污染
为使配电系统可靠性评估更加合理和有效 ,本文采用最小割集理论 ,提出一种通用性的适于计算机实现的配电系统可靠性评估算法。该算法考虑了影响系统可靠性的诸多因素 ,其计算
运用物流节点理论分析了阿拉山口市建设丝绸之路经济带国际物流节点城市的可行性,并就阿拉山口在建成丝绸之路经济带国际物流节点城市中的制约因素做了阐述,从区域发展的战略
随着我国对外开放程度的进一步加深,对外贸易的规模不断扩大,我国的贸易顺差也呈现出快速增长态势。长期的贸易顺差给我国经济提供巨大动力的同时,对我国国际收支平衡乃至整
<正>把打点计时器接入9V、50Hz的正弦交流电源(J1202型或J1202-1型学生电源,打点计时器在7-11伏范围内能正常工作),让打点计时器开始工作,观察振动片
为了保证电力系统的安全、稳定运行,并网运行的火电机组需时刻保持电网频率稳定和电网能量的供需平衡,则火电机组需不断改变负荷来满足电网一次调频的要求。针对米东热电厂30