CUDA平台上序列比对并行软件的优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xgdiban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流应用是从科学计算、多媒体等领域中抽象出的一类应用,并且还成为了微处理器上的主要负载形式。序列比对是生物信息学的基本操作之一,具有计算密集性、并行性和局域性等特点,属于流应用范畴。由于生物技术的发展,数据库容量每年以指数增加,使得序列比对越来越耗时,传统的计算机已经很难满足该应用对实时性的要求,急需要一种新的并行计算平台去实现该应用。NVIDIA GPU从仅用于3D图形渲染扩展到通用计算,而且完全支持流应用,成为了工业界最成功的流体系结构。CUDA统一计算设备架构正是推动NVIDIA GPU成为数据并行通用计算设备的主要动力。本文的研究成果包括:(1)研究了序列比对并行软件的平台适应性,包括在CUDA平台上开发序列比对软件中的粗粒度并行性和开发该软件的核心算法Smith-Waterman算法中的细粒度并行性。(2)从优化计算和访存、负载平衡、开发软件中的粗细粒度并行性和灵活的线程组织方式四个方面优化了序列比对并行软件,包括根据Smith-Waterman算法运行时的行为特征优化GPU线程的计算和访存操作,设计了执行算法Optimized GSW;为了实现GPU线程之间和CPU和GPU之间的负载平衡,分别设计了执行算法G_Optimized GSW和CG_Optimized GSW,提高了计算资源的利用率;灵活使用划分原理,将并行算法和CUDA平台结合,改变了子任务的映射方式,设计了粗细粒度同时并行的算法DL_GSW,同时还指出此方法在CUDA平台的局限性;改变GSW中呆板的线程组织方式,灵活设定grid维度和block维度,从而提高了每个GPU线程的计算能力。(3)实现并评测了四种优化方案,证明了优化方案的高效性,同时这些结论对程序员设计其他流应用在CUDA平台上的映射方法和优化方案有借鉴意义,对CUDA硬件架构的发展也有参考价值。
其他文献
网络管理在很多方面需要识别网络流的应用类型,如流量监控、网络服务质量保障等。而现今像P2P那样的网络新业务飞速发展,使应用识别的重要性和难度不断增大。在当今主要的识
地图在日常生活中有着广泛的应用。然而,几乎所有的地图应用程序,都以同一种绘制方式来绘制地图中的所有景物,这经常造成信息的过载。本文提出了一个全新的面向用户的2.5维focus
针对大规模单源应用层组播,为了进一步提高数据分发的效率、网络资源的利用率以及缩小传输时延,本论文提出了一种基于虚拟P2SP (Peer to Server & Peer)的应用层混合组播模型
作为一类经典的组合优化问题,最大流问题有着40多年的研究历史和广泛的应用领域,成为研究各种实际网络系统的重要手段,也存在着丰富的研究成果。随着研究和应用的深入,人们发现不
不管是在科学研究领域还是在工程实践上,最优化问题都已成为非常重要的课题之一。其中,仅有一个目标函数的最优化问题被称为单目标优化问题,而现实世界中的最优化问题一般需
合成孔径雷达(SAR)具有全天候、全天时、分辨率高、可侧视成像等优点,得到了广泛的应用。但是由于其回波成像机理,相干斑的产生是不可避免的。为了能更加有效地进行SAR图像的
分形是自然界中的几何学,分形图有多种多样,本论文所研究的装饰图案实际上也是分形图的一种。装饰图案在人类生活中有着举足轻重的作用,是人们智慧的结晶。随着人类社会的发展,装
近几年面向服务计算(SOC)的出现为分布式计算和电子商务提供了有效的解决方案,因此受到了很多企业的关注。服务是异构的、自治的、可计算的,尽管它们可能基于不同的平台或者
随着国际互联网的迅猛发展,网络已经成为人们发布和获取信息的一个重要平台。目前,大部分网页都是通过服务器根据请求从后台数据库中查询相关数据,然后展示到一个列表页面当
优化问题是一个古老而又具有挑战性的问题,优化问题被广泛的用于科学研究与工程实践中。传统的优化方法计算量大、复杂程度高,难以求解复杂的优化问题,有时无法找到问题的全局最