基于GPGPU平台的对角线模型问题研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:sophia_yin104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机领域中,有一类问题具有这样的特点:结果元素的计算依赖于前面连续几个已计算完成的元素,而且每次可以并行计算的元素个数是存在着一定的相互关系。本文把具有以上计算流程特征的问题描述模型称之为对角线模型。对角线模型的应用非常广泛,例如生物信息学中的局部序列比对算法、自然语言处理领域中的上下文无关文法等。而符合这个模型的算法,一般都要处理非常巨量的数据。而且随着社会的发展以及技术的进步,数据量以指数级的速度在增长。因此,提高这个模型的计算效率就显得越来越重要。为了满足高性能计算的需求,目前已经存在着多种多样的高性能计算平台。GPGPU平台是其中之一。相对于其他平台,GPGPU平台的优势在于可以在不增加硬件成本的条件,利用GPU固有的高计算能力和高并行性来提高算法的执行效率。而且随着硬件技术的进步以及OpenCL模型的提出,使得通用计算领域中的算法越来越来适合且容易地在这个新型平台上实现。因此,如何利用GPGPU平台来提高通用计算的速度已成为计算机研究的热点。在GPGPU平台上,已经有许多学者针对符合对角线模型的问题提出了解决方案。例如,Edans等人提出分块的思想来在GPGPU平台上实现大规模序列局部比对算法;Yan Zhang曾经在论文中提出在GPGPU平台上实现三对角线性方程组解法的。但是,这些文献皆是基于具体的问题而提出,不同的问题使用不同的方法。而并没有针对对角线模型提出一个通用解决方案。本文的意义在于为对角线模型提出一个通用解决方案使得这个模型可以容易且高效地映射到GPGPU平台上。首先,本文详细地描述了对角线模型,并仔细地分析了这个模型的特点。然后,分析GPGPU平台的特点以及一些通用性能优化原则。接着在前面的基础上,提出一个通用解决方案把问题模型映射到GPGPU平台上。最后,用四个符合对角线模型的典型案例验证方案的可行性以及有效性。从最后的实验结果可知,通用解决方案可以使得问题很容易地映射到GPGPU平台上。而且,实验数据说明每个问题都取得不错的实验效果。Smith-Waterman算法可以获得最高100x以上的性能提升,而平均情况也有50x左右。排序问题中的两个算法也取得了约为7、8倍的加速。而解三对角线性方程组算法则可以达到10倍的性能提升。上下文无关文法由于算法的特点,也取得了4~5倍的加速。
其他文献
现代企业面临巨大的市场压力,企业业务流程需要不断变化以便应对这种市场变化的需求。SOA以其独到的思想为复杂信息系统的建设、维护和发展开辟了一条全新的路子。而BPEL作为
拒绝服务攻击(DoS)和分布式拒绝服务攻击(DDoS)对因特网上的各种应用造成了很大的安全隐患。特别是流媒体服务具有实时性强、服务器资源消耗大的特点,其遭遇的DDoS攻击具有明
汽车信息物理系统(Automotive Cyber Physical Systems,ACPS)自提出以来,受到全世界范围科学研究人员的广泛关注,是汽车产业信息化及发展程度的重要衡量标准之一。近年来,无人驾
无线传感器网络(WSN)是当前在国际上倍受关注的、涉及多学科高度交叉、知识高度集成的前沿热点研究领域,它综合了微机电系统(Micro-Electron Mechanical System,MEMS)、传感
网络异常流量分类和检测技术是网络运维管理中重要的技术,因此受到网络安全研究者的广泛关注,并提出了可行的异常流量分类和检测方法。近年来不断恶化的网络安全事件促使着网
随着计算机的数据处理能力、存储能力日益革新以及移动电子设备的日趋成熟,数据正以海量级别产生,其中不仅包含通信实体自身信息同时还含有通信实体之间的交流信息,进而形成
为了实现企业的动态管理,企业采用高级计划排程技术,它是一种优化计划,可将时间、订单、库存等生产中真实存在的问题考虑进去。在企业生产中随时获取各种动态变化,来调整生产去迎合市场。帮助企业解决不能动态平衡实时物料需求和资源的问题,为离散制造业提供了有效支撑。而在APS中用数学模型预测零件生产数量为企业生产计划提供参照具有巨大的实用意义。但企业的生产预测模型却具有复杂性、多层次性、开放性、非静态性等特点
实时系统的正确性不仅取决于计算的逻辑结果,而且依赖于系统运行的时间。如何确保实时系统的正确性和可靠性是软件研究人员广泛关注的问题。UML (united modeling language)
虚拟手术(Virtual Surgery)是虚拟现实技术与现代医学结合而产生的一种新的应用领域。利用多种医学影像数据,在计算机中建立模拟手术环境,医生可借助医学图像分割、三维几何
语义Web的迅速发展引发了广泛的面向海量RDF数据的搜索需求。本文围绕语义Web上的实体搜索开展理论方法的研究,将提出的方法在搜索引擎Falcons上进行了实现,并开展了基于真实大