基于GPU的程序分析与并行化研究

来源 :解放军信息工程大学 | 被引量 : 15次 | 上传用户:studentxp2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机是一个国家经济和科技实力的综合体现,也是促进经济、科技发展,社会进步和国防安全的重要工具,已成为世界各国竞相争夺的战略制高点。在人们追求高性价比的并行计算机系统的同时,在许多专用领域的专用计算部件也发挥着其强大的并行计算能力。图形处理器(GPU,Graphics Processing Unit)就是一种用于通用计算的专用加速部件。随着微电子技术的发展,图形处理器,无论是在集成度还是在数据处理能力上都已远远超过通用处理器,特别是在可编程能力、并行处理能力和应用范围方面得到不断提升和扩展,成为当前计算机系统中具备高性能处理能力的部件。目前,国内外针基于GPU的并行化研究,一般都是在原有串行程序的基础上,由熟悉GPU硬件结构的计算机专业人员进行程序改写。但由于串行程序并行化后带来的各种开销,使得并行化后的执行效率可能不及串行程序的执行效率。因此,如何合理地对串行程序进行分析,评估串行程序并行化后在GPU上的执行效率变得尤为重要。本文针对如何评估串行程序并行化后在GPU上的执行效率展开研究,主要研究内容如下:一、研究支持CUDA架构的GPU多线程硬件体系结构以及编程模型。在分析目前高性能计算和GPU通用计算的现状的基础上,详细阐述了GPU在通用计算中的优势,对图形处理器的硬件结构以及编程模型进行深入研究,为开销模型建立提供理论基础。二、为实现循环体工作量的精确计算,本文在深入研究传统的数据依赖关系分析方法的基础上,针对SUIF无法准确计算循环体上下界不固定时的迭代次数的情况,提出了一种改进的方法。三、为了预测串行程序并行化后在GPU上的执行效率,提出了一种基于CUDA架构的GPU并行开销模型,该模型综合考虑了程序并行化的各种开销(设备启动开销、数据传输开销以及GPU执行开销)。通过该模型可以预测出串行程序用GPU加速时的时间开销,将其与串行执行的开销进行对比,从而判断是否用于GPU加速,进而指导串行程序的并行化。
其他文献
工程移民安置工作是一项复杂的系统工程,而目前我国移民安置工作还处于发展阶段,因此如果处理不当,就可能会导致移民生产生活水平得不到恢复,进而影响社会的稳定。为了规范移
在高校后勤集团中存储了许多宝贵的数据,高校后勤信息管理系统能使这些静态、孤立的数据体现出其价值,让后勤管理更加高效。通过此系统可以搭建一个信息管理集成、共享平台,
人类对于美的追求从远古至今从未间断过,而健美操的迅速发展正好印证了人们对美好身体的追求。本文从健美操的起源谈起,介绍了健美操如何作为一门课程且发展成长起来的。
本文结合智能手机案例探讨工业设计师创新思维的培养,以期抛砖引玉。
随着全球汽车产量和保有量的逐年增加,能源短缺与环境污染问题日益加剧,而醇类燃料,尤其是掺醇汽油因其污染低、来源广,被认为是最具使用前景的代用燃料,因而受到了广泛关注
随着世界经济的发展,现代物流业通过运用先进的组织方式和管理技术实施物流管理已经成为城市和国家发展的新的经济增长点。在我国,小型物流企业由于其数量众多,作业灵活的特
通过对探究式教学模式的研究,结合"Flash动画制作与设计"的课程的特点,把这种教学模式引入其中,并通过四个环节阐述了该课程如何运用探究式教学模式开展教学活动。
球轴承被广泛用于机械系统的旋转支撑部件,对机械系统动力学性能有着重要的影响。目前,国内外滚动轴承力学研究主要运用静力学和拟动力学方法,深入研究润滑、摩擦、温度、波
【目的】建立一个可以预测温室网纹甜瓜产量与采收期的模拟模型,为温室网纹甜瓜生产管理和环境调控的优化提供决策支持。【方法】本研究据温室网纹甜瓜器官生长与温度和辐射
氯霉素(Chloramphenicol, CAP)是一种广谱抗生素,对革兰氏阳性菌、阴性菌均有良好的抑制作用。因而广泛应用于畜牧、水产养殖业。但在动物性食品内残留的CAP对人体的健康具有