GPU通用计算性能预测和优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:dafuxuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPU在大规模数据并行计算中的广泛应用,GPGPU(General-Purpose GPU)程序的性能预测成为一个重要的研究课题。本文基于NVIDIA GPU和CUDA提出了两种GPU性能预测分析模型,分别为kernel性能的预测模型和混合编程性能预测模型。利用本文提出的性能预测模型,GPGPU开发者可以预测算法和程序的性能,并理解开发过程中性能因素的选择和影响。Kernel性能预测模型主要考虑了CUDA kernel在GPU上的指令执行过程。首先本文提出在CUDA指令执行模型下GPU理论上的最大指令吞吐量,然后在此基础上考虑影响GPGPU程序达到理论最大指令吞吐量的因素。在性能预测模型的基础上,本文提出了模型的应用工作流程。混合编程性能预测模型主要考虑CPU和GPU异步执行下的性能预测。在这个预测模型下,kernel的执行被看作一个整体,因此和kernel性能预测模型之间是独立的。混合编程性能预测模型是通过考虑不同部分的执行时间之间的相互关系,使用了分类讨论的方法。最后本文验证了两种性能预测模型的有效性,并提出了将性能预测模型应用于GPGPU程序优化的具体方法。
其他文献
随着程序设计语言和计算机系统结构的发展,如何对新的语言特性和系统结构进行优化成为现代编译设计的核心。由于“存储墙问题”,循环中数组访问的时间占程序总执行时间的比重
人们在筹划路径时往往面临两方面的挑战:一是难以准确地从海量信息中筛选出符合需求的信息用于筹划路径,二是筹划一条路径涉及地点的筛选和时间的安排等,需要投入大量的精力。有
噪声污染作为当代四大污染之一,随着城市化的扩大而成为困扰人们生活的难题。设置防‘噪板是解决公路噪声污染的主要途径,因此,如何经济有效的检测防噪板隔音效果已成为研究热门
目前MIS系统开发主要是小型企业的开发模式,系统通过项目负责人(主要是导师)来承担项目的管理、运作以及项目维护,开发任务一般由导师领导研究生共同完成,但正是由于这种缺乏有
随着针对不同操作系统平台的应用的蓬勃发展,企业构建跨平台网络的需求越来越强烈。然而,异构网络为企业带来灵活性的同时,也暴露了许多管理、安全等方面的问题。各种平台的
光纤通信以廉价和优良的带宽特性,已经成为电信网的主要传输手段。同步数字体系(SDH)和同步光纤网络(SONET)主要以光纤为传输媒质,随着光纤通信的发展壮大,成为现代传输网络
序列比对是现代生物信息学中一个最基本的研究课题。随着生物数据库快速持续的增长,对多序列比对算法的敏感性和运算速度提出了更高的要求,开发具有高敏感性和高效率的算法成
智能算法从模拟自然界生物体系和人类智能现象出发,用计算机模拟和再现人类的某些智能行为,在改造自然的工程实践中取得了巨大成功。智能算法中的神经网络由于其所具有的很强的
增强现实(Augmented Reality)是90年代初开始兴起的新技术,也是计算机图形、计算机动画于数字多媒体领域的研究热点。它是人们在工业、医学、娱乐等应用领域对新的用户界面技
时域有限差分(FDTD)法是电磁场数值计算中应用广泛的一种时域分析方法。该方法具有与求解问题特征无关的特性,通用性强并且适于并行计算,适合于天线等电大尺寸问题的求解。  
学位