基于决策树的GPU应用性能评估方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:darkage12223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GPU因其卓越的并行计算能力已经被应用到许多领域,但GPU架构的复杂性使得程序员很难充分利用GPU上的所有计算资源和存储带宽。同时,GPU内存层次的复杂性和GPU多种形式的并行处理,使得找到GPU应用程序的性能瓶颈非常具有挑战性。尽管目前已存在一些模拟器或分析工具,但它们只提供大量的、程序员无法很好理解的数据信息,需要具备很强的专业知识才能对数据进行进一步分析。也有一些研究使用数学建模方法来进行性能分析,但这些方法通常过于复杂,而且需要依赖各种监控工具来获取分析数据,耗时很长,不易于用户使用。  针对上述性能分析方法存在的问题,提出了一种将决策树算法与理论分析模型相结合的性能评估方法GPUPerfML,来快速准确地定位GPU应用的性能瓶颈,并指导应用程序优化。利用决策树算法对通过nvprof工具获取的应用性能特征数据进行学习和训练,构建出能够表征应用性能特征重要度的决策树。基于决策树的特征选择,可以从大量特征中提取对应用性能影响较大的性能特征集合。同时,将这些特征根据对性能的影响程度进行排序,能鉴别出影响性能的几个关键因素、以及它们的重要程度。提出的基于程序的理论分析模型根据GPU架构及GPU应用运行情况的相关性,将性能问题分为计算相关、内存相关、同步相关三大问题,并建立了性能特征与这些性能问题之间的映射关系,从而快速直接地识别出GPU应用的性能瓶颈,通过理论分析来指导决策树的构建和特征分析,保证和提高了该方法用于性能评估的准确性。  基于Linux操作系统和CUDA平台,实现的基于决策树和理论分析的性能评估方法分析四种常用且具有代表性的GPU应用程序(Matrix Transpose,Parallel Reduce,BFS和SPMV),识别其性能瓶颈并基于此对其进行优化。实验结果表明,该性能评估方法能准确鉴别出不同应用程序的性能瓶颈问题,判断出的影响程度与实际相符,而且据此进行的优化达到了12%~144%的性能提速。
其他文献
我写的《卷土重来未可知》(载1987年10月6日《洛阳日报》)被评为河南省好新闻,粗浅体会是: “养兵千日,用兵一时”,即平时积累大量资料,关键时敢于分析推断。据有关部门统计
党报通讯员的神圣职责,是如实地、准确地向党报反映情况和撰写稿件。全省绝大多数通讯员同志正是这样做的,他们以战斗的姿态,扎扎实实、一丝不苟的工作作风,出色地完成了党
本试验应用二次回归正交旋转试验设计方法研究了黑河九号大豆主要栽培因子(密度、氮肥、磷肥和钾肥)与大豆产量的关系,建立了黑河九号大豆在本省第四积温带黑河地区土壤中等
随着交友网站的发展,有目的地针对特定的交友用户进行广告投放具有明显的商业盈利价值。为了提高网站的知名度,降低运营成本,汇聚更多的用户,交友网站需要根据站点访问记录,
协同设计能够节省时间,提高工作效率,是目前许多工作量大和复杂性高的企业采用的工作方式。其中实现各个协作单位间产品相关的数据和过程集成化管理,建立数据集成服务器的技
随着数据万维网的逐步成形,大规模自动实体匹配成为一个急需完成的重大任务。该任务旨在将万维网上来自不同数据集,却有着同样意义的实体进行匹配,从而使网络程序在探索、查
计算机支持的协同工作(Computer Supported Cooperative Work,简称CSCW)被广泛应用于电子商务、网络教学和网络办公等一系列领域,本文针对高校环境下办公系统的特点,结合CSCW
互联网技术的快速发展及其在各行业的广泛应用,给人们带来便利的同时也带来巨大安全隐患,近年来随着震网、火焰等重大网络安全事件曝光,信息安全越来越受到重视,国家已把信息
随着高等教育改革的不断深化和拓展,传统教学管理的手段和方式的弊端日益凸显,当前应探索科学发展观对高校教学管理的重要指导意义,并采取有力措施,推动高等教育全面、协调、
电容层析成像技术(Electrical Capacitance Tomography,ECT)主要具有响应快、非侵入和成本低等优点。作为过程成像技术的一种,其原理是被测物质介电常数分布可由围绕在其周围