OpanACC 2.0性能可移植性分析

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:Puzzling600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高性能计算领域,应用的性能可以伴随着处理器的“摩尔定律”而提升,编程者不需要改写代码便能获得处理器性能提升所带来的“免费午餐”。现如今这一趋势已经由于主频的功耗瓶颈而无法延续下去,于是在高性能计算中兴起了采用加速器的异构并行计算实现计算性能的进一步提升。OpenACC是一种基于指导语句的异构并行编程标准,能使编程者脱离异构加速器的复杂底层架构进行编程,简化了异构并行的难度。此外,OpenACC编译器能通过这一高层的编程模型生成不同平台上的并行代码,从而使采用OpenACC编写的应用具备了优良的跨平台性。  在Top500榜单上的不少超级计算机都已大量采用异构并行计算作为其性能的来源,例如天河二号、Titan和TSUBAME2.5。高性能计算的应用开发者面临着在采用不同加速器设备的超级计算机上需要编写不同的代码进行并行计算,例如CUDA、OpenCL和OpenMP。而OpenACC则基于上述的优点,成为解决这一问题的一种简便方法。  本文主要针对OpenACC在NVIDIA Kepler架构的GPU和Intel Knights Corner架构的协处理器上的应用性能可移植性进行研究。实验基于Rodinia测试集中的四个算例和Hydro这一小型应用,通过CAPS和PGI编译器的编译。实验结果显示,基于常规的性能优化手段可以将采用OpenACC和OpenCL编写的应用之间的性能差距缩小,在PGI平台上缩小到75%之内,在CAPS平台上缩小至53%。本文最终通过PTX(Parallel Thread Execution)代码对于结果进行分析。
其他文献
移动台OTA测试是一种用于评测无线终端设备的测试方法,用于验证无线设备和网络的连接能力,以及使用者对辐射和接收性能的影响。通用接口总线(GPIB)普遍应用于智能仪器的管理,基
疲劳使得人的反应能力和操控能力大大下降,特别是对于外界瞬时的环境变化、出现紧急情况的状态下,如果不能及时地作出反应和应对措施,发生事故的可能性大大提高。特别是在驾
随着计算机网络和信息技术的广泛应用,信息和网络系统的安全变的至关重要。入侵检测技术是继防火墙、VPN、数据加密等传统安全保护措施后新一代的安全保障技术。它作为一种积
近几年来,工作流管理技术被业界广泛采用并得到了迅速发展。工作流管理最重要的功能之一就是工作流建模。这些预定义的过程模型必须能很好的反映实际业务流程,因此需要找寻灵
随着Web的快速式发展,传统的通用搜索引擎技术暴露出了覆盖率低,资源占用多,更新时间长,结果的针对性低等一系列问题。为了克服通用搜索引擎的不足,满足特定用户针对特定领域
随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的
随着现代物流的迅速发展,物流模式也由第三方物流向第四方物流过渡。第四方物流做为物流过程的中介者,需要对物流过程进行全程跟踪并且做出相应的决策。将WebGIS技术应用于第
网格环境中的任务调度是网格研究中所必须解决的一个关键问题,也是网格应用的基础。同时,调度策略又是任务调度的重中之重,一种好的任务调度策略,不但可以减少任务的执行时间
随着云计算技术空前的发展和海量数据的计算需求更加膨胀,工作流系统作为用户业务与云计算资源之间的纽带和桥梁越发受到重视,现有的工作流管理系统多以第三方独立系统形式与
随着计算机处理能力的不断增强和网络通信技术的迅速发展,越来越多的计算机连接到了Internet上,因此,如何有效地利用这些互联起来的计算资源,使之共享起来,成为当前网络技术