【摘 要】
:
计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GPU,GPGPU)计算技术已经成为任何海量数据的必
论文部分内容阅读
计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GPU,GPGPU)计算技术已经成为任何海量数据的必要手段。但复杂的硬件环境、与CPU不同的编程模型,拉高了GPU运算的门槛。为了使更多的科研工作者用到GPU的运算,显卡厂商和编译器公司制订并推广了OpenACC标准。本文在OpenACC的基础上,提出一个自动为串行代码优化加速运算的框架——GENerate OpenACC,GENACC。该框架通过对源代码的静态程序分析,实现热点代码段的识别、运算特征分析,最终为源代码加上OpenACC指导命令,达到加速串行代码运算的目的。对于GENACC框架中热点代码分析阶段的运算时间估计和硬件加速能力判别问题,本文构建了一个新的运算代价评估模型。该模型通过热点代码的分析,以及对计算平台硬件属性的分层建模,实现了对运算所需的时间、完成运算过程消耗的能量的建模,是评价运算代价、合理选择运算设备的重要依据。对运算代价中的运算时间部分,结合并行计算的LogGP模型和运算理论峰值的Roofline模型,提出一个新的计算时间估计模型。本文依照建模的粒度粗细通过三层建模来计算消耗的能量。最后,本文通过EPCC测试集与NPB测试集,对运算代价评估模型和GENACC框架进行实验,实验结果表明GENACC能够正确生成编译器指导指令,生成的源码在不同数据大小上均有较好性能。
其他文献
针对无线Ad hoc网络中存在的TCP协议性能下降问题,研究者提出了包括端到端的改进方案,单层改进方案,跨层改进方案等各种方案,但这些方案均具有各自的缺陷,特别是不能有效解决
随着互联网技术的高速发展和计算机的大范围普及使用,人们的日常生活越来越离不开信息技术的支持。智能教学系统在信息检索、数据挖掘、机器学习等前沿计算机技术的支撑下有
复述是含义相同而表达方式不同的词、短语和句子。例如,英文单词“film”和“movie”为单词级别复述又称同义词或近义词;英文短语“take care of”和“look after”为复述短
恶意程序是威胁计算机与网络系统安全的一个重要因素,已成为计算机犯罪的一种新的演化形式。随着计算机和互联网技术的迅猛发展,恶意程序的传播速度、传播范围以及破坏程度日益
企业服务总线(Enterprise Service Bus, ESB)作为面向服务体系架构SOA(Service Oriented Architecture)的核心框架,是企业异构应用交互的基础平台,具有高效、全面、灵活的特
由于传统的敏感数据方法主要针对单一敏感属性的数据,然而很多现实应用中,发布的数据往往涉及到多个敏感属性。目前多敏感属性的数据发布方法成为重要的研究方向,但由于不同
众所周知,软件危机的主要特征是软件开发难度大,生产效率低,其正确性和可靠性得不到保证,而高级程序设计语言中的泛型语言机制和泛型程序设计,也称为参数化程序设计,是提高软
基于发送端和接收端多天线输入输出(Multiple-Input Multiple-OutPut,MIMO)的技术是LTE 系统中的关键技术之一,其最为显著的优势在于能充分利用随机衰落和空间多路径传播来提高
随着人工智能技术的飞速发展,作为人工智能领域的重要分支,机器学习同样获得了长期而稳定的发展,目前已经成为学术界研究最多的领域之一。其中,监督学习是目前研究的最多、应
现代服务业是指在工业化比较发达的阶段产生的、主要依托信息技术和现代管理理念发展起来的、信息和知识相对密集的服务业。服务管理平台是现代服务业的基础支撑平台。传统的