GPU平台的OpenACC指导命令实现研究

来源 :2013全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:lovedengdai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构加速部件在高性能计算中的广泛应用,给并行应用程序的开发提出了很大的挑战。OpeltACC编程标准旨在于制定一个基于编译指导命令的异构编程模型。本文基于开源软件accULL研究了OpeltACC到CUDA的源到源转化过程,实现了parallelloop指导命令语句在NVIDIATesla k20c上进行实验.对OpeltACC应用进行性能评测,与Intel Xeon E5—2680 CPU平台进行对比结果表明在GPU端,程序性能有非常显著提升.
其他文献
针对未来E级计算存在的诸多困难和挑战,本文提出了将指令集扩展技术用于解决未来E级高性能计算系统的构建,并对指令集扩展技术和可扩展处理器架构展开深入研究.最后,本文提出
高性能计算机的系统规模越来越大,系统可靠性问题越来越严重.针对系统低可靠性与大规模数值模拟需要长时间稳定运行之间的瓶颈,在系统上部署了多级检查点/容错技术.本文详细
中国动物学会寄生虫学专业委员会于1985年1月14日在厦门市鼓浪屿成立。参加这次会议的代表共有178名,来自全国各地的大专院校、科研部门、医药卫生、畜牧兽医、林业水产和部
近年来,功耗是处理器设计领域的关键问题之一.本文提出了一种针对多线程共享缓存通过过滤不必要缓存路(Way)访问来降低CPU动态功耗的缓存结构,称为Thread id Cache.通过设置
会议
并行分布式可视分析已成为科学计算数据后处理的支撑技术.在渐进和快速迭代开发可视化系统中,如何验证和确认可视分析平台面向复杂网格类型、多种可视化方法耦合情况下的稳定
会议
1983年9月~1984年8月对溆浦县EHF疫区健康人群进行了抗体调查和宿主动物带毒情况检查。人群隐性感染率为1.97%;鼠类带毒率为3.01%。发现全年3个带毒率高峰,以4月最高(7.80%)。安
对于一类系数矩阵为H-阵的线性互补问题,本文提出了一类非稳态松驰同步多重分裂方法,并分析了方法的收敛性.数值实验说明新方法是有效的.
目的:探讨临床护理路径在心血管专科疾病护理管理中的临床应用效果.方法:对我院心内科收治的心血管专科疾病患者分别进行常规护理和临床护理路径干预,观察并比较其护理效果.
高通量测序仪产生大量的DNA数据,FASTQ是存储DNA数据被广泛使用的数据格式.对FASTQ格式的数据进行压缩处理,能有效的节省存储空间.DSRC算法具有压缩比高的优点,因此对DSRC算
120汽油引起的慢性汽油中毒,对神经系统、血液系统等的影响已有许多报导,内分泌系统的改变也被国内许多学者注意。董士元发现石油制品可使甲状腺的功能状态发生障碍,同位素