基于OpenACC的高性能计算并行优化研究与应用

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:sangtian1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的。以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选项对程序性能进行初步优化,再根据其数据依赖和访存特性,对数据和循环结构进行预处理并添加OpenACC指导命令实现循环级并行。实验结果表明,长波辐射过程并行计算结果正确,在不改变原有代码结构的基础上即可获得4~6倍的加速比,优化性能可比拟相同计算能力的Intel集群,虽然较GPU加速仍有差距,但大大增强了代码的可读性和可移植性,且随着编译器和硬件技术的发展,OpenACC有着广阔的发展空间。
其他文献
选择经同期发情且同期受孕, 在妊娠90 d时健康的苏尼特母羊27只,以4种营养水平(ME:0.20、0.33、0.44、0.86 MJ/(kgW0.75*d)分组饲养.分娩后,其27只羔羊在原来4组的基础上,各
目的探讨温针灸治疗腰椎间盘突出症临床效果。方法选取我院2017年1月-2019年1月期间收治的120例腰椎间盘突出症患者为临床研究对象,根据入院先后顺序将其均分为观察组与对照
目的:研究在结核病患者的护理中应用优质护理服务的临床应用效果。方法:选取我院收治的140例结核病患者作为研究对象进行分析,选取时间在2018年1月-2019年2月之间,按照随机数
脂蛋白脂酶(Lipoprotein lipase, LPL)是水解酶家族的一种三酰甘油-蛋白酰基水解酶. LPL主要是将乳糜微粒(CM)和极低密度脂蛋白(VLDL)中的三酰甘油分解成脂肪酸和甘油,并贮存
从卵巢采集的卵丘-卵母细胞复合体(COCs)经体外成熟培养24 h后,随机分为2组分别用于孤雌激活与体外受精.在相同培养条件下,比较孤雌生殖胚与体外受精胚的发育率和发育速度.结
目的分析阿托伐他汀辅助拜阿司匹林治疗脑血管病的效果。方法选择在我院接受治疗的114例脑血管病患者,研究对象筛选时间范围2017年6月-2018年7月。随机分为观察组和对照组。
目的探讨对普外科腹部开放性外伤患者行临床治疗的价值。方法2018年8月到2019年8月为纳入时间,纳入来我院就诊的普外科腹部开放性外伤患者74例,按照随机数字表法分组,各37例
为了解决当前网络暴露出来的诸多问题,对未来网络架构的研究已经形成一个新的领域。而内容中心网络则是这个领域中非常重要的研究对象。在内容中心网络中,每个节点都具备缓存
针对不确定数据流蕴含的概念存在往复出现的特点,本文对带有概念漂移的不确定数据流分布式分类算法进行了研究,利用适于大数据处理的分布式极限学习机算法,提出了基于分布式
网络空间日趋复杂,原有的网络安全防护手段大多属于被动防御,难以应对当前复杂的网络安全环境,随着Web服务的迅速发展,Web服务系统成为网络攻击的重灾区。针对当前网络的安全