基于“申威26010”异构众核处理器的WRF模式移植与优化

来源 :山东大学 | 被引量 : 0次 | 上传用户:pittashen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WRF(Weather Research and Forecasting Model)模式是一种在世界范围内应用非常广泛的中尺度数值天气预报模型,它由美国环境预报中心(NCEP)、美国国家大气研究中心(NCAR)以及全球范围内无数科研单位联合研制开发。它的主要功能是进行天气预测、生产数据从而进行大气研究。WRF模式的大部分代码是由Fortran语言编写而成,所以即使在不同平台,只要拥有版本适用的Fortran编译器,即可使该模式源码得到编译层面的移植,这样使得其具有一定的跨平台性。相对于其他气候模式,WRF模式拥有优异的数据同化技术,以及功能强大的物理过程模块,并且支持嵌套。同样,WRF模式是由多个极为复杂的组件组合在一起的应用软件,它运行起来往往极为耗时,通常,若取得比较好的模拟效果,将其运行在超级计算机上是一种非常明智的选择,这样就可以大大提高数据生产效率并且节省大量科研人员的等待时间。本文的主要工作正是尝试将WRF模式运行在具有代表性的国产异构众核超级计算机---“神威·太湖之光”上。“神威·太湖之光”是中国新一代超级计算机之一,它的峰值性能达到了125.4Pflop/s,由国家并行计算机工程技术研究中心(NRCPC)开发,采用新型“申威26010”多核处理器,基本软件涵盖了C/C++和Fortran的定制编译器。系统支持扩展了很多语法OpenACC 2.0语法。除此之外,系统提供了一个名为Athread的线程库,利用Athread可以实现细粒度的并行。本文介绍了将WRF模式移植到国产“SW2610”异构众核处理器上,并且通过国产平台的athread线程库对动力框架的stencil类型的循环进行了细粒度的优化,充分利用了“SW26010”异构众核处理器的多核性能。对于物理过程部分,本文介绍了通过重写函数结构,利用OpenACC编译指示语句将循环拆分,对非stencil类型的函数热点循环进行优化。对于通信部分,我们介绍了如何通过实验的方法,来改变进程布局,最大限度解决负载不均衡的问题。另外我们通过逐渐提高并行度,从而在多个计算核心上扩展整个模式,这样,不仅在核组内部进行细粒度的线程级优化,并且通过MPI通信接口将整个模式扩展到几百个计算核心上,利用超级计算机的并发性,获得优异的计算效率。此外,本文介绍了性能分析的方法以及效果评估。介绍了基于国产“神威·太湖之光”的插桩性能分析工具GPTL,并且利用GPTL对WRF模式的性能进行测试。通过Athread以及OpenACC对程序进行优化,相较于纯主核版本,经过优化的模式型内性能提升了 2.4倍。
其他文献
节能减排作为一项关乎民生的大事越来越受到社会各界的重视。近年来,我国GDP每年以109/6的速度发展,然而,能源消耗的急骤增加和生态资源的过度开发,使节能减排工作显得更加紧迫。
课后作业是对课堂学习内容的延续,在巩固学生 知识、加强学生思考、培养学生形成良好学习习惯等方面具有 重要意义。由于数学对学生逻辑思维能力和创新能力的培养 起到至关重
随着人事管理制度改革的不断深入,人事代理制应运而生,本文针对人事代理制发展的现状,分析人事代理制在高校管理中存在的一些问题,通过探讨人事代理制管理的意义,提几点人事代理制
目的:探讨中美原发性食管小细胞癌(PESC)的临床病理特征、治疗方式及预后的差异。方法:回顾性分析2010年1月至2018年6月郑州大学第一附属医院收治的82例及2008~2016年美国SEE
数字印刷对文档的印刷产生了巨大的影响。尽管增长率正在放缓,但喷墨技术仍在推动当前数字化应用的增长。尤其在包装印刷中,增长率仍然很高,无论是装机量,还是数字印刷的产量
果树相对于其他常见作物来说,栽培管理方式稍有不同。随着我国农业技术的发展,果树的栽培管理技术也得到了质的飞跃,实际上为了遵循因地制宜的原则,在北方的果树栽培情况中,
目的研究清肠汤联合美沙拉嗪对热盛血瘀型活动期溃疡性结肠炎的临床疗效及作用机制。方法 选择2018年10月到2019年12月在南京中医药大学附属张家港医院门诊及住院治疗的热盛
樱桃番茄是联合国粮农组织优先推广的"四大蔬果"之一,在全世界广泛种植,我国近几年也发展迅速,设施栽培樱桃番茄面积不断扩大,已成为乡村振兴、都市农业等现代农业主角。但设
三国后期,政治、军事人物较前期相对暗淡,但局势更为复杂,有许多值得深入研究的问题。蜀汉君臣才智平庸,社会秩序混乱,民族矛盾突出,战事频而财资匮乏,国祚渐至灭亡。考察蜀
本文以毛乌素沙地柳湾林为研究对象,通过野外调查和室内实验,应用数量生态学、统计学与地统计学等方法分析,揭示了柳湾林植物区系特征、群落类型特征、群落动态演替机制。为