GRAPES有限区域切线/伴随模式高效并行算法研究

被引量 : 0次 | 上传用户:huan2735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
四维变分同化技术作为数值天气预报的关键技术之一,可将不同地区、不同性质的观测资料随时间的变化信息融入到初始场,从而提高系统的预报质量,因而当前在国际上被认为是最有效的资料同化方案。但其计算过程非常复杂,程序占用内存量巨大,系统的运行时间较长。我国自主研发的新一代数值天气预报系统GRAPES(Global/Regional Assimilation and Prediction System)的四维变分同化系统(GRAPES-4DVAR)也有计算量大,占用内存多,运行时间长的特征。如何针对GRAPES有限区域模式在算法或代码上进行改进,提高其运行效率和并行可扩展性,是本文研究的关键与重点。文章主要从优化程序代码、改进伴随算法、开展混合并行等方面来提高程序的运行效率和可扩展性,研究并实现减少程序运行时间的有效方法。主要内容概述如下:(1)对GRAPES有限区域模式的代码进行调整优化。研究提高内存系统资源利用率和处理器运算部件运行效率的方法,消除代码中对性能有着显著影响的瓶颈因素。通过有效的代码实现,非线性模式的运行效率提高约25%。(2)提出了一种新的伴随模式计算方法—极限断点存储技术。用增加约30%的内存代价换取了程序运行性能100%的提升。(3)提出了一种可实现数据块先进先出与先进后出关系的内存数据管理技术,并实现了该结构-嵌套多链栈。(4)针对GRAPES伴随模式并行读写外部存储器可扩展性受限的问题,提出一种增强性能的改进方案。用有限的内存空间来实现大量中间数据的管理方法,替换了影响性能的外部存储器读写过程,实现了当扩展处理器规模超过128时,可减少70%程序墙钟时间。(5)实现GRAPES的混合并行计算。立足当前流行的集群系统结构,实现了在节点内使用OPENMP线程级并行,节点间使用MPI进程级并行的混合并行来替代纯MPI并行的GRAPES计算方法。得出了当纯MPI并行效率下降到90%以下时,使用混合并行方式,可提高5%到10%左右的结论。
其他文献
以某高层建筑为背景,分析了高层建筑钢筋混凝土结构的设计原则及设计要点,进而提出层间混凝土剪力墙局部置换加固方案,并对该施工技术进行了研究,结果表明:该技术具有高度可
近年来,我国种业发展迅速,取得了诸多的成就,但是种业知识产权保护还不能适应现代种业的要求。农村居民是种业知识产权保护的重要力量,以问卷为基础,对当前我国农村居民种业
原状磷石膏经过干燥、过筛处理后,按磷石膏∶矿粉∶P·O 52.5水泥∶生石灰=50%∶40%∶5%∶5%的质量比制备过硫磷石膏胶凝材料(EPGC)。采用加入不同量氯化钡的方法来探究B
新型的大跨度V形墩拱梁刚构组合体系桥梁充分发挥了拱受压、梁受拉的结构特性及其组合作用特点,但受力相对复杂。本文以株洲五桥为研究对象,着重从以下几个方面对该新型体系
随着市场经济的不断发展,流动商贩的数量不断增加,对社会的影响也越来越大,已经成为现代市场经济发展过程中的一类重要群体,流动商贩日渐成为行政法学、行政管理、城市规划与
随着城市的发展,城市规模的扩大,人口密度的增加,中高层及高层建筑在城市中的数量急剧增加,在城市建设中建筑随意搭建,建筑排列混乱,无秩序的现象屡见不鲜,严重影响了城市景
镟轮作业是城市轨道交通车辆日常维保维护中必须开展的一项关键作业,现阶段从全国范围来看,各地城市地铁系统的车辆厂段均会设计和配置列车镟轮线路及相关设备。当今主流的镟
提高肺结核治愈率,控制结核传染源,防治后遗症,治疗菌阳肺结核使痰菌尽快转阴是治疗肺结核的关键.2000年2月至2001年月12月我们对部分住院的肺结核病人及门诊监控治疗的病人,
为适应电子元器件小型化、集成化的发展趋势,高分散性球形银粉的市场需求不断增长,相关制备技术的研究持续升温。论文采用液相还原法,以抗坏血酸为还原剂制备高分散性球形银
本文主要针对农村行业性公共管理组织的现状与特点为重点进行详细的分析,结合当下农村行业性公共管理组织运营中存在的问题为依据,从农村行业性公共管理组织现状与特点、农村