基于WEP-L水循环模型的产流并行计算研究

来源 :华北水利水电大学 | 被引量 : 1次 | 上传用户:sharapova60
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前我国流域水文信息化的研究越来越受重视,但由于海量的数据处理和复杂的物理计算需要更多的时间开销,流域水文模型的模拟速度已不能满足流域水循环过程的精细化研究需求。基于多核的水文模型并行计算技术是提高模拟速度的主流方法,然而如何合理的设计并行算法应用于水文模型,以及如何高效利用CPU、GPU的计算能力已成为快速模拟中亟需解决的关键性问题。针对上述问题,本文基于WEP-L水循环模型的产流模块,选取OpenMP、MPI和CUDA三种具有代表性的并行技术,对模型进行了并行化设计,并对设计模型进行了效果分析,也在此基础上提出了进一步的优化措施。主要工作及成果如下:(1)基于OpenMP的模型并行计算设计与实现。本文对子流域循环采取指数调度方式,分配子流域处理个数由大到小的递减,进行CPU上多线程动态分配。以及对存在循环依赖关系的全局变量采取线程私有化设计,解决数据竞争问题。并行化的模型适用于多核的单主机。当线程数为20时,黄河流域产流模块计算的总时间达到最小,由单线程的9556秒缩短至1219秒。当线程数为18~20时,加速比峰值为7.8。(2)基于MPI的模型并行计算设计与实现。本文采用对等并行设计模式,全流域划分计算时间相对均匀的子区域,进行CPU上多进程静态分配。消息通信设计采取“点对点”和组通信相结合的方式,进行数据传递。并行化的模型适用于多核的单主机或多主机集群。当通信开销增量大于产流计算时间减少量时,并行计算达到瓶颈。此时,进程数为10,黄河流域产流模块计算的总时间达到最小,由单进程的5874秒缩短至1231秒,加速比峰值为4.8。(3)基于CUDA的模型并行计算设计与实现。本文划分全流域为子流域个数均匀的处理量,依次分配给GPU上数以千计的线程计算,进行多线程静态分配。线程块数采用流多处理器数量的两倍最优设置,充分利用计算资源。以及强迫限制单线程占用寄存器个数,增加内存存取时间换取更多的线程数运行,从限制前的最短5251秒再次缩短为3422秒,加速倍数为普通主机串行计算的2~3倍。
其他文献
聚焦短程反硝化技术亚硝态氮积累调控问题,基于微生物的磁效应,围绕磁场调控短程反硝化体系的亚硝态氮积累特性进行研究。在磁粉、磁铁、通电线圈的不同加磁场方式进行测量在
随着中央审计委员会的建立与中央两办《党政主要领导干部和国有企事业单位主要领导人员经济责任审计规定》的下发,经济责任审计工作在政府审计中的地位逐渐上升。但以往的经
企业的内部控制能力评估一直是理论界和实务界关注的热点问题,因为企业的内部控制能力决定了一个企业管理未来的发展和走向,直接关涉到企业的财务状况和经营成果,只有存在一
目前,在生产生活的许多方面都需要对微颗粒进行检测,例如在船舶压载水中如何快速地检测有害微藻,在工业生产中如何快速有效地检测油品成分,在临床医学中如何快速地检测癌细胞等。由于常用的微颗粒检测方法具有设备体积大、价格高和操作复杂等缺点,因此对微颗粒进行快速检测研究是非常必要的。光流控无透镜数字全息成像技术能够得到表征微颗粒特性的全息图像,通过提取全息图像的特征信息从而对微颗粒进行研究,这在海洋运输、工
石油化工生产流程中,建立一个有效的数学模型能够很好地描述投入与产出之间的相关关系,可以方便操作人员对生产流程进行准确控制和优化。石油化工流程中出现的小样本数据通常
传统化石燃料燃烧所造成的环境污染和能源短缺等问题在全球引起了广泛的关注。氢能由于其高能量密度、可持续、清洁无污染以及低分子质量的优点,被认为是从根本性解决能源与
我国深圳证券交易所和上海证券交易所成立至今,上市公司股价“暴跌”的现象时有发生,严重干扰了资本市场的健康持续发展,同时也损害了投资者的利益,资本市场股价的“暴跌”引
随着我国肉牛屠宰量的不断增长,副产物—牛皮的产量也随之增加。积极探索牛皮食用开发新途径,对于解决我国原料牛皮质量低下所致制革原料利用价值低、效益差等问题具有重大现
中国新能源产业发展面临较大的政策不确定性,主要体现为政策变动过于频繁,经统计,2013到2017年,仅光伏产业就颁布了152条政策,其数量是2008到2012年的五倍之多。在实际投资中
本文通过轨迹规划和谱分析研究了一类波方程的输出追踪与镇定问题.本文的结构安排如下:第一章是引言,该章节主要介绍本文的研究背景、意义,以及之前相关的一些成果,并给出了