论文部分内容阅读
应对从人口膨胀到环境污染、气候变化以及水资源短缺等实际需求时,水文科学的发展是我国国民经济健康发展的坚实基础和保障。面对解决重大科学水文问题,大规模流域的分布式水文模拟计算有着极其重要的作用和地位。然而,面向大规模流域高分辨率、长历时、多地理耦合过程的分布式水文模拟计算时,数据密集计算问题凸显,任务调度和资源分配存在一定的盲目性。现有的在该领域进行的研究中,流域的不同划分类型采用不同层次的并行计算方法,且模拟单元单一化时,并行效率提升则相当有限。归纳起来,存在两个关键性的问题亟待解决,它们分别是:高效的分布式水文模型并行算法的缺失、任务调度和资源协同分配机制的缺失。本文首先对分布式水文模型的可并行进行分析,比较了它们各自实现的可行性。然后参照空间离散分解方式,建立起基于生态最优性原理的分布式流域水文模型框架。那么,本研究则是针对这种分布式水文模型并行计算框架展开的,它主要包含以下内容:第一,对计算密集或数据密集特征的任务依赖和并行处理的耦合度过高,采用DAG调度的并行方法处理任务间依赖关系问题;第二,在DAG调度算法中,表调度算法时间和空间复杂度均有良好的表现,但是解空间的质量很低;遗传算法、模拟退火算法等随机搜索算法有优良的解空间但在任务调度上的开销比较大,甚至对于不同的DAG图都有着不同的控制参数,实现难度较大。因此,在这基础上考虑到任务调度开销和并行效率提升两个方面,本文对其进行权衡、折衷,提出基于任务高度动态调整任务优先级的DAG调度算法;第三,在解决密集计算任务吞吐问题方面,任务和资源的匹配存在盲目性,本文提出一种自适应资源协同分配的模型,充分考虑资源性能度量和任务计算密集程度,来实现任务调度和资源的自适应匹配。实验结果表明了该并行算法的高效性和自适应资源协同分配模型的有效性,该方法具有较好的鲁棒性和扩展性。