论文部分内容阅读
涵盖了物理、化学、生物活动、计算机等诸多学科的地球系统模式是目前气候领域研究人员用来研究和了解气候与环境演变机制并用于预测未来全球气候变化的重要数值模拟工具。并且由于地球系统模式在研究和预测地球气候变化上具有重要意义,目前世界上的主流国家均已开展了相关的研发工作。在诸多研究成果中,最具代表性的就是由美国国家大气研究中心开发的耦合气候模式CESM(Community Earth System Model)。耦合气候模式CESM采用的是可插拔的模块化耦合框架结构,是目前地球系统模式中最先进的一款开源耦合气候模式,并且对诸多其他国家的实验室研发耦合气候系统模式产生了巨大影响。据CMIP5(Coupled Model Intercomparison Project Phase 5)统计,全球有超过四分之一的耦合气候模式与耦合模式CESM直接相关或使用了其底层框架,这其中也包括了我国的气候模式开发实验室提交的几款耦合气候模式。目前研究人员使用的地球系统模式软件主要被部署在各个高性能集群或超级计算机中。像耦合模式CESM这类耦合地球系统模式,是支持多进程、多线程以及共享内存的,并且其内部的各分量模式间也有着复杂的耦合关系,因而其在通信、访存和计算上都有着相对密集的特点,并且这些因素互相牵制影响着整个模式软件的性能。目前,以耦合模式CESM为代表的气候模式在运行性能优化方面仍然有很多工作可以进行。据研究统计,耦合模式CESM每有1%的运行性能提升,都会为研究人员节省数百万美元的开销。此外这些针对耦合模式CESM进行的性能优化的工作是可以直接或间接地应用在其他相同框架的耦合气候模式中,这对于我国目前进行的耦合气候模式的研究开发工作有着重要意义。为了对耦合气候模式CESM的运行性能进行优化提升,本文首先对耦合模式CESM的主体代码结构、运行和通信行为进行了分析,然后结合耦合模式在现实中的运行统计数据,对耦合模式CESM及内部分量模式的运行状态进行了分析研究。实验分析发现耦合模式内各分量其本身以及在分量设置不同的情况下都有性能波动的现象。并且耦合模式运行在实际非独占的集群中,也会发生剧烈的性能波动。在完成对耦合模式CESM的相关分析工作后,本文对耦合模式内各分量模式的资源映射分配问题进行建模分析,并将这样的过程抽象为一个特殊的二维装箱问题。为解决这样的资源映射分配问题,本文提出了基于历史统计数据的资源分配最优解算法GSLOpt。为解决耦合模式因性能波动现象可能造成资源的利用不充分,本文提出了一套耦合模式在线资源调整策略。本文通过对耦合模式分量波动现象以及历史数据的分析,提出了对历史统计数据订正的AHBOS算法策略。由于在线资源调整有及时获得再分配方案的需求,本文提出了一个用于资源在线调整且运行高效的启发式算法FFADH。最后利用提出的资源映射分配算法和资源在线调整策略,为耦合模式CESM实现了一套资源自动化映射分配和在线调整的工具。在进行实验分析时,本文将提出的最优资源算法GSLOpt和用于资源在线调整的FFADH算法的资源映射分配方案分别实际应用于耦合模式的实例,并将使用这些资源方案的实例与使用其他几种常用资源策略方案的实例进行对比分析。实验发现,在分量设置和网格划分相同的情况下,GSLOpt算法方案的实例在实验中都有最好的性能表现。在实验中与其他策略方案相比,使用GSLOpt方案实例的平均每轮迭代时间最少有9.9%的优化,模拟年/日平均最少有9.07%的提升。用于在线资源分配的FFADH算法有着良好的时间复杂性。在验证FFADH算法的方案在实际应用效果的测试实验中,使用FFADH算法方案的实例在运行性能上最少有4.1%的平均每轮迭代时间优化,模拟年/日平均最少有5.22%的提升。对于资源在线调整策略的实验分析,本文将使用资源在线调整的实例与正常的实例分别运行在模拟现实中负载变化的集群。在实验中使用资源在线调整的实例相比正常的实例在整体运行时间上平均可以有8.97%的优化提升。在极端负载的实验中,使用资源在线调整的实例,在资源进行调整后平均每轮迭代时间可以降低12.28%,模拟年/日可以提升9.36%。