面向OpenFOAM的消息日志容错技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wangpin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算流体力学的飞速发展需要高性能的并行计算系统,然而高性能计算机的发展面临着严重的可靠性问题。为使得大型CFD计算程序在故障频发的运算平台上继续保持可用性与扩展性,我们需要为其设计高效易用的容错机制。OpenFOAM是CFD领域编程框架的典型代表,用户可以通过书写近似自然语言的方式对CFD应用进行描述,从而在OpenFOAM平台上开发出可运行的CFD并行模拟程序,实现对底层并行细节的屏蔽。从可编程的角度看,这类开发方式是目前CFD并行编程的一个很有吸引力的发展趋势。但OpenFOAM现有的自容错机制开销大,且需要用户值守。因此本文着眼于为OpenFOAM引入异步在线恢复容错思想,并为此设计配套的容错框架。本文的主要工作与创新点体现在:一、设计实现了基于OpenFOAM的容错框架(第二章)借鉴OpenFOAM的设计初衷,我们设计的容错框架仅要求领域用户修改配置文件,以类自然语言的形式选择所期望的容错机制方法,并设定相应的参数;而具体容错机制方法以及相关优化技术的实现则由计算机专家在框架中选择合理位置插装完成,减轻了领域用户的容错负担。二、为OpenFOAM引入了异步在线恢复的容错思想(第二章)本文基于协同检查点机制与用户级消息日志协议构建容错框架,为OpenFOAM引入了异步恢复的容错思想,即仅自动回滚错误进程,从而有效地节省了恢复过程中的总体CPU时间开销,同时避免产生多米诺效应与孤儿进程。三、提出了用户级消息日志协议,革新了组通信的容错方法(第三章)用户级消息日志将传统实现在MPI库级或以下的消息日志提升至用户代码层,从而给消息日志的容错方式与容错能力带来了如下三点改进:?以用户级语句代码为粒度记录归约通信消息,屏蔽了归约通信在MPI库级的实现细节。从而减小了归约通信的消息日志及恢复开销?消息日志与MPI库的实现不再耦合,保证了用户级消息日志的可移植性。?利用用户级通信语句的确定性,安全地取消了传统消息日志中的事件日志机制,进一步减小了归约通信与点对点通信的容错开销。四、NPB与MD模拟实验验证了容错思路的正确性与有效性(第五章)本文在TH1-A上运行NPB与OpenFOAM分子动力学模拟例程MDFOAM,实验结果证明:与现有传统消息日志与OpenFOAM的自容错机制相比,用户级消息日志协议与异步在线恢复容错框架有效减低了容错开销,加快了故障后的恢复速度。
其他文献
由传感器、微机电系统和网络三大技术融合而形成的传感器网络是一种全新的信息获取和处理技术。而无线传感器网络是计算机科学和技术的一个新的研究领域,由于其广阔的应用前
随着时代的进步与科技的发展,人类进入一个高度信息化的社会,人们越来越意识到掌握信息的重要性,各个企业和部门也越来越重视自身信息化的建设。目前,国内的大多数中小企业都已建
数控(NC)技术是近代发展起来的一种自动控制技术,是用数字化的信息实现机床控制的一种方法,也是现代制造技术中最关键的环节。数控插补技术是数控系统的核心技术,其功能强弱直接
UNIX操作系统是当前世界上使用普遍,影响深远的主流操作系统。它具有很高的可靠性、稳定性、安全性。现代企业随着规模的不断壮大,迫切需要通过网络将各个部门联系起来,以加
教材建设及管理是高校教育信息管理现代化的基础及关键,教材管理从传统的人工操作到信息管理自动化、网络化势在必行。本文根据我校教材建设与管理模式的特点,围绕教材三要素在
本文首先通过实现TalentBase系统(TalentBase系统是东软、翰威特联合推出的一个e-HumanResource产品,它基于J2EE规范的企业级信息平台,体系结构采用了符合J2EE规范的MVC三层模式
随着软件、硬件和网络技术的快速发展,积累的历史数据成千上万,在这些数据中存在着大量有用的信息。数据挖掘就是用来从大量的、不完全的、有噪声的、模糊的、随机数据中,提取隐
本文针对建筑行业投标报价过程中的种种难题,利用遗传算法和神经网络等人工智能技术开发一套投标报价决策支持系统。全文主要的研究内容和研究成果概括如下: 针对建筑行业投
本文是以概念层次网络(简称HNC)理论为基础的,该理论是自然语言理解处理领域的重要理论。它以概念联想脉络为主导,建立了自然语言表述和处理的新模式,语义块和句类理论是其主要
在网络高速发展的同时,网络的开放性导致的安全问题也日益严峻。深度报文检测是网络安全的核心技术,深度报文检测利用预定义的规则集对报文内容进行匹配,从而识别出隐藏于报