增量检查点设置与卷回恢复技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xsnxj112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算系统现在越来越多采用将许多计算节点高速互连的集群形式实现,随着集群系统的规模不断扩大,其发生故障的次数也以指数增加,系统的容错性和自我修复能力正变得极其重要。检查点作为一种有效的容错技术,在系统出现故障时能够避免程序从初始状态重新执行。通过设置检查点,进程可以从最近的检查点处恢复状态继续执行,减少故障条件下程序的执行时间。检查点机制在提高系统可靠性的同时,会引入一定的额外开销。在实际系统环境中,尤其是高性能计算系统,用增量检查点技术减少检查点开销使用得较为广泛。通常检查点每次都需要保存进程的全部信息,而增量检查点只需保存自上个检查点以来进程空间中被修改的数据,能够显著减少检查点文件大小和开销。本文对增量检查点技术进行研究,分析比较页面级增量检查点和字节级增量检查点的优缺点,采用页面级增量点,结合页面保存技术和虚拟内存区域保存技术,以内核模块的形式实现增量检查点的设置。本文利用页表项的写位判断页面是否被修改过,提出通过修改系统调用表的方法检测变化的虚拟内存区域,设计相应的虚存监控数据结构记录变化的内存区域。为了减少增量检查点卷回恢复的开销,本文将完全检查点和增量检查点结合使用,采用从后向前的顺序读取检查点文件。本文支持检测内存区域的变化,无需修改内核源代码和应用程序代码,用户使用透明。恢复时相同页面只需恢复一次,已被删除的页面不需恢复,有效减少卷回恢复的开销。
其他文献
本文针对应急决策支持系统中数据交换的需求,提出利用XML(可扩展标记语言)技术建立数据交换平台,用统一的方式,实现各个系统之间不同结构和格式的数据的相互转换,解决了数据
近年来频频爆发的恐怖活动、地震、洪水、火灾、流行性传染病、煤炭安全生产以及稳定输送电能中的重大事故等突发事件对人民群众生命财产和社会安全造成极大危害。突发事件妥
定位与路径规划是月球车导航的两个重要问题。月球车要实现在月面环境下自主导航首先必须时时刻刻清楚自己的位置,之后能根据当前环境规划出一条合理的路径。因此本文围绕着
随着大规模数据收集技术、存储技术、网络技术以及信息技术的发展,越来越多的企业、组织和个人正逐步陷入数据泛滥但知识匮乏的困境中,聚类分析已经成为从大量冗余数据中提取有
近年来,随着互联网的快速发展,互联网已经成为人们之间进行交互的重要平台,从而产生一种基于信息的社会网络,与传统社会网络相比,在基于信息的社会网络中人们的交互方式和信
随着Internet应用的普及以及信息的飞速增长,越来越多的企业或政府组织开始采用企业竞争情报系统来收集、分析和管理他们所需的Web情报信息。这就对企业竞争情报系统中的关键
随着网络时代的发展,Internet已成为重要的基础信息设施,越来越多的设备需要接入Internet,但目前嵌入式微处理器接入Internet的解决方案却有很多种。论文详述了根据系统设备特点
GASOR(GeostatisticalAnalysisSystemOfReservoir,储层地质统计分析系统)系统是西安石油大学软件研究所经过十多年研制开发出来的一种油藏描述软件。GASOR系统主要用于油气田
随着互联网技术的发展,一方面,对等网络的提出彻底颠覆了传统的客户机/服务器模式,为网络上新的应用提供了一个更新颖的拓扑结构;另一方面,“网格”概念的提出为互联网上的服务提
随着入侵事件的日益猖獗,人们发现只从防御的角度构造安全系统是不够的。入侵检测技术是继“防火墙”、“数据加密”等传统安全保护措施后新一代的安全保障技术,它对计算机和网