分布式系统中基于检查点容错服务的设计与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:myxyj2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式系统的错误频率的增加导致运行应用任务完成时间增长,并且近年来大量记录了大规模分布式系统运行状态的现场失效数据以规范格式公布,在此背景下,本文研究分布式系统下基于检查点的容错服务,利用系统失效关联性特征来建立模型,得到减小分布式任务的完成时间的检查点放置策略,从而在保证系统可靠性的前提下,降低容错服务的实现代价,提高分布式系统的运行效率。论文主要的工作和贡献包括:(1)研究检查点/恢复技术的基本机制及其实现方式,分析分布式系统中保存通信状态以及保证其一致性的难点,通过实现了一个原型系统,研究全局检查点的代价、分布式系统的规模以及应用程序大小之间的关系;(2)提出一个基于检查点和系统失效关联性特征的容错模型,根据失效事件相关性分析结果,提出一种分布式系统节点关联性分组方法,利用节点分组信息建立以最小化浪费时间为目标的优化方程,得出了主动检查点的放置周期,并提出了一个包含主动检查点以及被动检查点的两类检查点放置策略;(3)基于FTA中失效数据格式,设计并实现了基于检查点的容错服务,并进行了对比仿真。首先选取FTA中部分系统失效数据,分别实现了本文提出的容错服务以及其他检查点容错服务,评估其中的参数,再利用剩下的系统失效数据进行性能评估,实验结果表明本文提出的容错服务的额外浪费时间较低,达到了预期目的。
其他文献
Web2.0的迅速崛起,使各类虚拟在线社区服务如雨后春笋般涌现,诸如各种社交网站,BBS论坛等。由于Internet本身的特性决定了个人基于Web可以在短时间内建立大量“好友关系”,致
微课程中的“微”既指教学时长短又指教学内容少.一方面,教学时长短便于学生利用碎片化时间学习;另一方面,教学内容少对教师做教学设计提出了更高的要求.文章以概率论与数理
英语函电往来作为外贸人员和国际物流从业人员的必备技能,是高职商务英语专业毕业生的核心竞争力之一。“以就业为导向”的高职教育需要针对市场进一步丰富《函电》教材种类,
本文通过对荣华二采区10
在模式识别领域,模式的变形无处不在,如何应对模式变形给特征提取和后期识别带来的不利影响,这是一个亟待解决的重要课题。在汉字识别领域中,人们在进行汉字书写时,汉字会发
Ad Hoc网络自出现以来就备受关注,已成学术界和工业界在通信领域的重要研究对象。Ad Hoc网络既没固定结构也没中心节点,是一种动态自适应网络。由于无线传输范围有限,使Ad Ho
体育赛事最大的特点是激情。2008年北京奥运会,我们通过央视荧屏感受到了全世界200多个国家和地区运动员的激情和风采。但是,体育赛事的电视转播仅有激情是不够的,激情必须以
测试数据自动生成是提高软件测试效率和软件可靠性的关键技术,它能够降低手工测试的高额成本,提高测试过程的可信赖度,改变测试人员全凭经验设计测试数据的现状。人们将各种
通州区漷县镇党委推行的“党课通知书”制度,以生动活泼的形式、具体实在的内容,点燃了党员参加党日活动的激情。 Tongzhou District Shexian town party committee to prom
本文从历史和现实的角度分析了当今高等美术教育中素描教学存在的问题,笔者通过教学实践结合当今时代特点阐释了素描写生教学中摄影对于素描教学的影响、素描造型中形体的生