云服务分层故障检测机制的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:pdscyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高云服务的可靠性,目前学术界和工业界已经给出了一些解决方案。这些方案的基本流程是先检测故障,然后再恢复故障。然而由于传统的故障检测器采用了端到端的超时机制,导致检测故障的时间往往会超过恢复故障的时间,故障检测已经成为影响云服务容错性能的瓶颈;除此之外,传统的故障检测技术一般都是考虑小规模的一对一检测模型,而在云环境下则需要对整个数据中心的状态有一个全局性的视图,因此必须支持大规模的计算系统,对故障检测器的扩展性也提出了较高的要求;最后很多高可用服务都需要跨云部署,所以不同云环境之间的故障检测也是一个值得研究的问题。  基于分层的故障检测系统FDKeeper(Failure Detection Keeper),具有快速检测、高扩展性和开放性等特点。为了解决故障检测技术成为影响云服务容错性能瓶颈的问题,FDKeeper设计并实现了基于分层的故障检测机制,通过精细的分层,故障检测器可以充分利用每一层内部的信息,基于内部信息能够加快故障检测速度,增大故障检测准确性,减小误报噪声,提供详细的故障信息;为了支持大规模的计算系统,使故障检测器具有较高的扩展性,FDKeeper采用类似ZooKeeper的集群架构,具有较高的扩展性,能够支持大规模的计算系统,并设计了一种基于层次的故障管理模型,能够支持超大规模的计算系统;为了实现不同云环境的互相检测,FDKeeper设计并实现了开放的CDP(Cloud Detection Protocol)云服务故障检测协议,支持不同云环境之间的故障检测。  实验结果表明,FDKeeper的应用层/内核层故障检测时间小于600ms,虚拟机管理器/物理层故障检测时间小于2s,误报噪声小于0.27次/年,性能开销小于1%,各项指标均比现有的故障检测系统好,同时能够详细生成每层的故障描述信息,为故障恢复提供支持;在扩展性方面,实验结果表明,FDKeeper能够保证用于故障检测的节点与计算系统的规模呈线性关系,增长因子小于0.001。
其他文献
Peer to Peer(P2P)技术是近年兴起的一种新的网络模型。和传统的C/S模式的网络模型相比,P2P网络能够很好地实现计算机资源和服务的共享,提高资源和服务的利用率,有利于资源和服务
在过去的二十年里,VME总线被广泛的应用于全球的工业、商业及军用嵌入式计算机,主要包括交通控制系统、武器控制系统、电信交换系统、数据捕获、视频成像和机器人等领域。但
电子商务正作为一种新型的商务模式在全球范围内迅猛地发展。然而,从整个电子商务域来看,一些小的企业因为资源不足导致电子商务活动长时间停滞不前,而一些实力雄厚的大企业
随着信息时代数据的爆炸性增长,传统的以太网络与存储网络相分离的网络架构需要服务器拥有以太网卡和光纤通道适配器来连接各自的网络,给数据中心布线、扩容以及功耗管理带来了
在现代数据中心往往需要配置上万存储节点。在此大规模环境下,节点失效将成为常态,因此需要采用数据冗余技术来保证数据的可靠性。在传统模式下,往往采用多副本技术以保障数据可
自动文本分类技术是内容管理研究的热点之一。大部分内容管理系统中的类别层次都对应一定的分类法(例如yahoo)或者存在一个预定义的具有类似于树型结构的分类体系,这就要求在
人脸检测指在图象或图象序列中找出单个或多个人脸的位置和大小,是计算机视觉和人工智能领域一个非常重要的研究方向。现有的人脸检测方法对复杂光照环境下获得的彩色人脸图
随着在线数据的快速增长,传统的服务器成为网络服务的瓶颈。网格技术在高性能的存储技术领域发挥着巨大的作用。然而,Data Grid的面向广域网的数据管理解决方案还是无法满足
数字水印是近年来发展起来的数字媒体版权保护的一种新技术,目前已成为多媒体信息安全研究领域的热点。本文介绍了数字水印技术的基本框架、分类及特性,从空域和变换域的角度
科学计算可视化具有多方面的重要意义,基于轮廓线的可视化是科学计算可视化中的一种常用方法。项目《三维肿瘤概率映射辅助前列腺活组织穿刺取样方法研究》需要从经直肠超声