论文部分内容阅读
研究了故障检测算法的发展历史、衡量指标,分析了典型的故障检测算法的优缺点。为了提高故障检测的服务质量,提出了一种基于Pull 模型的适应性故障主动检测模型,该模型根据主机性能监控指标,根据不同应用设定不同判定阈值,由检测机器主动发起检测,从而节约网络数据流量,降低网络负载。算法设计通过给检测消息添加id和时间戳,降低了网络状况对采样值的影响。实验分析利用计算采样值的相关频率,得出故障预测概率,并且针对满足Fail-Stop 故障模型的Crash-Recovery 系统,给出了性能分析结果。经分析与证明,该模型与算法满足最终完美检测器属性。实验评估结果表明该算法在具有消息延迟与数据丢失的大规模环境下,也能达到较好的检测质量。