网构软件系统的故障检测与诊断研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:jttzw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了适应开放、动态和多变的Internet环境,网构软件成为了旨在实现网络环境下计算资源共享和集成的一种新型软件形态。在网构软件开放协同模型中,软件系统的各软件实体以软件服务的形式存在于网络节点之上,通过独立的集成机制实现协同。由于各软件服务的分散交互所带来的复杂性导致了系统可靠性和可用性的降低,因此针对网构软件系统存在的故障隐患,如何实现软件服务运行过程的故障检测与定位,以支持后续的故障恢复过程,从而提高系统的自治愈能力成为近年来的重要研究问题。本文主要围绕软件服务的故障检测与诊断问题,分别针对服务行为模型的构建、基于模型的故障检测与诊断、故障路径检测与定位、基于日志分析的故障诊断等方面进行了研究。其中主要工作和创新性贡献如下:   1.提出了基于动态描述逻辑(DDL)的故障检测与诊断方法。该方法根据服务流描述利用DDL为流程行为建模,并将服务流运行信息转化为DDL公式序列的表示形式,继而在DDL逻辑推理基础上执行相应的故障检测与诊断算法,通过诊断推理返回故障相关信息。为了提高实时诊断的效率,进一步给出了基于DDL的增量式诊断算法。   2.提出了基于扩展有限状态自动机(EFSM)的分布式故障路径检测与定位方法。利用EFSM在细粒度层次上为服务系统中各构件服务建立行为模型,根据监测到的运行事件序列,检测和定位各构件服务行为模型中的执行路径,当检测到故障发生时,利用变迁同步操作对局部路径进行聚合以获得系统全局故障路径,相应的故障路径信息可为后续的故障恢复过程提供支持。   3.提出了一种基于融合贝叶斯网(CBN)的故障诊断方法。该方法解决了满足同分布假设的异构日志数据的学习和分析问题,首先根据估算得到的不同日志文件结构元素的相似度构建CBN模型的基本结构,然后利用基于相似性的贝叶斯学习算法计算CBN中的概率,最后根据所构建的CBN模型得到测试日志数据对应的可能故障的极大后验假设,从而实现了基于异构日志分析的故障诊断。   4.提出了动态环境下基于可变窗口的故障诊断方法。针对动态变化的数据集,在时间窗口基础上采用增量式方法实时更新CBN模型,考虑到时间窗口设置的不合理将会导致更新效率的降低,提出了基于更新代价对时间窗口进行动态设置,并给出了基于可变窗口的CBN模型动态更新算法,在此基础上利用实时更新的CBN模型对测试日志数据进行分类,有效地提高了动态环境下诊断结果的准确率。   上述工作分别从理论和应用角度对网构软件系统的故障检测与诊断问题进行了深入研究。为了实现高效的故障检测与诊断,本文借鉴逻辑推理和机器学习的相关方法和技术,提出了网构软件自治管理器eHealer系统的设计与实现方案,重点针对eHealer的故障检测与诊断功能,给出了基于模型诊断模块和基于知识诊断模块的结构设计与功能实现。在此基础上,实现了可视化的故障管理子系统,为用户提供了一个可视化的故障检测和诊断工具,以辅助用户实时发现和恢复被监控对象服务系统的运行故障。
其他文献
相较于传统的基于口令或令牌的身份认证方式,以指纹为代表的生物特征以其唯一性、便捷性和可靠性,正在逐渐成为未来身份认证的主流手段。但是,近年来随着研究与应用的深入,人们发
随着移动通信技术的迅猛发展,在不同的网络接口在同一台设备上接入一个以上的通信网络成为现实,多条路径上同时传输数据(CMT)的服务能够充分利用网络资源,提高大带宽、时延抖动
稳态强磁场实验装置作为“十一五”国家重大科技基础设施项目,旨在为我国多学科前沿发展提供理想的稳态强磁场极端实验条件。中央控制系统是稳态强磁场实验装置的关键系统,是
硅后时延通路,即时速路径,是制约实际电路最高工作频率的关键路径。而针对时速路径特点及其故障分析、测试等方面的研究,对高性能集成电路的设计和制造均具有重要意义。目前工程
语义Web是当前Web的本质变革,旨在通过本体精确定义Web信息共享词汇的语义,建立数据层面的链接(a Web of data),更好地支持信息共享与Web应用。描述逻辑在其中扮演着重要角色:它
随着VoIP(Voice over IP)逐渐普及,VoIP的安全性已经成为一个重要问题,其中垃圾语音(SPIT,Spam over Internet Telephony)很可能成为进行商品推销、市场调研、骚扰甚至诈骗的工
数据访问延时是影响系统性能的关键因素之一。在MapReduce环境中,由于输入数据远大于处理代码,不在数据节点执行的Map任务将会引起大量的远程数据访问延时;由于Map任务分布在成
随着嵌入式系统的发展,嵌入式SOC芯片以其高集成度和快速定制等特点在工业控制、消费电子等领域获得了迅速的发展。而显示系统作为SOC芯片的重要组成部分,由于其图像显示需要不
近年来,伴随着各种应用日新月异的发展,人们对集群文件系统提出了更全面更多样化的需求。文件的小粒度I/O请求的性能对于集群文件系统的整体性能有着越来越重要的影响,应用迫切
人体动作的表示与识别是近年来在计算机视觉和模式识别领域被广为研究的一个问题,其在智能视频监控、智能人机交互接口以及多媒体检索等领域中都具有巨大的潜在应用价值。本文