论文部分内容阅读
分布式测控系统在航空航天、军事、铁路、石油、化工、电力等高可靠性要求的行业得到了广泛应用。在分布式处理能力日益提高的同时,人们对系统安全性、可靠性等方面也提出了更高的要求。如何提高分布式测控系统的容错能力成为当前理论和应用研究的热点问题。针对具有高可靠性要求的分布式测控系统,本文围绕如何提高其容错能力展开研究,重点研究了分布式测控系统中节点故障的检测与定位、冗余架构下分布式系统时钟同步以及容错系统的性能评估等关键技术。本文具体的研究内容如下:1、分布式测控系统故障检测与定位技术研究。针对分布式测控系统,提出了一种自顶向下的节点故障检测与定位技术。首先采用基于先验知识的加权模糊Petri网对系统故障进行粗定位,再通过分级多模心跳检测方法进行故障节点的精确定位,最后结合基于阈值的故障类型判别技术设计了容错策略。具体包括:1)基于融入先验知识的加权模糊Petri网进行故障节点粗定位,可避免检测的盲目性,提高检测速度。此外,为提高权值训练速度和模型输出的预测精度,减小训练精度对样本量的依赖,提出了一种基于最小二乘法求解模糊产生式与规则的权系数训练算法。2)为提高分布式测控系统节点故障检测的准确性和高效性,同时降低因故障检测而额外增加的通信开销,提出了分级多模心跳检测方法。采用PUSH模式与PULL模式相结合的检测方法,降低了系统的误判率;基于分级检测机制,将心跳信息融入系统周期性通信数据的方法,减少了用于故障检测的通信数据包,保证了容错测控系统对实时性的要求。3)针对瞬时故障、间歇故障和永久故障等类型的故障对分布式测控系统影响的差别,结合基于阈值的故障类型判别技术设计了一种分布式系统容错策略,该策略减少了系统对瞬时故障的误动作,提高了系统的执行效率与准确性。2、分布式冗余容错系统的时钟同步方法研究。针对分布式冗余容错系统的特点,提出了分层式时钟同步方法。首先采用收敛函数式同步策略实现冗余通道间特定节点的时钟同步,通道内的其它节点再以本通道特定节点为基准采用主从式的时钟同步策略完成系统的时钟同步。这种分层式时钟同步方法的通信开销较小,因此特别适用于对时钟同步的通信开销要求严格、网络传输时延较大的分布式容错系统。3、分布式测控系统的可靠性评估方法研究。研究了基于不同模型的分布式测控系统的可靠性评估方法,并针对分布式测控系统的特点,分别设计了基于Markov链和随机Petri网对分布式测控系统进行可靠性评估的模型。此外,本文还分析了两种评估模型的优缺点、联系及适用范围。4、汽轮机危急遮断系统(ETS)的容错设计。为验证以上研究成果在典型的分布式测控系统中的性能表现,本文以汽轮机危急遮断系统为应用对象,采用自顶向下的故障检测与定位技术,加以冗余通道间以及通道内部分别进行时钟同步的分层式同步方法实现了三模冗余的汽轮机危急遮断系统的容错设计。研究结果表明,本文提出的上述方法能较好的解决汽轮机危急遮断系统中的故障检测以及同步问题,在特定的元器件失效率情况下,该系统可以实现长时间的高可靠度运行。