论文部分内容阅读
【摘 要】通过对计算机系统的硬件冗余容错设计的特点分析及研究,得出冗余容错设计应用;并总结其影响规律。
【关键词】冗余容错设计 故障率 静态冗余系统
0前言
硬件是计算机的基础,硬件容错技术主要是利用多份硬件来实现的,即是利用冗余来实现容错。并且硬件冗余的级别越低,故障率降低的效果越好,但增加了故障检测和电路设计的困难。在实际应用中,最常见的有静态冗余、动态冗余和混合冗余等模式。
1计算机控制系统的硬件冗余容错设计
1.1电路级冗余设计
1. 2静态冗余系统
静态冗余是指冗余结构相对固定,不随发生故障的情况变化而变化的一种冗余形式。静态硬件冗余的工作形式是将发生的故障加以隐蔽,来达到防止故障造成差错的目的。静态冗余的原理就是通过表决的形式来决定掩蔽发生的故障。静态冗余模块是系统运行时必要的组成部分,模块在工作时全部参与运行,即多个模块执行相同的功能,表决器通过多数一致原则输出分析结果以达到隐蔽故障的目的。静态硬件冗余的形式通常是三模冗余。即三个相同的模块接收共同相同的输入并将产生各自的结果,送至表决器。表决器的输出则取决于模块输入结果。即如果有一个模块故障,另两个模块正常,则正常模块的输出可将故障模块的输出屏蔽,以达到防止故障造成差错的目的。
1.3动态冗余系统
动态硬件冗余系统是由若干相同模块共同组成的,以故障检测及系统恢复等方式来达到容错的一种硬件冗余系统。动态硬件冗余系统的特点是系统的冗余结构是随故障情况的变化而发生变化,并且动态硬件冗余系统在规定时间内进行模块重组并恢复正常运行;因此动态硬件冗余系统是允许故障产生差错,但避免差错产生失效。
动态硬件冗余有备份替换和双机比较两种主要工作方式。
1.4混合冗余系统
混合冗余系统的实质就是将静态冗余系统和动态冗余系统结合起来。通常,混合冗余系统由静态冗余的TMR核心模块、备份模块、表决机构等组成,并由切换机构确保静态冗余的TMR核心的完整性,即当TMR核心模块中有一个发生故障,立即以无故障的备份模块取代。
2.计算机控制系统的硬件冗余容错设计分析
在电路级冗余设计中,从上面的结果可以看出,当开路故障率比短路故障率小时,以先串后并结构为好,反之以先并后串结构为好。
静态静态冗余系统中,以三模冗余系统与单模系统可靠度的关系为例。三模表决系统的平均无故障时间是单模系统的5/6,那么,我们把两者的可靠性曲线一起绘于图1。由图可见,当Rt>0.5时,三模系统的可靠度高于单模系统,当R(t)<0.5时,三模表决系统的可靠度反而降低了。因而可得:只有当单模系统的可靠性比较高时,所构成的多模表决系统才能有比单模系统更高的可靠度。
动态冗余系统由于系统恢复使用某种重组技术,,系统的冗余结构将随故障情况发生的变化而变化,因此这种技术不防止故障产生差错,但防止差错产生失效。
在混合冗余系统中,当不一致检测器检测TMR模块中有一个模块的输出结果与表决机构的输出结果不一致时,则系统将该模块切换,并用备份模块予以替换。只要有多数模块输出正确,则表决机构的输出就是正确的。备用模块是TMR模块输出结果不一致时替换TMR模块,直至备用模块全部用完,所以备份模块的数量的越多,混合冗余系统的可靠性也就越高。由上可知,混合冗余系统利用其自身结构有效地使计算机系统运行的可靠性提高,并延长了其无故障运行时间。
3总结
根据上述分析可知,在电路级冗余容错设计中,应根据其短路故障概率及开路故障概率来判断其容错设计型式。静态冗余系统中,只有当单模系统的可靠性比较高时,所构成的多模表决系统才能有比单模系统更高的可靠度。动态冗余系统则需注意其适用范围。混合冗余系统则有较高的无故障运行时间。
参考文献:
[1] 卓兴中. EMP 效应下计算机容错性能测试系统的研究与实现[D]. 哈尔滨: 哈尔滨工业大学硕士论文, 2009:
[2] 周东华,叶银忠著,现代故障诊断与容错控制[M],清华大学出版社,2000
【关键词】冗余容错设计 故障率 静态冗余系统
0前言
硬件是计算机的基础,硬件容错技术主要是利用多份硬件来实现的,即是利用冗余来实现容错。并且硬件冗余的级别越低,故障率降低的效果越好,但增加了故障检测和电路设计的困难。在实际应用中,最常见的有静态冗余、动态冗余和混合冗余等模式。
1计算机控制系统的硬件冗余容错设计
1.1电路级冗余设计
1. 2静态冗余系统
静态冗余是指冗余结构相对固定,不随发生故障的情况变化而变化的一种冗余形式。静态硬件冗余的工作形式是将发生的故障加以隐蔽,来达到防止故障造成差错的目的。静态冗余的原理就是通过表决的形式来决定掩蔽发生的故障。静态冗余模块是系统运行时必要的组成部分,模块在工作时全部参与运行,即多个模块执行相同的功能,表决器通过多数一致原则输出分析结果以达到隐蔽故障的目的。静态硬件冗余的形式通常是三模冗余。即三个相同的模块接收共同相同的输入并将产生各自的结果,送至表决器。表决器的输出则取决于模块输入结果。即如果有一个模块故障,另两个模块正常,则正常模块的输出可将故障模块的输出屏蔽,以达到防止故障造成差错的目的。
1.3动态冗余系统
动态硬件冗余系统是由若干相同模块共同组成的,以故障检测及系统恢复等方式来达到容错的一种硬件冗余系统。动态硬件冗余系统的特点是系统的冗余结构是随故障情况的变化而发生变化,并且动态硬件冗余系统在规定时间内进行模块重组并恢复正常运行;因此动态硬件冗余系统是允许故障产生差错,但避免差错产生失效。
动态硬件冗余有备份替换和双机比较两种主要工作方式。
1.4混合冗余系统
混合冗余系统的实质就是将静态冗余系统和动态冗余系统结合起来。通常,混合冗余系统由静态冗余的TMR核心模块、备份模块、表决机构等组成,并由切换机构确保静态冗余的TMR核心的完整性,即当TMR核心模块中有一个发生故障,立即以无故障的备份模块取代。
2.计算机控制系统的硬件冗余容错设计分析
在电路级冗余设计中,从上面的结果可以看出,当开路故障率比短路故障率小时,以先串后并结构为好,反之以先并后串结构为好。
静态静态冗余系统中,以三模冗余系统与单模系统可靠度的关系为例。三模表决系统的平均无故障时间是单模系统的5/6,那么,我们把两者的可靠性曲线一起绘于图1。由图可见,当Rt>0.5时,三模系统的可靠度高于单模系统,当R(t)<0.5时,三模表决系统的可靠度反而降低了。因而可得:只有当单模系统的可靠性比较高时,所构成的多模表决系统才能有比单模系统更高的可靠度。
动态冗余系统由于系统恢复使用某种重组技术,,系统的冗余结构将随故障情况发生的变化而变化,因此这种技术不防止故障产生差错,但防止差错产生失效。
在混合冗余系统中,当不一致检测器检测TMR模块中有一个模块的输出结果与表决机构的输出结果不一致时,则系统将该模块切换,并用备份模块予以替换。只要有多数模块输出正确,则表决机构的输出就是正确的。备用模块是TMR模块输出结果不一致时替换TMR模块,直至备用模块全部用完,所以备份模块的数量的越多,混合冗余系统的可靠性也就越高。由上可知,混合冗余系统利用其自身结构有效地使计算机系统运行的可靠性提高,并延长了其无故障运行时间。
3总结
根据上述分析可知,在电路级冗余容错设计中,应根据其短路故障概率及开路故障概率来判断其容错设计型式。静态冗余系统中,只有当单模系统的可靠性比较高时,所构成的多模表决系统才能有比单模系统更高的可靠度。动态冗余系统则需注意其适用范围。混合冗余系统则有较高的无故障运行时间。
参考文献:
[1] 卓兴中. EMP 效应下计算机容错性能测试系统的研究与实现[D]. 哈尔滨: 哈尔滨工业大学硕士论文, 2009:
[2] 周东华,叶银忠著,现代故障诊断与容错控制[M],清华大学出版社,2000