论文部分内容阅读
容错是实现高可靠计算机系统的有效手段,作为容错技术的重要方面,软件容错为提高系统可靠性提供了灵活有效的方法。星载计算机系统运行于复杂多变的空间环境中,具有强实时性和高可靠性要求,在软件层面为其提供高效灵活可配置的容错机制是星载计算机系统可靠性研究的一个重要领域。
考虑到空间环境的特点和星载计算机系统的需求,本文采用层次化的方式设计整个软件容错系统,系统自上而下分为用户层、服务层和内核层。用户容错层面向高级用户,由用户任务自身提供容错机制;服务容错层考虑的是充分利用已有的软件容错技术,对其进行适应性改造后以API的形式向上层提供容错策略接口;内核容错层则从操作系统内核的角度使用“双核”技术对系统进行容错,在保证系统实时性的同时提高系统可靠性。三个容错层次中,内核容错层是本文论及的软件容错系统的核心,内核级容错技术也是系统中软件容错技术研究的重点,其研究内容主要包括如下两个方面:一是探测系统的硬件永久性故障,通过降级重组的方式屏蔽永久性故障对系统的影响;二是保证系统实时性的同时提高系统可靠性,采用双核的形式屏蔽暂态故障对系统的影响。
最后,为了说明本文所提出的软件容错技术的有效性,文章从实验和理论两方面分别验证了整个容错系统的有效性:在实验测试方面,给出了系统在不同容错状态下实时性和可靠性的变化情况;在理论验证方面,给出了系统的确定有穷状态自动机模型。