论文部分内容阅读
星载嵌入式计算机长期工作在宇宙空间辐射环境中,各种辐射效应是导致星载计算机在运行期间发生故障的主要原因。各类容错技术,如冗余加固技术、机内故障自诊断技术、系统健康状态管理技术等纷纷被用于星载计算机中以提高系统的可靠性,对于保证整个卫星系统的长寿命准确稳定运行具有重要意义。本文针对星载嵌入式计算机遇到新的可靠性挑战,首先在传统的具有一活动节点一冷备份的两冗余卫星系统的基础上,改进并提出了一种具有三个硬件上完全相同的冗余运算硬件结构的星载计算机设计。这三个硬件上完全相同的运算节点的主次并不固定,而是通过故障检测模块选择出错误概率最低的节点作为主节点。并将相对错误概率高的节点进行冷藏,使其作为冷备份节点。这种三冗余结构与传统的两冗余冷备份系统相比具备更高的系统可靠性。同时,定期自主选举表决的策略也增强了系统稳定性。论文也开发了一套具有一定故障预测能力的故障检测系统,由故障标尺和基于故障树的故障检测系统组成。因为场效应管(metal oxide semiconductor, MOS)器件的阈值在接受了一定量的辐射照射后会发生漂移,且阈值漂移的幅度与接受的辐射总剂量正相关,所以论文利用这一特性,通过测量MOS器件的阈值电压漂移程度,来预测整系统接受到的辐射总剂量,并将辐射总剂量转化为对故障概率的预测。同时,论文使用基于故障树的故障检测方案替代了传统的基于专家系统的故障检测方案。相比传统方案而言,基于故障树的故障检测新方案可以更好地利用原有系统各模块之间的内在逻辑联系,利用故障树推理得到的系统故障概率较使用传统专家系统的方案具有更高的判决正确率。论文中也使用Matlab仿真软件比较了这两种故障检测方法的检测性能,仿真结果表明随着系统逻辑复杂度的增加,新方案具有更高的故障检测率。论文还针对目前星载计算机系统随机存取存储器(random access memory, RAM)模块中发生频率较高的单粒子多位翻转问题,提出采用具有更高纠检错能力的线性循环码来替换传统的汉明码,并在现场可编程门阵列(Field Programmable Gate Array, FPGA)器件中进行编解码算法实现,充分利用了FPGA器件丰富的存储资源,完成编解码算法的快速工程实现。