论文部分内容阅读
由于芯片密度和时钟速率的增加,瞬时故障影响程序的正确执行,使处理器变得越来越脆弱.因此,对于现在的计算机系统容错技术变得越来越重要.目前两个主要的容错方法是:1)改进系统可靠性通过检测瞬时故障.2)降低性能开销.基于以上的研究方法,我们提出了一种"函数级可配置容错"(FLCOFT)方法,对应用程序既有较高的可靠性又有较低的性能开销.该方法的基本原则是以函数为单位进行可配置容错,以线性汇编代码级别为基础,通过故障注入和静态分析方法来分类出重要指令,进而计算出该指令所在函数的脆弱性指数,基于用户提供的可容忍的性能开销,选择多个重要函数进行保护,从而提高程序的可靠性.故障注入结果显示该方法使得程序的可靠性提升了41%.性能试验结果显示我们的函数级可配置容错技术导致一个重要的性能开销降低对比于指令复制.