论文部分内容阅读
基于超级计算机的大规模并行电磁计算对于解决实际工程中的复杂电磁难题具有重要意义,但超级计算机中由节点故障导致的进程崩溃事件的概率远远高于普通计算机。该文针对传统电磁计算难以有效应对进程崩溃的现状,提出一种高效的、适用于大规模并行高阶矩量法的容错算法。在现有并行高阶矩量法的基础上,基于"硬盘缓存"和"直接内存读取"设计高效率、高可靠性的现场保护算法,同时设计了高效的断点恢复算法。算法的有效性主要在于"固定的现场保护点"这一特点,它使得算法在有故障的情况下仍然可以正常有序地进行;而原算法每次碰到故障,则