并行复算相关论文
软件中出现故障,是不可避免的,软件容错日益显得重要。OpenMP程序中的并行执行段出现故障,可以使用并行复算的方法去恢复。实现并......
Checkpointing是高性能计算领域最常用的容错技术。但是,当处理器数目变大时,这种技术的性能迅速恶化。提出一种在并行计算中容忍单......
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提......
OpenMP程序通过做检查点来实现容错,现有检查点方法未考虑活跃变量的语义,通过原始值拷贝来保存活跃变量,存在检查点保存量过大的......