论文部分内容阅读
针对分布式仿真的需求,在网格的基础上构建了通用的分布式仿真容错系统.该系统由三部分组成:仿真资源状态监控模块、数据保存模块及错误恢复模块.其中仿真资源状态监控基于网格的MDS实现;数据保存(包括进程空间、进程间交互关系的保存)及错误恢复基于检查点机制在用户空间实现.就所增加的容错机制跟仿真系统原有功能模块的关系进行了分析.最后,基于网格及上述容错模块设计并实现了一个C/S模式的容错代理,用来实现仿真系统的自动容错.