论文部分内容阅读
针对持续发展的高性能计算带来的新需求,我们设计与实现了DCJM机群作业管理系统,并使用了多种高可用保障措施。为了验证其有效性,综合使用可靠性框图、故障树和随机Petri网等工具对DCJM建模,然后基于实际测量的参数,使用统一的模型求解,对系统可用性进行了完整的评价。分析结果显示DCJM系统达到了高可用性。