论文部分内容阅读
应用于金融、电信等关键领域的高端容错计算机不同于普通的事务处理服务器,它既要具有较高的事务处理性能,又要具有极高的可用性。否则,这些系统一旦发生失效则会引发灾难性的后果。因此,对高端容错计算机系统的可用性评价显得尤为重要。本文拟开发一个计算机可用性建模与评估工具,通过评测目标系统的可用性、可运行性等相关指标,为高端容错计算机的评估与测量提供支持。本文对国内外可用性评测的现状以及现有的可用性分析工具进行了深入的调研,并针对传统评测体系中将容错能力指标与系统性能指标相分离、评测指标过于单一等问题,设计了符合高端容错计算机可用性测试需求的评测指标及其测试流程。并据此开发了一个计算机可用性建模与评估工具,以实现对系统可用性、可运行性、部件MTBF(Mean Time Between Failure)的阈值与实测值等多种评测指标的测试与分析。依据以上不同种类的测试需求,将其分成了以下七个功能模块。主控模块是本文工具的控制台,负责其他功能模块的调度执行,提供数据库访问接口与用户图形界面。系统近似RBD(Reliability Block Diagram)绘制模块在用户界面依次绘制功能子系统框图、描述系统冗余策略、自动绘制系统近似RBD。系统可用性分析模块采用基于组合模型和基于Petri网两种方法分析各功能子系统及全系统的可用性。部件失效敏感度分析模块分析指定部件失效率变化对系统可用性的影响,给出部件失效敏感度分析图表。负载强度敏感度分析模块分析不同级别的负载强度对系统可用性的影响,绘制负载强度敏感度曲线。部件MTBF值分析模块由两个子模块构成,分别分析指定部件MTBF的阈值与实测值。系统可运行性分析模块分析目标系统处于正常、降级、不可用三种状态模式下的平均处理性能与对应的稳态概率,由此进一步分析系统可运行性,绘制目标系统性能-时间曲线。最后,本文对HP公司生产的Superdome以及一台在研的HEFT系统两台高端容错计算机系统的可用性等评测指标进行评估,并对实验结果进行详细的对比分析,依此为HEFT系统样机的改进提供了一些参考意见。以上实验也充分说明了本文工具已基本满足高端容错计算机可用性评测的需求。