论文部分内容阅读
诸如金融股票、交通控制、电力输送与军事指挥系统等负责执行关键任务的计算机系统,通常被称为关键任务计算机系统。这些系统一般存在一个共同特点,即一旦系统崩溃就可能对国民经济、国防安全,甚至对生命财产造成严重的损失。现有的监控系统和可用性增强方法不能发挥关键任务计算机的最大性能,因此,如何利用有限的计算资源,最大限度地提升系统可用性就成为关键任务系统的研究重点。据此,论文面向关键任务计算机,首先提出了适变监控方法,然后以该方法为基础,提出了三种可用性增强方法以及一种可用性预测方法,从而维持关键任务计算机高可用性。计算机系统在低负载的状态下能够保有非常高的可用性,但随着负载的不断升高,系统可用性会持续降低,即容易“忙中出错”。针对该问题,论文提出一种面向关键任务计算机的适变监控方法,能够根据系统的相对可用性,实时调整监控方案,有效降低高负载情况下监控功能对系统造成的影响,提高系统可用性;并为后文的可用性增强方法和可用性预测方法提供数据基础。现有适用于关键任务计算机的资源动态分配方法大多基于阈值,可能会导致资源分配不及时和资源分配不均衡等问题。论文分别针对CPU资源和内存资源,通过结合阈值和计算资源的变化率两个因素,提出了 CPU资源变速分配方法、CPU资源轮转分配方法以及内存资源变速分配方法,实现了资源快速有效地动态分配,解决了资源分配不及时、资源分配不均衡等问题,提高了资源动态分配的效率,从而提高关键任务计算机的可用性。硬件负载是评判关键任务计算机系统可用性的重要指标,系统可用性会随着硬件负载的增加而大幅下降。论文从系统负载的角度出发,提出一种基于支持向量机SVM(Support Vector Machine)的可用性预测方法。首先,引入系统CPU利用率、内存利用率、网络负载率和I/O负载率等因素,进行基于SVM的可用性预测建模;然后,完成SVM的核函数参数寻优;最后,利用历史监测数据进行系统可用性预测,为关键任务计算机的管理和维护提供了有力依据。