论文部分内容阅读
大规模协同计算平台通过对分布的主机进行统一的管理和调度,使不同主机协作完成复杂计算任务,解决了单一主机的性能不足的问题。基于云计算技术搭建的协同计算平台,借助云计算对物理资源的抽象和虚拟化技术,提高了物理资源利用率,降低了平台建设成本。依托云计算技术的协同计算平台具有大规模、可扩展、分布式部署、中心化管理等特征。因此,如何管理和调度平台资源,保证计算任务能够高效、正确的执行则成为了分布式协同平台设计中的首要问题。为此,需要对平台资源使用情况进行实时的掌握,获取不同粒度的监控数据,为资源调度和管理提供强有力的数据支撑。目前,平台资源监控领域已有不少相关研究工作,并形成了相应的软件系统。但是,对协同计算平台而言,目前资源监控系统存在以下问题。首先,在以云计算为基础的协同平台中,无法实现对虚拟机的细粒度监控。其次,为确保协同计算平台的正常运行,不仅需要对平台中(物理/虚拟)资源的使用情况进行监控,更需要对资源的变化情况进行一定的分析,对造成资源变化的原因进行判断,防止恶意用户或软件对资源的非法侵占和消耗。因此,对平台资源的安全态势监控也成为平台资源监控器的重要功能之一。目前已有的资源监控系统仅能提供平台整体或其中物理机的各项资源占用率情况,但是无法对平台、物理机、虚拟机进行安全态势评估。针对以上问题,本文结合已有监控系统,设计并实现了基于云计算的协同计算平台资源监控系统。除实现对集群整体、物理机的资源监控外,该系统能够对物理机中运行的虚拟机以及任务的资源使用情况进行实时监控,且监控指标能够根据用户需求定制,大大延伸了原有系统的监控范围,提高了监控粒度。此外,系统设计中引入安全态势监控模块,引入机器学习技术中的决策树方法,并结合已知的恶意程序占用资源特点,分别对物理机和虚拟机进行安全态势评估。物理机的安全态势评估基于系统资源理论最高占用率进行评估,虚拟机安全态势评估则是根据已知任务类型正常执行时资源占用率进行评估。安全态势监控实现对平台安全威胁的预警,确保系统的可用性和可靠性。本文实现了原型系统,实验结果表明,本文提出的监控系统能够有效地对虚拟机及其任务资源占用情况的实时监控,并提供灵活的监控策略配置。此外,本文提出的基于决策树的安全态势评估方法能够有效对异常资源占用情况进行报警。实验表明,在没有其他程序干扰且已知恶意占用资源应用的特征的情况下,其预测准确度可达82%,为平台安全管理提供了有力的保障。