论文部分内容阅读
网格技术通过资源整合实现计算资源、存储资源、数据资源、信息资源、知识资源和专家资源等资源的全面共享。网格监控是实现高效、快捷地利用网格资源和完成网格计算任务的前提和基础。网格系统中的资源规模巨大、更新频繁,网格计算任务量大而复杂,因此实现网格资源和任务运行状况的实时准确的监控成为网格监控的主要任务。
本论文通过对网格管理对象——网格资源和任务的监控研究,设计和实现了针对网格资源和任务进行监控的网格监控系统。该系统包括网格资源运行状态监控、网格任务运行状态监控和网格故障检测与告警等功能子系统,实现了网格系统良好的监控、分析和故障检测、告警与管理。系统的特点在于利用JMX架构设计和实现了一套灵活的、通用的、具有可扩展性的网格资源和任务的运行状态监控架构、网格故障检测与告警架构,并开发出多阈值告警、基线告警、实时和历史图形曲线监控等管理方法,设计和实现了基于Web的人性化管理界面,以曲线和图表等多种形式显示网格资源与任务的运行状况。
本课题来源于中国教育科研网格(ChinaGrid)中的华南理工大学高性能网格计算平台的研究。目前该系统已基本完成,并已在华南理工大学高性能网格计算平台内试运行。