论文部分内容阅读
随着高性能应用需求的迅猛发展,需要借助网格计算技术,将地理上分布、系统异构的多种计算资源通过高速网络连接起来,共同解决大型应用问题。目前网格计算正从基础理论研究阶段逐步走向应用开发阶段。网格监控通过对网格计算系统的监控管理,为网格中间件提供必要的与资源有关的性能数据,为网格系统的性能调优和故障发现提供重要依据,在网格计算的实施和推广中起着重要作用。
本文主要研究和开发适应网格管理需求,具有良好可扩展性、灵活性和可伸缩性的层次式网格监控系统。 论文完成的主要工作包括:
(1)提出了一个灵活、可扩展的层次式网格监控管理框架,可以通过创建域并为每一个域配置管理者,从而适应不同的网格管理规模需求;
(2)设计并实现了网格监控管理的容错机制,通过备用管理节点的自动选择和实时在线启动,可最大程度地减少单点故障造成的影响,提高系统的可靠性;
(3)开发了高效的数据采集代理,减轻监控系统对被监控系统资源的消耗,同时增强对数据采集代理的状态控制,进一步完善网格管理的功能。
系统是基于JMX管理体系结构而实现的,在容错性、层次式管理、可扩展性、人性化页面、采集代理性能优化等方面进行了有益的研究和实践尝试。系统的试运行和测试表明系统达到了设计目标的要求。
论文工作得到教育部重大项目中国教育科研网格ChinaGrid项目和广州市科技局项目“IPv6高速信息网的运行监测和管理技术研究”的支持。