论文部分内容阅读
数据网格是网格领域中并行和分布处理技术的一个发展方向,其目标是实现对地理上广泛分布的大量异构数据资源进行共享,其中副本管理是数据网格中一个重要的组成部分。良好的数据副本管理技术可以减轻单个数据网格结点的通信和访问压力,降低远程访问该数据的网络延迟及带宽消耗、可以提高网络的负载均衡,同时能够提高数据的安全性、可靠性以及系统的容错性等。良好的数据副本管理策略也是提高数据网格服务质量(Qos)的一个重要方面。本文以国家自然基金课题“基于因特网的教育资源网格模型及服务理论研究”为背景,在分析了数据网格副本管理关键技术的现状的基础上,总结了目前数据网格副本管理技术中的不足之处,分析了基于因特网的数据网格模型,较深入探讨了数据网格副本管理关键技术,并对相应的关键技术提出了改进策略。在前人的工作基础上,本文的主要研究工作及创新如下:(1)本文首先介绍了数据网格的概念、研究背景、研究现状和意义,分析了目前数据网格存在的问题和不足之处,着重讨论了副本管理问题。(2)分析了基于因特网的数据网格的模型(存储子域),在该模型基础上采用GLOBUS工具构建了该网格模型;(3)在上述网格模型基础上,提出了域内和域间副本创建策略。通过该域内和域间双层副本创建算法,使得每个数据资源都能够合理地产生副本,将GLOBUS中的关键技术应用到本策略中,提高了用户的访问效率、提高系统性能;(4)在存储子域模型基础上,提出了副本定位算法RLBOG,采用GLOBUS工具中的Giggle框架,给出了副本定位层次结构,采用RLBOG算法提高了副本定位效率,使网格的整体性能得到了提高。(5)对于数据网格环境提出的策略,需要模拟验证其正确性及性能。本文分析了目前较为常用的网格仿真工具。通过对模拟工具OptorSim的改进和扩充,模拟实现了本文的副本创建策略,得到了一些试验数据。通过与其他策略的比较,得知本文提出的策略是可行的,能够改善数据网格的整体性能。