论文部分内容阅读
信息技术的发展使政府、企业、教育科研、医疗卫生等各部门纷纷在Internet提供的信息服务平台上开展业务。由于Internet缺乏对数据共享和协同问题求解的有效支持,使上述应用领域中的很多信息系统存在资源部门割据、信息分散、数据难于查找、应用系统相互孤立、难以互联互通等问题。 数据网格(Data Grid)面向广域网异构环境,为用户建立分布、异构、海量数据的一体化访问、存储、传输、管理与服务架构,是实现广域网环境下数据共享和协同问题求解的有效途径。数据网格技术可以为政府、企业、教育科研、医疗卫生等领域中的大量数据提供有效管理和共享的途径。 面向上述应用领域的数据网格系统通常表现出如下特点:系统具有P2P结构;网络通信能力有限;各节点的存储能力有限等,我们将这种网络环境称之为“低端计算环境”。在数据网格系统中,复制技术被广泛采用以提高系统性能,缩短数据响应时间并降低网络带宽消耗,复制技术的引入带来了副本管理问题,而副本管理的效率直接影响了系统的性能。目前,副本管理问题是业界广泛关注的热点问题。为了提高运行在“低端计算环境”上的数据网格系统的性能,本文致力于研究适应低端计算环境的数据网格副本管理关键技术。 本文以系统性能、可用性和可扩展性为目标,针对低端数据网格系统的特点,开展低端数据网格系统中副本管理技术的研究。本文的主要贡献在于: 1.提出了NLPR数据网格复制模型,建立了数据网格系统中副本管理各类问题的统一描述,简化了副本管理问题的求解过程;提出了基于服务合成的副本管理服务框架SCRMSA,为面向不同应用领域的数据网格副本管理服务提供了一种开放、透明、灵活的实现方案;在此基础上,提出了数据网格系统管理模型DGRMSM,实现对数据网格副本的透明、可扩展、开放的管理。 2.提出了“存储联盟”的概念,并以此为基础提出了基于存储联盟的双层动态副本创建策略SADDRES,建立了存储联盟间利用缓存建立数据副本、存储联盟内根据用户访问历史合理分布数据的副本创建策略。 3.基于“存储联盟环”的结构,提出了层次式副本定位与选择机制SAHRLSM,主要包括副本目录SARRC、副本定位算法SAHRLM和副本选择算法SAHRSM,并实现了网格节点和存储联盟的动态性管理、副本目录的一致性维护等机制,具有负载均衡、可靠性高以及可扩展性好等优点。 4.为了实现对网格副本的一致性管理并屏蔽不同网格应用的差异,引入了副本一致性管理服务RCMS,为数据网格系统提供了分布、高效、灵活的副本一致性管理机制;基于低端数据网格系统的特点,提出了基于视图和版本的副本一致性管理策略VVRCOMS,该策略采用版本机制对副本进行管理,在保证用户视图一致性的前提下,具有较好的系统性能。