论文部分内容阅读
随着电子信息技术迅猛发展,数据存储逐渐成为计算机科学技术研究的重要领域。许多大规模科学、工程应用和商业计算领域都依赖于分布在不同地理区域的海量存储资源。同时,存储资源的高速增长对存储系统的可靠性和扩展性也提出了挑战,信息资源的共享也显得越来越重要。广域分布式存储系统GDSS Plus(Global Distributed Storage System Plus)通过为广域范围的存储资源提供统一的管理,实现了一个广域网范围内的高度数据共享、高性能,可扩展的存储系统。保证存储系统的可靠性,可用性,提高存储系统的负载平衡是分布式存储系统面临的关键问题。广域网的高延迟限制了用户对分散数据的快速访问。分布式存储系统的用户在地理上是广泛分布的,他们要访问的数据可能是PetaByte级的数量,而且分布在不同地理位置上,对有些应用而言,用户不会同时访问同一数据文件。分布式存储系统的副本管理技术在异构的存储系统之间动态地进行数据复制,减少了数据的移动距离,降低了用户对远端数据的访问延迟和网络带宽消耗,改善系统的负载平衡和系统的整体性能,提高了存储系统的有效性。GDSS副本管理设计了一种基于存储代理性能特征和用户特征的动态副本管理模型。该模型包括信息监控器、数据传输器、动态副本管理器等部分。系统结合了虚拟组织和排队论的基本思想,衡量副本访问代价和副本创建价值并以此作为创建副本的依据的副本创建模型。详细介绍了基于虚拟组织的域内副本创建算法和域间副本创建算法。在副本更新时,系统采用基于版本的异步副本更新算法。该算法通过记录文件的更新状态,采用Master-slave方式,根据虚拟组织的层次结构来进行更新的传递,保证了数据更新的一致性和可靠性,提高了更新的效率。在调度用户请求时,系统采用了静态选择策略与动态选择策略相结合方法进行虚拟组织域间副本选择调度,并利用排队论的思想进行虚拟组织域内副本选择调度。经过模拟测试,“GDSS分布式存储系统中的动态副本管理”中采用的副本管理模型能减少用户的访问延迟和网络带宽消耗,改善系统的负载平衡和系统的整体性能.