论文部分内容阅读
网格是一种无缝的、集成的资源共享和协作环境,它将网络上分散的各种计算机、存储设备、科学仪器等连接在一起,整合成一台巨大的虚拟超级计算机,以实现计算资源、存储资源、数据资源、知识资源和专家资源的共享。网格的规模一般都比较庞大,其本质是分布、异构和动态的,它实现了在动态变化的虚拟组织之间共享资源和协同工作,并且提供了可靠的服务质量。数据网格主要面向数据密集型应用,是网格技术的重要分支。通过网格的基础设施,数据网格连接了分布在不同地理位置的网络节点。数据网格的目标是建立异构分布环境下海量数据的一体化存储、管理、访问和传输,并建立相关服务的架构和环境,以有效地实现数据和资源的共享。数据复制技术是数据网格的一个关键技术,其目标是获得更好的数据访问性能。它通过在恰当的网络节点上放置数据副本,来为用户应用提供能够快速访问和处理的局部数据拷贝,从而避免了大量数据的远程传输,减少了访问延迟和带宽消耗,并有利于提高系统的可靠性。本文分析了数据网格的研究现状,总结了目前复制技术的不足之处。在此基础上,根据教育资源网格的具体情况,构造了域间和域内的副本目录模型,并提出了一种较好的动态复制策略。具体来说,本文所做的主要工作和创新点包括:1.通过查阅较多的文献和资料,比较了当前使用广泛的多种数据复制策略,总结了目前复制管理中的不足之处,并简单分析了改进的方法。2.根据教育网格的特点建立了合理的副本目录模型。模型中,将网格节点划分了多个域,并统一了节点的名字空间。模型中使用中心目录和中间目录结合的双层目录,并讨论了如何进行副本定位和一致性维护。3.每个域的中心节点采用P2P的方式联系在一起,这样每个域中心节点所管理的节点较少,并可以有效地改善单点失效带来的问题。在单个域内采用轻量目录访问协议LDAP作为访问目录信息的协议,并采用树和环相结合的混合拓扑结构,减少了域中心节点的负担,并能提高目录信息检索和数据传输的效率。4.严格定义了网格节点的负载,设计了一种基于负载的动态复制策略。该策略主要讨论了副本的创建和选择,并使用了副本替换策略来控制副本数目。通过使用该策略,可以精确地将副本放置在负载过重的节点上,而且具有较强的动态性,能够适应数据请求的动态变化;此外,副本选择策略可以提高数据请求的响应速度和传输速度。5.比较了常见的网格模拟器,分析了使用OptorSim模拟器的原因,并对文中的复制策略进行了模拟,以验证其正确性和性能。实验结果表明,本文提出的算法和策略是可行的,并且可以提高系统的数据传输速度。