基于DHT技术的数据副本散布与模拟研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:wwwdps1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来Internet的飞速发展和网格技术的出现和发展,对存储系统在容量、性能、可靠性、分布性以及可扩展性等方面提出了更高的要求,存储领域的研究也相应出现了新的趋势和发展方向。 在对分布式哈希表(DistributedHashTable,DHT)技术研究的基础上,本文研究的目标主要是针对广域对等环境下,研究数据副本散布策略,以及引入副本散布之后系统的数据定位路由的算法模拟,并且给出了模拟结果分析。这对于构建分布式大规模数据存储系统来讲是重要的基础支持。 本文首先综合当前DHT技术分析了其中涉及的主要问题,包括该环境下数据存储的特点和要求。在此基础上,本文讨论了利用完全的冗余方案——数据副本进行研究DHT环境下的数据可用性和相关性能要求。 Chord作为一种典型的分布式哈希表DHT,至今一直对其进行了不断的优化的研究;并且Chord对于其它DHT来讲具有一定的相通之处。因此,本论文的研究方法是,通过结合Chord对所提出的副本散布策略实现模拟。这样保证了策略对于其它的结构化DHT能够具有一定的通用性。 本文的主要贡献体现在以下几个方面:提出了两种副本散布的策略,分析实现了散布的自维护算法;并且,结合Chord模拟器加以实现分析。通过分析实验模拟的结果,这两种策略具有良好的可用性。 数据副本的散布策略本文给出了两种数据散布策略:直接连续副本散布和全局再哈希副本散布策略。前者将每个节点的所有的数据对象,利用后继列表直接散布在其后继列表的前若干个节点上散布数据副本。副本定位简单,数据分布均匀,较好的达到了系统的负载均衡。而后者对于每个主数据对象的各个副本进行再次哈希,以此确定各个副本的位置。由于副本再次哈希的名称空间和主数据相一致,这样副本分布于整个DHT空间,查找定位的代价和Chord一致。 数据副本散布的模拟实现和分析通过各种实验参数下实验模拟,得到这两种策略的实验结果。这两种策略相比较,在副本查找定位的性能上有一定的相似性。但是在节点的数据散布均衡等方面存在较大差异,有待进一步的优化。 最后在进一步的工作中,需要综合考虑性能和可用性等具体量化的要求,进而优化副本散布的策略。在满足数据可用性的基础上,进一步将提高数据对象访问的性能。
其他文献
随着互联网数据规模的指数级增长,如何有效存储和分析这些数据成为非常有挑战的一个问题。为了应对大数据的挑战,涌现出了各种分布式存储和计算系统。其中分布式非关系型数据
本文首先介绍了移动Ad Hoc网络的基本概念与MPLS技术的基本原理,然后分析了目前研究的现状和所存在的主要问题:现有的MPLS技术缺乏对动态网络拓扑结构的有效支持。在这些研究的
在现代化的教学方法中,E-learning系统发挥着重要的作用。在提供内容丰富、形式灵活多样的教学内容以及规范化的教学过程管理之外,E-learning系统还有一个重要的功能,即:在教师
  本文首先对Web挖掘流程以及Web挖掘分类及各自的研究现状及发展进行一个概括地介绍;然后结合汉语自身的相关特点较为详细地分析了中文文本自动聚类中所涉及到的关键问题及
  本文以实时CORBA2.0规范为参照,研究了华盛顿大学开发的实时CORBA系统—TAO系统,TAO调度服务的调度策略和调度框架;对实时CORBA2.0规范所提出的可分布线程概念以及基于可分
学位
Internet中的路由协议及路由算法一直是Internet研究的一个重点内容,传统的Internet内部网关协议RIP由于其安全性差、支持网络规模有限、收敛速度慢等缺点终将被OSPF协议取代
现在企业随着时间的推移,企业的信息量在不断的增加,企业信息化就成为了研究的重点。制造执行系统(Manufacturing Execution System,MES),是企业信息化的重要组成部分。而企
互联网的高速发展,促使了网络教育等大批应用领域的产生,随着这些应用的不断深入发展,又对网络体系结构提出了更高的要求,如何保证用户所获得的服务质量成为当前研究的热点。
本文针对信息对抗中人员教学训练的需求,基于因素空间和因素神经网络理论建立了入侵检测教学训练系统模型,并进行了系统设计和验证实验。     研究分析了网络行为和有关