论文部分内容阅读
目前,互联网已经从以传统通信服务为主转变成为支持各种新型应用的网络平台。这些新型应用都是利用对等(P2P)网络技术构建覆盖网络,从而能够保证高效快捷的网络的路由定位,提供高扩展和高性能的应用服务。由于数据存储作为这些新型应用的基础,在动态开放网络环境下保证数据的持久可用存储,这是一项富有挑战性的研究课题。
数据冗余是P2P应用系统中实现数据持久可用存储的关键技术,这涉及到数据冗余方法的选择、布局以及维护等多个方面。然而,现有的数据冗余存储机制相对简单,对动态网络环境适应性差,这亟需对动态P2P网络下存储冗余数据的动态模型进行研究,进一步发展和完善数据冗余的布局组织机制。
本文以保证动态对等网络中的数据持久可用性为目标,研究数据冗余存储的动态模型和数据冗余的组织管理机制。在理解网络节点的动态行为特征的基础上,建立冗余数据存在的模型,给出了减少网络扰动对数据存储的影响的方法,提出了冗余数据分布方案和维护策略,并且通过实际系统的日志数据进行试验评价。
本文的主要贡献包括以下方面:
(1)建模和评价网络扰动对复制数据存在期的影响
由于节点失效会直接导致数据丢失,本文首先引入了在节点失效扰动下冗余数据的存在期模型。然后,针对不同的节点存在期的分布,研究节点加入扰动对冗余数据的存在期的影响;指出当节点存在期服从Pareto和Weibull分布时,节点加入扰动将对数据的存在期产生负面影响;通过利用两个实际的日志数据进行试验,量化地分析了节点加入扰动的负面影响。最后,提出了对新加入节点设置节点的考察期的方法,量化评价了该方法能够降低节点加入扰动的负面影响。
(2)基于网络测量的数据存在过程的建模与维护
根据当前普遍采用的网络节点可用性测量采样方法,本文利用节点动态变化的概率特征,建立了分片冗余系统的变化过程的随机模型,通过实际日志和合成日志数据进行仿真验证该模型;同时,提出了一种新的冗余数据的维护方法,该方法利用网络采样的节点状态转移概率进行数据维护,通过仿真试验,说明了该维护方法能够有效提升数据的可用性。
(3)冗余数据存在的一般形式化模型与分析
数据冗余对象独立地选择各个节点进行存储,本文将每个节点视作一般的交错马尔可夫更新过程(MRP),建立由此多个MRP合成的冗余数据存在的一般化模型,分析了冗余系统在稳定后数据可用性的特征;同时,不管各个节点是否相关,在理论上分析了冗余数据的平均存在期的上界。
(4)一种分层混合的冗余数据方案与评价
利用纠删编码和复制两种数据冗余方法,提出了一种分层混合冗余数据的分布策略,分析了这种混合冗余策略在结构化P2P系统中的相关协议,同时给出数据存储应用的原型的结构和访问的接口。通过实际日志驱动试验仿真,论证了该混合冗余策略能够有效地屏蔽系统扰动,提高了数据可用性。