论文部分内容阅读
基于对等技术的广域网存储系统,可以满足当前众多新兴应用对存储系统可靠性、可用性及可伸缩性的需求,是现阶段及未来存储技术发展的一个主要方向。与传统的基于DAS、NAS或SAN等技术的存储系统不同,广域网存储系统通过使用对等技术,在上层应用与底层存储设备之间加入了一个功能丰富的中间层,而且对用户来说这些功能都是透明的,因而使存储系统呈现出智能化的特征。副本管理是构建广域网存储系统的核心技术,它直接影响着存储系统中数据的可靠性、可用性及访问效率,甚至关系到整个存储系统的成败,因而十分必要对副本管理进行详细深入的研究。
广域网存储系统的副本管理分为副本定位与路由、副本一致性保持与副本散布三个部分。其中,副本定位与路由是副本一致性保持与副本散布的基础,而副本一致性保持又是副本散布的基础,这三者之间联系紧密,相互影响,缺一不可。本论文的研究工作主要集中在这三个方面。
文章按照功能对广域网存储系统进行了层次结构划分,详细说明了各层研究的主要问题及当前研究进展,并深入讨论了副本管理在其中所起的作用,而后在此基础上提出了一种通用的副本访问模型,并一直围绕该访问模型进行讨论。
首先,针对副本定位与路由问题。提出了一种适应于节点异构性及系统规模动态变化的基于前缀匹配的路由算法ROL。当系统规模较大,且节点动态性很高时,ROL算法通过在每个子节点保存少量的路由信息,有效的降低了节点负载,与其它路由算法不同的是,ROL算法可根据节点的能力的不同动态扩展路由表的大小,从而可以更有效的利用节点的资源。当系统规模较小,且节点动态性不高时,ROL算法通过在每个子节点保存到系统所有节点的路由信息,极大的提高了数据查询效率,当节点动态加入或离开系统时,它借助于一个新颖的低代价事件通知机制,将通知消息发送到所有节点,保证了各节点路由信息的正确性,与其它的类似路由算法相比,ROL算法在获得相同的数据查询效率的同时,极大的减轻了对网络带宽的占用,因而更适合于实际应用。进一步,针对ROL算法使用过程中逻辑拓扑距离与底层实际物理网络距离相脱节的问题,提出了路由表项的概率选择算法,更进一步提高了算法性能。模拟实验表明ROL算法可以有效的适应节点异构化的特征,具有明显的性能优势,因而具有很高的实际应用价值。其次,针对副本一致性保持问题。从理论上分析了副本达到一致的条件,并对基于乐观复制技术的会话一致性进行了详细研究,提出了基于会话的副本-致性保持原理。在此基础上提出了保持广域网存储系统副本一致性的HDR算法,详细讨论了HDR算法的操作定序、事务控制与并发更新机制。HDR算法融合了传统悲观复制技术与乐观复制技术的优点,实验表明,HDR算法具有较低的操作拒绝率与较优的操作响应时间,完全可以满足实际应用的需求。
最后,针对副本散布问题。首先提出了保证副本可靠性的副本数量选择与维护算法。然后,通过使用经济学中的纯策略纳什均衡理论对副本位置散布问题进行了研究,在节点存储空间有限及数据对象大小不同的情况下证明了纯策略纳什均衡的存在性,并在此基础上提出了构建副本散布纯策略纳什均衡状态的TPNE算法,进一步对TPNE算法的运行效果及收敛性进行了分析,并针对实际应用中可能出现的副本散布振荡问题提出了基于TPNE-Area的解决方法。实验表明,TPNE算法执行效率极大的优于单纯的GP算法,因而可以有效的提高数据的可靠性、可用性及访问效率,且算法完全分布式,实现简单,易于实际应用。