论文部分内容阅读
随着硬件和软件技术的飞速发展,分布式系统变得越来越重要,尤其是在需要提供高性能、高可用性和高可扩展性的领域。分布式文件系统是任何分布式操作系统的核心,它通常设计成客户机-服务器模式。文件和目录都被存放在单一服务器中(或服务器群中),服务器向客户机输出可以访问的文件和目录,客户机将已输出的文件安装(mount)在本机的安装点上。当这些操作完成后,客户机上的应用程序就可以使用相同的API接口来访问安装在远程的文件资源。换句话说,就像对待本地文件系统一样对待远程文件系统。在本文的开头,我们首先讨论了分布式系统中的复制机制。分布式系统通常将复制机制作为提高系统性能、增强可用性和容错性的一种措施。通过将数据复制到多台服务器上,使得由于服务器或网络故障导致的对数据的不可访问性就大大降低了。复制机制的引入直接导致了更新传播问题的产生,即需要在多个副本节点之间传播更新信息。在对复制机制中的乐观复制策略作了介绍以后,我们深入的分析了更新传播的策略和算法以及在此基础上的数据协调。最后,我们详细介绍了在DPFS分布式文件系统中使用的一种基于操作的更新传播模块。基于操作的更新传播包含两个阶段。第一个阶段是将更新操作信息传播到目的节点,这一阶段需要确定更新操作的属性数据和目的节点集。第二个阶段是目的节点依据接收到的更新信息,在本地执行还原操作。通过将更新操作传播到目的节点去执行,而不是先在更新起始节点执行完后才将文件数据同步到目的节点的方法,使得原本在更新起始节点的负载部分地转移到了目的节点,平滑了整个系统的负载,避免了可能的在更新期间阻塞来自用户的访问请求。最后,为了验证DPFS分布式文件系统中的基于操作的更新传播模块的有效性及评估其性能,我们从成本模型、通信性能的延迟和带宽、以及对系统负载均衡度影响的变化方面作了大量深入的研究和分析。实验结果证明:基于操作的更新传播模块很好的满足了DPFS文件系统的需求。