论文部分内容阅读
随着计算机网络的迅速发展,海量数据存储于数据中心中,而且用户量剧增,并发访问量过大,因此分布式存储系统的性能和可靠性将面临巨大的挑战。而副本备份能够提高系统性能,增强系统容错性,是一项保证分布式存储系统可靠性的关键技术。由于这些数据对企业来说很重要,建立容灾备份防止数据遭遇地震、涝灾或火灾等自然灾害破坏,就变的更加至关重要。 在分布式应用系统中,建立容灾备份的关键需求是副本间的一致性。本课题根据副本存放位置的不同将系统分为同数据中心和跨数据中心复制系统两种。在此基础上,分别对这两种系统进行了方案设计,并对同数据中心进行了实现。此方案的目的和意义在于为数据恢复奠定了坚定的基础,同时提高了数据的读取能力。跨数据中心备份解决了因整个地域受到破坏从而导致数据无法恢复的问题。 具体而言,本文在对分布式应用系统分析的基础上,给出了数据应用系统的架构,并主要研究了系统架构中的副本复制,完成了系统的设计与实现。其中副本一致性是整个复制系统的核心内容,在复杂的网络中,如何保证副本间的一致性,是复制系统实现的关键问题,也是副本复制的目标。本论文通过副本备份、数据的同步操作和数据修复来保证副本间的一致性。 针对同数据中心的复制系统,本文实现了数据更新以及节点动态变化时的数据同步操作和数据修复操作,并对系统进行了性能测试,结果显示满足用户的需求。 此外,在跨数据中心的复制系统中,为保证跨数据中心间的副本一致性,数据中心间需要一种可靠的异步通信方式。发布/订阅通信方式可以将实时性要求不高的信息牺牲一定的实时性来换取强大的并发处理能力。本文将发布/订阅通信方式运用于跨数据中心的复制系统中,根据实际需求给出了改进后的发布/订阅通信模型和整个复制系统的模型以及流程图。通过与其他跨数据中心备份方案的比较,得出本复制系统能更好的实现容灾并大大减小通信量从而避免网络拥塞的结论。