论文部分内容阅读
选举算法和分布式异构数据库同步技术是分布式多维联机数据分析(On-Line Analytical Processing,OLAP)系统中的研究重点。选举算法能够保证系统在协调者崩溃的情况下,快速选举出新的协调者,维持集群正常服务,保证系统稳定运行。同时,分布式异构数据库同步技术为OLAP分析的有效性提供了可靠的基础数据。 论文的主要工作分为两部分:研究一种适合分布式OLAP系统的选举算法和提出一种分布式OLAP系统环境下的分布式异构数据库同步模型。具体工作如下: 1)深入研究分布式 OLAP系统特点,分析其资源占用特点和数据同步特点。为选举算法的提出和数据同步模型设计提供依据。 2)针对分布式 OLAP系统中的 OLAP集群的资源占用特性和欺负算法存在的问题,提出一种基于欺负算法的改进算法。该算法采用一对一的方式直接向性能最优的节点发送选举消息,以降低选举过程中产生的通信量和选举时间开销;并通过循环选举保证选举出系统的最优节点担任系统协调者。同时,提出了一种分布式OLAP环境下优先级判定标准,为改进算法的有效性提供前提保障。针对改进算法,本文给出了算法的通信量和时间开销性能分析,并进行了算法实现和仿真测试。实验测试表明,该改进算法有效地降低了消息通信量,减少了时间开销,能更好的应用于分布式 OLAP系统。 3)针对OLAP系统中的数据同步特点和现有异构数据库同步技术不足,提出一种分布式异构数据库同步模型。模型采用客户端-服务器分层设计思想,提供了OLAP环境下的整体数据同步的解决方案,更便于部署和调试;其采用XML作为数据交换格式,确保同步客户端和服务器端的自治性;其采用AES加密技术和Gzip压缩技术实现端到端的传输,满足高安全性需求,增强了同步负载能力。针对提出的同步模型,采用java语言进行实现,并针对不同数据库平台对同步模型进行了测试分析。 本文的改进选举算法能够以较少的通信量和时间开销选举出性能最好的节点成为协调者,保障了分布式 OLAP系统的连续稳定工作。此外,本文提出的同步模型很好地满足了OLAP系统环境下的数据同步需求,并针对同步模型中的数据捕获、数据转换、数据交换和安全性给出了具体的设计方案。