论文部分内容阅读
随着信息技术的不断发展,在信息集成领域,多数据库系统已经成为异构数据源之间信息交互和集成的有效管理方法之一。其旨在通过一个通用的数据集成与访问平台为决策系统提供高质量的可信数据,而系统中的数据一致性问题是决定其数据质量高低的关键因素之一,特别是目前为了提高多数据库系统的可用性和容灾能力而引入的各种解决方案使得系统中数据一致性问题变得更加复杂。所以本文对于上述问题进行了深入的分析和讨论,在此基础上,设计实现了多数据库系统中的数据一致性维护管理子系统,主要研究工作包括以下几个方面:(一)设计提出了数据一致性维护管理子系统的体系结构,该子系统采用分层管理的体系架构来解决不同层面的数据一致性问题。其中副本一致性维护管理器采用节点代理的方式,通过由任务执行发布控制,任务完成后继控制和任务执行异常控制所构成的控制体系有效解决了数据物理存储层面的副本一致性问题;全局数据同步更新控制器采用基于C/S的同步更新控制结构,利用更新信息表和临时集成源表将整个控制过程分割为两个并发执行的关键步骤,有效解决了数据集成层面的全局数据同步更新问题即本地源数据与全局目标数据间的一致性问题。(二)在本地数据的副本一致性维护方面,设计实现了基于一致性维护任务的管理策略。该策略利用一致性维护任务,采用更新请求同时发布到多节点执行的方式缩短数据副本间的同步延迟,降低一致性维护的时间消耗;利用“最快更新-访问”机制来提高请求的处理速率,通过物理一致性维护任务完成后的优先调度控制来缩短阻塞任务的等待时间;并结合任务异常控制技术来保证更新异常状态下的数据一致性。有效解决了数据源节点间的副本一致性问题,同时提高了系统的吞吐率和节点的资源利用率。(三)在本地源数据与全局目标数据间的数据一致性维护方面,提出了两段式全局数据同步更新控制技术。该技术依据数据源对触发器的支持程度和分布网络环境下的一些特性,将整个同步更新过程切割为本地源数据更新信息抽取和全局数据重集成更新两个过程,并使这两个过程得以并发执行,提高了全局数据的更新效率和管理器的抗灾性能。在前一过程中利用更新信息的拆装控制减少网络传输的数据量,缩短数据同步时间。后一过程主要解决如何快速有效地确定失效的全局数据对象,缩小参与重新集成的对象范围从而避免启动不必要的全局数据更新过程。最后借助系统的应用平台对数据一致性维护管理子系统进行了相应的试验和测试,通过对试验结果的分析讨论验证了本文工作的可行性和有效性。