数据仓库物化视图一致性维护研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ff520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库是计算机信息化不断发展的产物,它将大量用于事务处理的数据库数据进行清理、抽取和转换,并按决策主题的需要重新进行组织,以达到快速有效支持决策的目标。物化视图的联机一致性维护技术是数据仓库联机维护技术研究中的一个热门问题。在数据仓库物化视图研究领域应用较多的是对物化视图的一致性维护问题,并且大部分研究都是基于视图定义在关系表主键的假设基础上而进行的,其中应用较为成熟的是ECA-Key算法和ECA-Key补偿算法,这两种算法在查询时直接利用源数据库关系,避免了查询时数据库与数据视图的不一致性。但是ECA-Key算法只在视图定义带有源关键字并且更新查询的发出与接收的顺序保持一致时算法才成立,由于数据仓库物化视图应用的复杂化,网络环境下更新操作的频繁性和顺序上的不确定性,即由于业务分布、介质及网络通信等方面的原因,数据仓库收到的查询计算结果,和它向各数据源发出的计算查询顺序并不一定一致,从而引起更新维护后数据的不一致,这导致了ECA-Key算法和ECA-Key补偿算法应用面的狭窄,并逐渐显现出其弊端。并且算法ECA-Key采用对物化视图完全备份的方式进行,增加了维护与数据写回的开销。为了解决以上问题,本文分析了ECA-Key.算法的应用示例,并在此基础上提出了关系数据表的扩展模式,在扩展模式上提出了物化视图更新算法Expansion(包括源数据库端的Expansion-DB算法和数据仓库端的Expansion-DW算法),算法的基本思想是将普通数据表定义进行模式上的扩展,用扩展字段记录更新操作进行的顺序与操作的类型,并根据一定的规则对源数据库的操作进行判断,然后对数据仓库物化视图端进行必要的修改操作,源数据库端和数据仓库端采用查询通知和反馈确认的方式进行,从而保证了视图维护事务的数据一致性。在介绍了算法思想之后给出了扩展模式下更新算法Expansion的应用示例,证明了算法的正确性。最后讨论了物化视图自维护方面的问题,给出了物化视图自维护的概念,讨论了物化视图自维护的特点,分析了物化视图自维护的判断依据,简单提出了物化视图自维护算法的基本思想,并给出了物化视图进行简单自维护的条件和物化视图向自维护方向的简单扩充。
其他文献
迁移工作流是近年来工作流管理研究的一个新方向,并且被解释为运行期间在工作位置上合并静态工作流说明、本地规则和策略、以及用户策略的效应。迁移工作流管理系统的三要素是
密码体制的设计和研究都是在Kerckhoff假设前提下进行的。一般情况下密码体制由密码算法和密钥组成,Kerckhoff假设要求密码体制的研究不能以敌人不清楚密码算法为前提,在这样
近来Internet上有越来越多的QoS要求的组播应用的涌现,如视频会议、网络音频/视频广播、远程教育、软件更新等,这加速了网络对可扩展的有效的组播通信方式支持的需要。与单播通
工作流技术满足了企业对其业务过程不断地进行优化以及重组的需求,给企业的业务过程管理带来了很大的益处,使得企业实现了办公自动化,从而提高了企业的办事效率,改进了客户服务,增
粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的一种用于数据分析的数学理论,属性约简是粗糙集理论研究中的核心问题之一,也是粗糙集有效算法研究的焦点。其基本
迁移工作流是将移动计算技术应用于工作流管理的一项新技术。工作流业务过程根据业务目标的复杂程度被映射为一个或多个迁移实例,每个迁移实例执行一个目标相对独立的子业务
随着Internet和电子商务的兴起与发展,越来越多的企业在寻求涉及Internet和基于Web技术的解决方案,企业用户对应用服务的需求不断增大,软件市场正面临着一场重大的变革。随着
随着信息技术的发展尤其是高通量技术的进步,数据已成为各行业接触最多,使用最为频繁的信息载体。但海量数据的出现使得人们无法从中获得真正对决策或者预测起作用的信息,从而造
动态优化技术作为一种针对二进制代码的优化方法,能够根据即时的运行环境对程序进行动态的调整优化,从而使得程序在具体的运行环境中得以发挥最优的性能。动态优化系统也可以
在近半个世纪以来,算法研究始终是计算机科学研究的核心内容之一。 作为算法中的经典问题之一,可满足性问题(SAT)是人们证明的最早的NPC问题,它在算法学中的地位非常重要。3-