论文部分内容阅读
数据仓库是计算机信息化不断发展的产物,它将大量用于事务处理的数据库数据进行清理、抽取和转换,并按决策主题的需要重新进行组织,以达到快速有效支持决策的目标。物化视图的联机一致性维护技术是数据仓库联机维护技术研究中的一个热门问题。在数据仓库物化视图研究领域应用较多的是对物化视图的一致性维护问题,并且大部分研究都是基于视图定义在关系表主键的假设基础上而进行的,其中应用较为成熟的是ECA-Key算法和ECA-Key补偿算法,这两种算法在查询时直接利用源数据库关系,避免了查询时数据库与数据视图的不一致性。但是ECA-Key算法只在视图定义带有源关键字并且更新查询的发出与接收的顺序保持一致时算法才成立,由于数据仓库物化视图应用的复杂化,网络环境下更新操作的频繁性和顺序上的不确定性,即由于业务分布、介质及网络通信等方面的原因,数据仓库收到的查询计算结果,和它向各数据源发出的计算查询顺序并不一定一致,从而引起更新维护后数据的不一致,这导致了ECA-Key算法和ECA-Key补偿算法应用面的狭窄,并逐渐显现出其弊端。并且算法ECA-Key采用对物化视图完全备份的方式进行,增加了维护与数据写回的开销。为了解决以上问题,本文分析了ECA-Key.算法的应用示例,并在此基础上提出了关系数据表的扩展模式,在扩展模式上提出了物化视图更新算法Expansion(包括源数据库端的Expansion-DB算法和数据仓库端的Expansion-DW算法),算法的基本思想是将普通数据表定义进行模式上的扩展,用扩展字段记录更新操作进行的顺序与操作的类型,并根据一定的规则对源数据库的操作进行判断,然后对数据仓库物化视图端进行必要的修改操作,源数据库端和数据仓库端采用查询通知和反馈确认的方式进行,从而保证了视图维护事务的数据一致性。在介绍了算法思想之后给出了扩展模式下更新算法Expansion的应用示例,证明了算法的正确性。最后讨论了物化视图自维护方面的问题,给出了物化视图自维护的概念,讨论了物化视图自维护的特点,分析了物化视图自维护的判断依据,简单提出了物化视图自维护算法的基本思想,并给出了物化视图进行简单自维护的条件和物化视图向自维护方向的简单扩充。