论文部分内容阅读
数据仓库中存储着海量数据,支持的查询形式复杂,如何达到查询的高效性是数据仓库面临的难题之一,物化视图是解决这一难题的重要手段。但是,物化视图带来了存储空间和视图维护的开销,必须在响应时间和资源开销二者之间进行权衡,选择出恰当的物化视图集合。因此,物化视图的选择问题成为当前数据仓库领域的一个研究热点。本文主要针对物化视图选择问题展开研究,物化视图选择的主要问题是如何使查询处理和物化视图维护代价之和最小,可从两方面解决此问题:一方面是为候选视图集构造搜索空间;另一方面是优化物化视图选择算法。本文在MVPP(Materialized—View Processing Plan)的基础上提出了一种为物化视图选择构造搜索空间的新方法IMVPP(Improved MVPP),它通过计算输入查询的公共子表达式来构造搜索空间,计算出的公共子表达式能被其它的查询共享,并可对输入查询进行重写,有利于缩减视图搜索空间,提高查询效率。物化视图的选择策略分为静态和动态两种。其中,静态选择策略均假设查询在综合数据上是均匀分布的,或者用户可以提供其查询分布概率,而实际上随着数据仓库系统的运行,查询请求的动态变化会导致部分物化视图收益下降,从而使得物化视图集的总收益下降。这些问题必须通过动态选择策略加以解决,它根据系统中实际发生的查询类型的分布选择物化视图,即在运行过程中不断地收集查询,并根据已收集到的查询来选择物化视图,当发现已有的物化视图不再适合新的查询集合时,根据新的查询集合重新选择物化视图。现有的大部分视图选择策略没有考虑用户查询的特点,从而存在一些缺陷,本文对多用户多窗口视图选择策略进行了改进,提出了一种基于IMVPP的面向用户的物化视图动态选择策略DSUOMV(dynamic selection algorithm ofuser-oriented materialized view),包括候选视图选择算法CVSA(candidate viewsselection algorithm)、窗口动态空间分配算法DSAW(dynamic spface allocating inwindows)、窗口内面向用户的物化视图选择算法UMVS(user-oriented materializedview selection)、窗口内物化视图的动态调整算法DMVW(dynamic modulation ofmaterialized views in window)等。此策略充分考虑了用户查询的多样性和动态性,根据用户查询的特征把他们分成不同的群体,并为不同的群体分配不同的视图选择窗口。用户窗口空间的分配通过DSWA算法进行调整,窗口内使用UMVS算法选择合适的视图进行物化,同时使用DMVW算法判断用户查询分布是否变化来决定是否对物化视图进行动态调整。从实验数据和比较分析可以看出,以上算法具有一定的优越性。