论文部分内容阅读
随着信息时代的来临,企业面临大量数据,如何快速从中提取信息、制定市场策略,以便对市场做出及时灵活的反应,成为企业在市场竞争中立于不败之地的关键。联机分析处理OLAP(Online Analytical Processing)正是用户获得决策支持的主要手段。OLAP必须支持各种可能的查询,相当一部分查询可能要涉及大量的数据,并需要对数据进行选择、投影、连接等处理,这是一个非常耗时的过程,然而一个决策支持系统要求它的查询能够被快速响应。解决这一矛盾通常采用的一个有效的方法是:数据仓库针对OLAP可能的查询对原始数据进行选择、投影、连接等预处理,建立物化视图(Materialized View)。但是,物化视图也带来了大量存储空间和视图维护的开销,必须在缩短响应时间和资源限制二者之间进行权衡,选择出恰当的物化视图集合。因此,物化视图的选择问题作为设计、构建数据仓库的关键问题之一,成为当前数据仓库领域的一个研究热点。此外,物化视图的相关研究还包括用物化视图改写查询、物化视图的维护以及物化视图的动态调整等。本文主要针对基于关系数据库的OLAP系统中的多维数据物化视图的选择和动态调整问题进行研究,在提出一个更为合理的视图增益模型之后,分别提出基于MVPP的物化视图选择算法——VSMF算法,调整物化视图集使之满足空间约束的算法——MVSCA算法,物化视图实时调整算法——RMMV算法以及基于MVPP的物化视图动态调整算法——DMMF算法。VSMF算法以MVPP为视图搜索空间,综合考虑了物化视图影响系统查询性能和维护性能的各种因素,使系统得到较好的查询性能和较低的维护开销。MVSCA算法根据视图的单位空间增益对物化视图集进行调整,使得其满足给定的空间约束。RMMV算法对物化视图集进行实时调整,避免了视图的重复计算和对视图大小的估算,提高了物化视图选择的效率和准确性,使系统在运行过程中能及时反映查询分布趋势、维持较好的查询响应性能。DMMF算法从MVPP的角度讨论物化视图集的动态调整,其综合了批量调整算法和实时调整算法的优点,同时避免了二者的缺陷。从实验结果和比较分析可以看出,以上算法具有一定的优越性。