论文部分内容阅读
在数据库应用系统中,加快数据查询的执行速度非常重要。数据仓库技术通过对源数据库的数据提前进行归纳、分析、整理,从而提高了查询速度。动态数据仓库针对传统数据仓库更新周期长,只支持历史数据等缺点进行改进,可以直接获取数据,实现秒级别更新,从而可以应用到实时报表的生成功能中。但是动态数据仓库的成本较高,很多中小企业无法承受。为了节约成本,在事务数据库中利用物化视图技术,将查询进行预处理并将结果保存到事务数据库中,可以模拟动态数据仓库的效果,但实际中受到空间、时间的限制,不可能将所有视图物化,所以必须选择一部分视图进行物化,而且随着查询集的变化,物化视图集也需要调整,本文正是基于这一问题提出改进动态物化视图选择算法,设计轻量级动态数据仓库来解决事务数据库中生成报表慢的难点。主要工作如下:
1.深入分析了物化视图选择问题的基本研究方法,并对此问题进行了形式化描述;仔细分析了现有的经典算法,并且对比分析了这些算法各自的优缺点,为我们提出改进算法奠定了基础。
2.提出了改进动态物化视图选择算法,吸收了即时动态调整算法和批量更新算法的优点,并提出了查询时间和用户体验结合的综合指标,并增加了权重系数,为重要视图或重要用户提供更高的权重,从而整体提高整个系统的性能或某个重要用户的体验,还引入衰减因子使得历史查询数据对当前决定能有合适的作用。
3.结合某跨国金融公司的开发实例,将本文提出的改进动态物化视图选择算法应用其中,设计轻量级动态数据仓库来解决报表生成慢的问题,实验证明查询性能有明显的提升。