论文部分内容阅读
在数据库尤其是数据仓库领域,如何加快查询执行速度非常重要。除了对查询进行优化外,另外一种方式就是用物化视图改写查询。物化视图不同于一般的视图,它们不仅存储了视图的定义还存储了视图的结果。用户不必关心物化视图的存在,仅仅针对数据库中的表提出查询,查询改写技术能透明地利用物化视图回答查询,避免了直接访问大量的原始记录以及耗时的连接和聚集计算,有效地提高了查询的执行速度。本文探讨的是改写结果和原查询在多重集上相等的查询改写问题。作者研究了查询改写的条件和算法,考虑了数据库和数据仓库中的语义信息,提出基于语义信息的查询改写,有效地提高了物化视图的可用性。主要内容如下:① 本文研究了在数据库领域基于外键语义的查询改写。外键连接是一个一对多的连接,从表可以通过外键连接访问主表中的列而保持元组数不变,本文利用这种特性提高物化视图的可用性。具体工作如下:1) 提出了无损连接表的概念,如果物化视图中比查询多的表是物化视图的无损连接表,仍可考虑用该物化视图改写查询,提高了物化视图的可用性。2) 提出了可扩展表的概念,如果查询需要物化视图提供的列的信息不在物化视图的输出中,只要在可扩展表中包含这些列的信息,将物化视图和可扩展表连接可获得这些列的信息,提高了物化视图的可用性。3) 将查询和物化视图中的条件进行了分类,提出等价类的概念,明确了如何用物化视图的条件派生查询的条件,以及如何生成补偿条件。4)给出了基于外键语义进行查询改写所要满足的条件及其改写算法。② 在数据仓库中维是分层次的,维层次之间具有依赖关系,因此列的集合(粒度)之间具有派生关系.。本文研究了数据仓库领域基于粒度语义的查询改写。1) 由于事实表和所有维表的连接是无损的,本文提出了聚集查询和聚集物化视图的等价形式,表映射和列映射变的非常简单。2) 根据维层次之间的依赖关系,提出了派生维表的概念。在查询改写中考虑了派生维表,提高了物化视图的可用性。3)给出基于粒度语义进行查询所要满足的条件及其改写算法。<WP=5>③ 本文从实验角度给出了进行查询改写应该具有的数据结构和具体的改写过程。