论文部分内容阅读
随着基于Internet商业应用的迅速发展,XML(eXtensible Markup Language,可扩展标记语言)已经成为Internet上数据表示和数据交换的标准格式,提出了对XML数据查询的要求。关系数据库系统技术已经十分成熟,在商业数据管理中占据着主导地位,如何利用关系数据库来实现XML数据管理已经受到了广泛的关注与重视。XML数据资源的查询与检索是XML获得广泛应用的关键,在Web数据管理中占有重要地位。在众多XML查询语言中,XQuery语言是W3C(World Wide Web Consortium,互联网联盟)标准草案的一部分,已经得到了广泛的应用。因此,基于XQuery查询处理以及优化技术就成为XML数据管理中的主要内容之一,对XML的应用有着十分重要的影响。 文章从问题的三个主要方面进行了讨论:XQuery到SQL的查询语言转换处理,基于多数据源查询重写,以及基于物化视图机制查询重写。分析了它们的处理过程和实现方法,对比了若干具有代表性的现有解决方案,寻找到解决问题并达到应用中各项要求的可行途径。 在基于关系数据库的XQuery查询处理上提出了一种混合执行策略,其中主要是将XQuery转化成SQL来进行相应的处理。其实质就是在XQuery上进行静态分析和类型检查,并将它转化成本地带有XML扩展操作符的SQL数据结构,并对原先的XMLQuery()函数进行替换。若XQuery表达式不能重写成SQL,那么将XMLQuery()函数完整无缺的保留。 对于多数据源重写机制而言,主要是通过一个目标模式,并给定一个源模式和目标模式之间的映射,以及给定源模式中的数据来有效的进行查询重写。以前关注的焦点是关系数据和模式,现在我们关注的是关系和XML模式之间的查询和映射,而且我们还要考虑映射的多种可能情况。基于此给出了一个重写算法,其中涉及到规则产生,查询转化,查询优化以及查询整合四个步骤。 最后给出基于物化视图查询重写机制。首先给出一般视图查询机制的运行原理,并基于此提出了一个视图重写查询机制模型。最后引申到物化视图的研究上,并针对XPath物化视图提出了一套基本匹配算法,并对该基本匹配算法进行扩展,从而可以解决记录匹配以及谓词处理等操作。