论文部分内容阅读
XML语言已经成为互联网上表示和交换数据的标准,使得XML文档大量出现,因此如何查询XML文档变得更加重要。由于关系数据库有着技术成熟、应用广泛、数据管理能力强、数据安全程度高等优点,XML数据的查询可以利用关系数据库的已成熟的相关技术来实现和完成。 本文分析了HTML随着Internet的发展暴露出的交互性差、语义性差、难以扩展等缺点;介绍了在Web上普遍应用的描述语言XML的特点,以及它较HTML的优势所在;从结构映射方法和模型映射方法这两类基于关系数据库的XML存储方法入手,对几种主要的存储方法作了比较;研究了XML数据库的几种查询技术,对XML查询方式进行了进一步深入的分析;介绍了几种实现XML查询优化的方式。 基于视图的查询重写技术是优化查询的一个重要技术。半结构化的查询重写方法,通过完全遍历重写候选方案空间来得到正确的查询重写方案,没有对指数空间的查询重写候选方案进行剪裁,算法具体执行效率低。本文重点研究如何裁剪重写候选方案指数空间,提出解决问题的新方法,在原有的查询重写的基础上引入关系查询重写桶算法的某些策略。在半结构化数据库中利用查询中子目标之间的联系和半结构化数据查询的自身特点,在保证算法完备性的前提下,从查询和视图两种不同的角度来对生成的重写空间进行限制,得到尽可能少的查询重写候选方案,提高算法的执行效率。对提出的观点进行论证,并从算法的时间复杂度和空间复杂度两个方面分析比较。