论文部分内容阅读
随着互联网的飞速发展,XML以其强大的数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和数据交换的事实上的标准,因此对XML数据进行有效地管理和查询的要求也越来越迫切.同时,各种各样的XML查询语言被提出来了.路径表达式是这些查询语言的重要组成部分,因此高效地处理路径表达式成为提高XML查询效率的关键所在.对XML而言,一个公认的问题是:只有语法意义而缺乏语义信息.为了回应这种批评,研究者们提出了各种各样的语义约束.虽然XML已经作为数据交换的主要格式和标准而应用于各行各业,但是在实际的应用中,为了有效地利用关系数据库成熟的数据管理功能来处理XML数据,并且能够利用基于关系数据库的应用系统,通常需要把XML存储在本地的关系数据库中.在提出XML语义约束后,当用关系数据库存储XML文档时,如何把这些语义约束信息映射到关系数据库中是一个重要的研究课题,具有较高的理论价值和现实意义.该文对上述两个方面的问题进行了相关的研究,具体地说,该文的主要贡献和创新之处在于:■提出了一种新型的XML索引结构:UD(k,1)-索引,该索引充分利用了XML数据节点之间在向上和向下路径上的局部相似性,因此能够有效地处理路径表达式的查询,特别是分支路径表达式的查询.■对UD(k,1)-索引在索引大小、生成时间、路径查询性能等方面进行了详细的实验,并与1-索引和A(k)-索引作了对比和分析.实验研究表明,UD(k,1)-索引具有较短的生成时间,并能够以相对较小的空间代价获得较好的查询性能.■研究了两种形式的XML语义约束:XML键和XML函数依赖,并提出了相应的算法用来当存储XML文档到关系数据库中时把XML上的语义约束转换成关系数据库上相应的语义约束.■基于上述XML键转换算法,开发了用来把XML键转换成关系数据库键约束的KeyGen原型系统.