论文部分内容阅读
随着因特网的普及与发展,XML语言被普遍用于异构信息和异构平台的数据交换和数据共享。为了推动XML数据查询和处理的标准化,国际万维网组织W3C组织发展了XQuery语言,并将其作为XML数据查询语言标准发布。鉴于XML数据的半结构化特征和XQuery语言的函数式语言特征,高性能的XML查询处理与XQuery语言实现技术得到了普遍的重视,近年来已经成为数据库技术领域的研究热点之一。XML文档不同于关系数据,具有半结构化的特点。标准的XML查询语言所表示的查询请求中,很大程度都是针对XML数据的结构特征进行查询。Twig查询技术能够综合XML查询中的树结构特征形成模式树,利用模式匹配等算法完成高效的处理。在众多XML查询处理技术中,TwigList等整体查询匹配方法由于很好地利用了XML数据的树结构特征,成为了高性能XQuery实现技术的核心技术之一。本文分析了Twig整体查询匹配算法的发展现状及其存在的问题,解决了在XQuery引擎中引入Twig整体查询匹配方法所带来的问题。首先,通过对TwigList算法进行扩展,提出了新型的TwigLinkedList算法,解决了查询结果的顺序问题,并且针对Twig查询中父子关系的处理进行优化,进一步提高了查询的效率。随后,本文提出了引入Twig查询后的枚举方法以及谓词的处理方法,使得Twig查询模块可以高效地集成在XQuery引擎中。针对Twig查询的执行时间与内存使用情况,对扩展前后的TwigList算法进行了测试。实验结果表明,TwigLinkedList算法有效地减少了冗余的中间结果,从而提高了Twig查询效率,有效地支持了XQuery语言的高性能实现。