论文部分内容阅读
随着互联网的迅猛发展和普及,人们通过计算机与互联网联接,可以从世界各地实时的接收和发送大量、最新的信息,但在信息交换过程中存在着一个突出的问题,就是多种多样的数据格式,给信息的有效使用带来了障碍。所以如何以最便捷、最可靠、最有效的方式获取所需的信息是一个很大的困扰。XML作为基于WEB应用的一种电子数据交换标准,以其自身卓越的优势,尤其是跨平台、异构数据交换的功能,正成为下一代网络电子数据交换的最佳选择,已被广泛应用于商业、教育、通讯等各种领域。关于XML数据存储和查询的研究也正方兴未艾。 目前关于XML数据查询的研究主要集中于基于路径表达式的XML数据查询。从研究新的查询方法、索引结构、操作符重写及路径表达式自身优化等方面,探讨提高查询效率的问题。例如:路径表达式模板匹配方法、基于B+树的结构联合方法、基于后缀树的索引方法、路径表达式重写索引查询方法、利用XML模板优化查询路径的方法等。这些研究都对提高XML文档数据查询的效率作出了重要贡献,但是也都存在着自身的问题。本文在吸收前人研究成果的基础上,围绕提高XML文档数据查询效率的问题,从建立高效的索引结构和选择恰当的实现机制两方面入手,对XML单文档的简单路径查询作了进一步研究,所作主要工作及取得主要成果如下: 1、提出一种新的索引结构 本文在XML文档基本树结构基础上,提出综合利用哈希表、链接表和C-forest’结构为XML文档构建新的索引,对该索引的效率问题进行了分析。 2、提出一种新的查询方法 本文提出运用多线程机制的优势,在高效索引的基础上,自底向上,并发处理查询的解决方案。对路径表达式进行了再处理,以适合多线程机制,详细给出了这种处理策略。 3、给出所有算法的代码实现