面向XQuery语言的树模式提取方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:qzhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网在当今社会已经是我们生活的一部分,有效的数据交换是互联网发挥其能力的基础需求。为了应对互联网中数据的愈发明显的异构特性,国际万维网组织(World Wide Web Consortium,W3C)发布了标记语言(eXtensible Markup Language,XML)的标准。XML是一种以自描述性和半结构化为主要特点的跨平台数据交换语言。然而上述特性也为XML的查询与处理带来了挑战。XQuery是W3C推荐的XML查询语言。为了在XQuery查询实现中有效的针对XML的自描述性和半结构化特征,TAX首次引入了树模式的概念。针对XQuery中的结构连接,树模式依赖结构连接间的关联性抽取并组合成一个整体的树形查询模式。在执行查询时利用上述树形模式完成XML数据源的引入和过滤。这种以筛选下移为基本思想的优化操作有效地减少了在查询中间数据量。因为此类优化行为需要在维持查询效果的前提下彻底改变XQuery查询的求值顺序,所以完整的XQuery的树模式提取算法涉及到诸多细节。针对XQuery中存在的复杂的连接/数据重组需求,传统的方法通常通过对树模式的提取范围加以限定或多次调用树模式匹配的方法完成。本文所撰述的是一组面向完整XQuery语法的树模式提取算法,详细的策略充分分析和考虑了变量、多数据源、迭代语句等对于整体匹配的影响。本文的算法以极大限度合并相关联的结构连接至一个更大规模(过滤效果更强)的树模式为基本思想,进一步减少查询的中间数据。算法以无回溯为原则设计,编译开销较低。本文所述的算法面向了XQuery出现的各种特征语法并且各种算法相对独立因而便于借鉴,因此具有实用价值。根据本文中所述的算法,文章最后给出了实现框架和性能测试。系统实现和相应的测试结果说明了本文中所述算法的有效性和对于查询效能的改善。
其他文献
最近几年,移动设备正逐步地取代传统计算设备,在人们日常生活中扮演着愈加重要的角色。伴随着移动设备的快速增长,保证移动设备上应用的质量成为一个急需解决的问题。因此,针