XML树模式匹配查询研究

被引量 : 0次 | 上传用户:magicMan555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和Web技术的迅猛发展,XML已经逐渐成为了数据表达和交换的主要标准和载体。日益增长的XML数据对已有的数据管理技术提出了新的要求,如何有效地对XML数据进行管理和查询已经成为了目前数据库领域的研究重点。本文工作围绕XML数据的树模式匹配进行,它可被看作是多步的结构连接,但这些连接操作被当成一个整体进行处理,避免了大量的无关结点参与运算,从而提高了查询效率。树模式匹配可作为XQuery查询的一个操作符,并且已经被普遍认为是XML查询的核心操作。目前在该方面已经提出了一系列有效的实现方法,早期的工作多是按两个阶段执行,首先将查询分解为多条从根到叶结点的子路径,通过索引或者其他过滤算法获取匹配的局部结果,然后再对这些结果进行归并。这种方式在查询包含父子关系时可能会产生不能构造最终输出的中间结果,同时路径归并会花费较多的时间开销。之后提出的算法,其设计思路大多是为了尽量减少执行过程中产生的无关结果,同时避免归并操作,但是它们采用的数据结构较为复杂,实现起来代价较高,特别的,最坏情况下可能要在内存构建整棵文档树。本文在研究已有树模式匹配算法的基础上,提出了新的解决方法。本文的主要工作如下:(1)研究分析了现有的树模式匹配算法,并总结其实现方法;(2)基于路径索引,同时考虑到查询通常只需要获取某几个结点的匹配结果,提出了针对输出结点的TwigFilter算法,算法过程根据要处理的输出结点进行,这样减少了参与运算的无关结点的数量,节省了相应的I/0和匹配开销,之后和TJFast算法的实验比较验证了TwigFilter算法的有效性;(3)对TwigFilter算法进行改进,考虑在DTD下的查询预处理问题,提出了改进后的patternFilter算法,同时考虑了处理多输出结点的情况,并且优化了算法的执行顺序,最后通过把patternFilter算法与TwigStack、TJFast和TwigFilter算法进行实验对比,进一步验证了改进算法的有效性。
其他文献
科学技术的发展对于世界的影响越来越重要。关于科学技术发展以及其外部性的研究也越来越多。早期的研究多是从专利角度入手进行技术溢出研究。此外,从开源知识角度入手,研究
[目的]探讨康复护理对有机磷中毒致迟发性周围神经病变预后的影响。[方法]将80例有机磷中毒致迟发性周围神经病变病人随机分为康复组和对照组各40例,对照组病人给予常规对症
目的:探讨中成药保元丹对肺癌患者外周血T细胞功能和表型的影响,进一步从细胞和分子水平探讨其免疫调节作用机制,为其抗癌作用提供理论依据.方法:化疗后非小细胞肺癌患者20例
学校作为事业单位,是非营利组织,因此高校财务预算工作就成为了财务管理的主要内容,也是学校日常开销、收入的依据。对于高校财务预算工作的管理与学校的运行和发展有着重要
发展经济学是一门以发展中国家经济发展为研究对象,以紧密结合发展中国家复杂经济社会发展问题,寻求经济发展为目的的实用性学科。而目前国内发展经济学教学大多仍沿用传统教学
马克思曾经说过,对于没有音乐感的耳朵来说,再美的音乐也毫无意义。提高学生的音乐欣赏能力,使音乐情感的表达真正融入学生的内心,即便一首通俗简单的乐曲也会被表达的淋漓尽
气液两相流系统广泛存在于工农业生产和日常生活中。在描述气液两相流的众多参数中,其流型的在线识别对两相流系统的运行监控、过程控制及安全保证等具有重要的学术意义和工
利用模糊综合评判法识别大孔道具有经济适用、简捷快速的优势,但是其指标的选取及评价体系的建立会直接影响识别结果的准确性。综合考虑油藏特点及资料的可获取程度,优选9种影
当前,我国大力提倡中小学学校特色化、多样化发展,而实践一线的学校也积极响应,进行特色化发展的探索。那么,何谓特色学校呢?北师大刘复兴教授认为:"特色学校是与制度化、标准化
目前,手机等移动终端已经成为多媒体传播的重要载体之一。随着显示技术和无线通讯技术的不断完善,将立体场景应用于移动终端将会作为新兴产品受到用户的欢迎。立体视频数据量