基于小枝模式匹配的XML数据查询处理算法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:liangfeng905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的飞速发展,半结构化式的Web数据大量涌现,使得HTML标记语言已经不能满足用户日益增长的需求,XML作为一种自描述的半结构化数据为Web数据管理提供了新的数据模型,得到了广泛的应用,并已发展成为Internet上数据表示和交换的事实上的标准。但由于XML本身是一种嵌套的树型结构,如何从大量的XML数据源中查找感兴趣的信息成为XML数据库研究领域的一大热点。小枝模式整体匹配是XML查询处理方法中效率较高的一种,近年来相继出现了许多小枝模式整体匹配算法,例如TwigStack、TJFast、TwigList和TwigNM算法等。这些方法对于只包含祖先-后代关系的查询效率很出色,但它们要按序遍历输入数据流中的每一个元素结点,对于那些很显然不会构成匹配的元素结点仍然在扫描和判断范围之内,当要扫描的标签流较长时,需要花很长的时间,而且对于含有父子关系的查询,它们的查询效率并不高。另外,这些算法只能满足无序查询的需求,对于含有有序轴的Xpath表达式查询无法实现。   本文对XML路径查询处理中尚存在的问题进行了深入研究,在汲取了各种小枝模式匹配算法优点的基础上,针对目前算法存在的不足,研究了两种有效的非归并整体匹配算法TwigTL和OrderedTwigPM。主要内容包括:⑴研究一种有效的小枝模式匹配算法TwigTL,该算法使用Tag+Level流模型,并在进行查询处理之前先进行无用数据层的剪枝,以减少待处理结点的数目,缩短处理时间;⑵为了支持有序小枝模式查询,研究一种新的整体匹配算法OrderedTwigPM,支持Xpath表达式中的有序轴,以扩展查询类型;⑶构建实验系统,实现算法TwigTL和OrderedTwigPM,并通过实验结果和同类算法进行比较分析。
其他文献
信息时代,网络的安全问题越来越受到关注。网络运行的安全状况如何,潜在的风险及其脆弱性有哪些,这些问题已成为人们首要关心的问题。基于此,本文提出一套脆弱性评估的指标、
主题地图是一种全新的数字化知识表示与组织方法,已经成为知识发现领域中的一个重要的研究方向。主题地图不仅可以定位某一知识点所在的位置,还可以清楚的表示各知识点之间的
网络的路由放置问题在无线Mesh网络中一直是一个重要研究方向。一个高效的mesh路由节点放置方法能有力地保证网络的连通和用户的全覆盖。因为无线mesh网络可以提供价格低廉的
随着互联网技术的快速发展,大规模的分布式系统在各个领域中得以广泛地应用。但是,系统的复杂度也随着系统规模的扩大而增加,这对大规模分布式系统的有效管理提出了更大的挑
机会网络是一种不需要源节点和目的节点之间存在完整路径,利用节点移动带来的相遇机会实现网络通信的移动自组织网络。当前关于机会网络数据转发机制的研究存在一个共同的假设
近些年来,随着嵌入式系统、无线网络通信和数字电路等技术的进步,使得多功能低功耗无线传感器网络得到了快速发展。无线传感器网络有着高度动态的系统行为,以数据为中心和动态自
不改变现存低分辨率成像系统,通过多帧互有位移、信息互补的低分辨率图像或视频序列获取高分辨率图像的超分辨重构技术,一直是图像处理领域中研究热点之一,在刑事侦察、目标
高性能的应用层组播研究已经越来越受到业界的关注,由于拓扑感知应用层组播能够最大限度地使底层物理网络拓扑与组播覆盖网络相匹配,从而获得更好的组播数据转发性能。拓扑感
随着宽带无线技术的快速发展,包含语音、视频、数据等多业务融合越来越成为未来人们对移动通信的需求。以政府、公司、航空、铁路等部门为用户主体的,具有集团指挥调度的宽带
随着互联网技术的飞速发展,文本文档、Web页面在互联网中快速扩充,如何帮助人们更快捷、有效地获取信息,已成为目前搜索引擎领域重要的研究课题之一。鉴于此,聚类搜索引擎应运而