基于包含谓词的XML路径表达式的查询处理方法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:guoguo10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML以其高度的表达能力和灵活性,逐渐在互联网上成为数据发布和数据交换的标准。如何在大量的XML数据中查询信息已经成为学术界和产业界关注的一个热点。在过去的研究中,人们主要关注的是结构上模式匹配的问题,并且在这个方向上取得了大量的研究成果。其中结构化连接的方法得到了高度关注,并且有大量的改进算法。与此相对应,在XML数据集合上的关键字检索相对研究的比较少,而且,据我们所知大多是求解最小公共祖先的问题。带有路径约束条件的关键字检索,我们还没有看到相关的论文。本文提出的算法就是在已有的高效的结构化连接算法的基础上,通过添加辅助索引来完成关键字匹配。本文提出了两种检索方法。第一种是BFX算法,该算法利用了结点附加索引达到了叶结点数据内容的快速定位。从而可以快速的判断在路径匹配结果集中的结点是否符合关键字约束条件。为了改善算法的适应性,在以上基本的BFX算法的基础上,本文又放宽了数据存储有序性的要求,通过数据的划分和索引的分层,实现了桶间数据有序,桶中数据乱序。从而适应了平凡更新的请况,实现了数据在局部乱序的情况下的高效查询。本文提出的第二种算法,是IFX算法。IFX算法是通过建立关键字倒排索引的方式,实现了多关键字的高效查询。改进的IFX算法利用关键字倒排连接的结果来优化路径匹配过程,使得无效的路径匹配中间结果数量大为降低。从而有效地降低了连接的代价。
其他文献
随着数据库技术的广泛应用,产生了大量分散在各个行业的数据。面对大量繁杂而分散的数据资源,如何有效地管理和重组数据资源,提炼出有价值的信息以供决策使用,成为数据库发展面临
由于故障信号存在数量冗余、不准确、不完整等现象,导致了基于神经网络的故障诊断专家系统的网络结构输入维数大,结构复杂,冗余部分多,因此网络训练速度慢,不易收敛,推广能力
对现代化的制造业企业来说,如何使企业的信息更加易于管理,使企业运行效率更高,以及如何减少企业的运营成本等都是现代企业面临的主要挑战,在制造业企业加快信息化步伐的过程中,对
嵌入式系统的设计和实现朝着基于芯片,特别是系统级可编程芯片(SoPC,System On a Programmable Chip)的方向发展。基于FPGA的片上可编程系统技术逐渐成为嵌入式系统技术发展的
本文的研究对象一水下滑翔机器人嵌入式控制系统是为了满足水下滑翔机器人的开发需要而设计的。在深入分析水下滑翔机器人控制系统特点的基础上,本文提出了水下滑翔机器人嵌入
近年来,无线通信技术迅速普及,“随时、随地、访问任何网络资源”无疑对移动用户有着巨大的吸引力,在新一代无线移动互联网络(wireless mobileInternet)技术的发展过程中,无线局
随着工艺,贸易趋势的进步,交易方式同时也在改变。许多业务应用也在不停的发展以及改变来发展业务方式以及机构。这些变化很明显,日益增快甚至企业难以跟得上这些变化。因此
随着交通运输产业的迅速发展,它与社会生活的联系越来越紧密,这使得人们开始日益关注运输成本问题。动态车辆实时调度是降低运输成本的一种科学方法,它可以减少车辆空驶率,降
数据挖掘是随着信息技术不断发展而形成的一门新学科,是数据库领域出现的一个新兴的研究热点。关联规则作为数据挖掘领域的一个重要研究分支,针对关联规则挖掘中经典算法-Aprio
随着科技的发展和计算机网络的普及,即时通信软件已逐渐融入人们的生活。从简单的聊天工具,发展到集交流、资讯、娱乐、搜索、电子商务、办公协作和企业客户服务等为一体的综合