XML流上的XQuery查询技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wanglinux_0208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML是标准的通用标记语言,它的半结构化特性、良好的可扩展性、自描述等特性,使它成为数据交换事实上的标准。XML的查询语言主要有XPath和XQuery两种。 传统的数据处理方式中数据源多是数据库或者文件,查询系统在对数据进行内存建模后进行处理。随着Web的发展,数据在Web上的交互不断增加。使用XML语言作为中间语言能够解决Web中异构系统之间的数据交互问题,同时也带来了新的挑战。因为Web中大量XML数据的存在方式是数据流,而传统的数据查询主要是数据库查询技术,这些技术并不适用于XML流数据的查询,需要一套新的查询解决方案来处理XML流查询的需求。 本文的目标是研发出一个功能强大的、能在XML流上执行多XQuery查询的查询引擎XSIEQ-XQ,它是本实验室正在研发的XSIEQ(XML Stream Query with Immediate Evaluation)系统的一部分。XSIEQ-XP是XSIEQ中已研制的、能对XML流进行大量XPath式同时查询的XPath查询引擎。XSIEQ-XQ的研发充分利用了XSIEQ-XP的已有工作成果,开发出的原型系统能够兼容XQuery和XPath查询。 XOuery查询分为预处理,查询处理和后处理三个阶段。预处理阶段对查询条件进行简化;查询处理阶段进行XPath查询;后处理阶段进行XQuery结果构造。,本文的研究工作集中于预处理和查询处理两个阶段,主要的工作和成果有: 1、追踪XQuery标准的发展,对XQuery语言进行深入的分析与研究,找到了在现有的XPath查询引擎XSIEQ-XP的基础上扩展支持XQuery查询的途径。 2、提出了一套查询改写规则,通过改写提高了查询效率:利用DTD对FLWOR表达式中的XPath式进行具体化,定义了一套改写规则,改写FLWOR表达式,消除表达式中的冗余查询、将查询条件像更有利于系统查询的方向变换。 3、提出并设计、实现了一种高效的XML流查询算法:定义了扩展的XSIEQ机E-XSIEQ(Extended XML Stream Query with Immediate Evaluation),并在E-XSIEQ基础上为XQuery查询提出并实现一种流查询算法TreeBuf。TreeBuf有效地处理了前缀XPath式的查询问题,同时给普通XPath查询提供了优化的可能性。 4、作为主要成员,设计和实现了XSIEQ-XQ原型系统:它用Java编写,系统支持嵌套、order by子句的多关键字排序等XQuery查询的复杂特性。 5、通过实验说明了系统的高效性:优化前后的性能对比实验说明了查询条件改写对系统性能的帮助,和XSIEQ-XP的性能对比实验说明了系统能有效地处理XML数据流。
其他文献
随着信息化、数字化的发展,传统的广播电视节目已经实现用户点播的功能。目前整个广电行业的焦点聚集在了“数字电视”业务上。如何有效地管理数字电视用户信息,推动数字电视
本文介绍了作者参与设计和实现的远程教学平台中的考试与评价子系统,该系统以基于建构主义理论的现代教学模式与教学评价方法为指导,以因特网为传输载体,采用基于B/S模式的架
将电子商务引入保险行业,是信息技术不断发展的结果。PICC电子商务平台是中国人民财产保险股份有限公司在市场经济的大环境下,本着以客户为中心的宗旨,为更好的拓展保险业务
目前,文本自动分类是信息检索领域中的研究热点之一,传统的文本分类方法是采用词作为特征构建特征向量,但是文本中词的数量非常大,导致了特征向量空间的维数非常高,因此需要
时间序列是一种重要的数据类型,在商业、医学、工程和科学等应用领域具有广泛应用。从生活实际中积累的时间序列数据库,记录了大量的重要信息。当前迫切需要提出有效的方法对
流量是工业生产中比较关心的一种物理量,因此产生了多种基于不同测量方法的流量计。科里奥利力式质量流量计(CMF),是当今世界广泛用于流体测量的一种流量计。科里奥利力式质量流量计在电路方面会包括以下两个部件:流量计变送器(固定的流量测量部分),流量计手操器(用于数据采集的移动手持设备部分)。由于一些传统的原因,以HART协议作为和变送器进行通讯的手操器目前占据了大部分的流量计手操器市场。本文从一种新的
对大规模场景的实时绘制是当前计算机图形学领域的研究热点。大规模场景由于数据量大,当前的图形硬件的处理速度难以做到对其进行实时绘制。一种常用的加速绘制的方法,是对场景
学位
无线ad hoc网络的发展为建筑行业和消防系统提供了有力的技术支持。Ad hoc网络是自组织网络,并且很好的支持网络中节点的移动性。因此项目组针对应用于建筑行业和消防系统的
基于内容的图像检索技术已得到了广泛的应用,但目前出现的基于内容的图像检索系统,多数只适用于某特定的应用领域,缺乏通用且具有实用性的图像检索系统。因此,在国产达梦数据