XML数据流上基于窗口的查询处理方法研究

来源 :武汉大学 | 被引量 : 6次 | 上传用户：zj888666

【摘要】

：

作为一种标准的通用标记语言,XML(eXtensible Markup Language)的半结构化特性、良好的可扩展性和自描述等特性使它已经成为了互联网上数据组织、表示和交换事实上的标准。而

【作者】

：

胡文生

【出处】

：

武汉大学

【发表日期】

：

2012年01期

【关键词】

：

XML数据流窗口查询 Top-K查询连接查询

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为一种标准的通用标记语言,XML(eXtensible Markup Language)的半结构化特性、良好的可扩展性和自描述等特性使它已经成为了互联网上数据组织、表示和交换事实上的标准。而随着网络应用如Web服务、发布/订阅、个性化内容传递等的蓬勃发展,越来越多的信息和数据以XML的格式来编码与组织,并通过网络发布和交换,形成了一种新的数据处理模型—流计算模型。二者的结合带来两个基本问题：最优选择查询和多数据源之间的连接查询,导致迫切需要与之相适应的、能灵活高效地处理XML数据流上的查询处理技术。本文围绕XML数据流的查询处理问题展开研究工作,在深入探讨目前XML数据流上查询处理研究成果的基础上,本着丰富XML数据流上的查询体系这一宗旨,实现XML数据流上查询处理灵活高效这一目的,选取XML单数据流上的Top-k查询和多数据流上连接查询进行了讨论和研究,提出了新的处理及优化方法,并通过实验验证了所提出方法的有效性和高效性。论文的主要贡献可以总结为如下几点：1)提出一种在XML数据流上实现窗口查询简单可行的方法。与现有的少量研究工作相比,更好地兼顾了查询语言的表达能力和可行性两个方面,定义了窗口查询的简单语法,系统描述了在XML数据流上实现窗口查询的机制与方法。2)提出一种处理XML数据流上Top-k查询的方法。将XML数据的相似性计算融入到数据的单遍扫描过程中,利用堆栈和优先队列等技术保证查询的高速处理,同时通过渐进结果生成的方法来尽快输出结果,提高结果反馈速度。3)为了处理数据流的潜在无限性,提出一种XML数据流上基于窗口的Top-k查询处理模型,分析显示在一个非常小的错误概率允许范围内,结果输出所需空间较小,并且不依赖于XML数据流的速率。4)提出一种处理XML多数据流连接查询优化的方法。以管道作业和类似路由器的处理方式保证查询的高速处理,并支持渐进的结果输出,针对不同环境影响因素均具有较高的优化效率。综上所述,本文就XML数据流上的查询处理技术进行了深入的探讨和研究,提出了新的不同于已有的技术和方法,并通过实验对其有效性进行了验证。本文的研究工作,对于XML查询处理技术的发展,具有一定的理论意义与应用价值。

其他文献

青藏高原湖泊流域土壤与牧草中多环芳烃和有机氯农药的污染特征与来源解析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

青藏高原多环芳烃有机氯农药土壤牧草湖泊

探究早期专项化培养模式与多元化青少年体育发展

随着国家综合实力的提高,各方面都实现了飞速的发展,我国对于青少年体育发展越来越重视。本文就通过对早期专项化青少年体育发展开展研究,不但可以使党的十九大精神得到贯彻

期刊

早期专项化多元化青少年竞技体育

整体钢包衬的使用

成功地应用整体钢包衬取决于耐火材料衬、设备及炉渣冶金等许多影响因素；同时也应该充分理解使用整体包衬的目的是降低总的生产成本。

期刊

整体钢包衬耐火材料炼钢循环周期

沈阳市循环经济发展建设研究

沈阳市是东北地区的中心城市,作为循环经济示范城市,其加快了产业结构调整与城市建设的步伐,目前已经在清洁生产、生态工业园建设等方面取得了一定的成果,但发展循环经济任重

期刊

循环经济再生资源评价体系

饮料标签上的概念令人眼花缭乱 100%果汁≠原榨果汁

随着气温逐渐升高,各种饮料逐渐进入了销售旺季.站在琳琅满目的饮料面前,人们往往无从入手,尤其是标签上的“无糖”、“无能量”、“天然果汁”、“含蛋白质”等概念令人眼花

期刊

配料表植物蛋白饮料浓缩果汁果汁饮料标签标准

语言芯片植入继电保护的方法

本文首先介绍了目前语言电路的发展、构成、原理。阐述几种适用于继保领域的语言芯片和存储芯片的性能特点。最后介绍语音编程器的原理，使用及语言电路植入继电保护装置中的方

期刊

语音描述智能质数语音处理语言植入

财政政策与汇率制度相配合的经济效应研究及政策建议

自2005年我们国家实施汇率制度改革以来,人民币汇率实行以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度。为了在新的经济环境中使我们国家的经济实力进一

期刊

财政政策汇率制度经济效应

“控债务—稳增长”双重目标下中国财政政策的经济效应分析

当前中国面临经济较大的下行压力和政府债务规模不断扩大等问题,在经济新常态下如何充分发挥财政支出政策和税收政策的效能,控制日益增长的债务规模,对于世界经济下行背景下,

学位

财政政策目标政府债务规模经济效应政策效果

循环经济理论在沈阳铁西老工业基地振兴中的应用研究

从沈阳铁西老工业基地振兴发展的实际出发,提出运用循环经济理念,改变传统经济发展模式,切实实现沈阳铁西老工业基地的生态化发展,使其形成保护和节约资源为取向的经济增长方

会议

循环经济沈阳铁西老工业基地

基于图的三维形状匹配

形状匹配是计算机图形学、计算机视觉以及模式识别等领域中的一个最基本的问题。在计算机图形学中,它是其它诸如坐标对齐、属性转移、物体重建及检索等关键问题的基础。近几

学位

形状分析形状匹配图匹配弧线骨架拓扑修补莫斯斯莫尔复形交叉参数化纹理转移

XML数据流上基于窗口的查询处理方法研究

与本文相关的学术论文