XML数据流上基于窗口的查询处理方法研究

来源 :武汉大学 | 被引量 : 6次 | 上传用户:zj888666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种标准的通用标记语言,XML(eXtensible Markup Language)的半结构化特性、良好的可扩展性和自描述等特性使它已经成为了互联网上数据组织、表示和交换事实上的标准。而随着网络应用如Web服务、发布/订阅、个性化内容传递等的蓬勃发展,越来越多的信息和数据以XML的格式来编码与组织,并通过网络发布和交换,形成了一种新的数据处理模型—流计算模型。二者的结合带来两个基本问题:最优选择查询和多数据源之间的连接查询,导致迫切需要与之相适应的、能灵活高效地处理XML数据流上的查询处理技术。本文围绕XML数据流的查询处理问题展开研究工作,在深入探讨目前XML数据流上查询处理研究成果的基础上,本着丰富XML数据流上的查询体系这一宗旨,实现XML数据流上查询处理灵活高效这一目的,选取XML单数据流上的Top-k查询和多数据流上连接查询进行了讨论和研究,提出了新的处理及优化方法,并通过实验验证了所提出方法的有效性和高效性。论文的主要贡献可以总结为如下几点:1)提出一种在XML数据流上实现窗口查询简单可行的方法。与现有的少量研究工作相比,更好地兼顾了查询语言的表达能力和可行性两个方面,定义了窗口查询的简单语法,系统描述了在XML数据流上实现窗口查询的机制与方法。2)提出一种处理XML数据流上Top-k查询的方法。将XML数据的相似性计算融入到数据的单遍扫描过程中,利用堆栈和优先队列等技术保证查询的高速处理,同时通过渐进结果生成的方法来尽快输出结果,提高结果反馈速度。3)为了处理数据流的潜在无限性,提出一种XML数据流上基于窗口的Top-k查询处理模型,分析显示在一个非常小的错误概率允许范围内,结果输出所需空间较小,并且不依赖于XML数据流的速率。4)提出一种处理XML多数据流连接查询优化的方法。以管道作业和类似路由器的处理方式保证查询的高速处理,并支持渐进的结果输出,针对不同环境影响因素均具有较高的优化效率。综上所述,本文就XML数据流上的查询处理技术进行了深入的探讨和研究,提出了新的不同于已有的技术和方法,并通过实验对其有效性进行了验证。本文的研究工作,对于XML查询处理技术的发展,具有一定的理论意义与应用价值。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着国家综合实力的提高,各方面都实现了飞速的发展,我国对于青少年体育发展越来越重视。本文就通过对早期专项化青少年体育发展开展研究,不但可以使党的十九大精神得到贯彻
成功地应用整体钢包衬取决于耐火材料衬、设备及炉渣冶金等许多影响因素;同时也应该充分理解使用整体包衬的目的是降低总的生产成本。
沈阳市是东北地区的中心城市,作为循环经济示范城市,其加快了产业结构调整与城市建设的步伐,目前已经在清洁生产、生态工业园建设等方面取得了一定的成果,但发展循环经济任重
随着气温逐渐升高,各种饮料逐渐进入了销售旺季.站在琳琅满目的饮料面前,人们往往无从入手,尤其是标签上的“无糖”、“无能量”、“天然果汁”、“含蛋白质”等概念令人眼花
本文首先介绍了目前语言电路的发展、构成、原理。阐述几种适用于继保领域的语言芯片和存储芯片的性能特点。最后介绍语音编程器的原理,使用及语言电路植入继电保护装置中的方
自2005年我们国家实施汇率制度改革以来,人民币汇率实行以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度。为了在新的经济环境中使我们国家的经济实力进一
当前中国面临经济较大的下行压力和政府债务规模不断扩大等问题,在经济新常态下如何充分发挥财政支出政策和税收政策的效能,控制日益增长的债务规模,对于世界经济下行背景下,
从沈阳铁西老工业基地振兴发展的实际出发,提出运用循环经济理念,改变传统经济发展模式,切实实现沈阳铁西老工业基地的生态化发展,使其形成保护和节约资源为取向的经济增长方
形状匹配是计算机图形学、计算机视觉以及模式识别等领域中的一个最基本的问题。在计算机图形学中,它是其它诸如坐标对齐、属性转移、物体重建及检索等关键问题的基础。近几