基于共享技术的谓词窗口数据流查询优化研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:walker1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络、电信和传感器技术的发展,数据库技术得到了新的应用。在其中一种应用中,数据不再来自存储于永久介质的数据库,而是以连续、快速、随时间变化、无限的数据流的形式到达。在许多领域中存在这类应用,如网络监控,网络流量管理,入侵检测,传感器的数据处理,生产线管理,股市信息分析等等。 数据流具有连续性和无限性的特点,数据流管理系统在大多数的情况下无法处理全部的数据。为了适应数据流的诸多特点和其实际应用的需要,在数据流管理系统中广泛采用了窗口技术,对数据流中的数据进行分片处理。目前在数据流上应用最广泛的是滑动窗口查询模型。尽管滑动窗口模型能满足数据流查询中通常关心最近到达的数据的特点,但是它不能反映出整个数据流的变化,因此,普渡大学提出了一种新的窗口查询模型——谓词窗口查询模型,并引入了负元组的概念,用以表示过期元组或不符合窗口谓词的元组。 谓词窗口查询模型是一种新的窗口查询模型,目前对它的研究还比较少。本文主要研究了基于共享技术的谓词窗口数据流查询优化。针对两种不同的查询——预定义查询和即席查询,分别提出了不同的优化方法。 对于预定义查询,由于查询是在相关数据到来之前已经在数据流管理系统定义的,可以预先制定查询计划进行优化。具体来讲,就是采用多重查询处理优化的方法,对一组查询语句,求出它们的公共子表达式,在查询过程中,公共子表达式仅被执行一次,得到一个中间结果,所有包含该公共子表达式的查询都使用这一中间结果。这样就使得查询代价大为降低,提高了查询处理的效率。 对于即席查询,由于查询是当需要获得相关信息时而提交的,不能预先制定查询计划进行优化,需要动态地决定查询执行的过程。本文中采用了一种基于负元组的增量式结果估算方法。具体来讲,由于在谓词窗口查询模型中引入了负元组,使得各个操作符需要处理的元组大大增加。考虑到连接操作的耗费比较大,通过设置“时间信息”元组,避免处理与相应的正元组相同的负元组的连接操作。同时,在以前的计算结果的基础上估算新的结果,避免全部重新计算,达到查询优化的目的。通过文中的例子可以看出,这种方法使需要处理的负元组的数量大大减少,提高了查询处理的效率。
其他文献
本文对IP多媒体子系统归属用户服务器的实现进行了研究。文章分为七个部分: 第一章,介绍本文工作的背景以及主要内容; 第二章,概述IMS主要思想,包括网络结构、特性、功能及
近年来,越来越多的关联数据被发布到网上而逐渐形成了一个全球分布式的数据空间,但由于这个数据空间的分布式特性和开放性,对关联数据的查询面临着各种各样的挑战,如何有效的
如何发现Web上根据“主题”聚集在一起的多个社区,使用户很快地从互联网上提取知识,是Web挖掘的一个研究方向。本文在深入研究Web社区挖掘技术的基础上,提出一种新的Web社区
标准Job-Shop加工过程要求各种加工设备单一,而现实企业产品加工过程可根据实际需要,适当增加影响产品加工效率的设备,所以标准Job-Shop加工调度已不能满足现在日益变化的企
随着物联网的高速发展,物联网已经在各个领域中发挥了重要的积极的作用,二十一世纪是信息时代,军队建设离不开信息化,军队武器贮存和管理中存在各式各样的问题,武器贮存的环
车牌识别(LPR)系统是现代智能交通管理重要的一部分,是基于现代交通的快速发展的需求而成的。从技术的角度讲,车牌识别系统是一个涉及了数字图像处理、计算机视觉、模式识别
随着网络的飞速发展,各种基于网络的服务和应用的也日渐丰富,如WWW、FTP、E-mail等服务和校园网内各种与教学和科研有关的应用系统,同时,校园网用户数量也不断增长,网络在人
本文随着电路规模复杂度的急剧增加,功能规范中存在不一致性和不充分性的可能性增加;另外,采用自然语言的功能规范,语义模糊且不可执行。这样,不仅容易造成理解的二义性,而且很难确
在数字多媒体技术以及计算机网络飞速发展的今天,数字作品的非法侵权盗版和恶意篡改变得十分容易,这一系列数字化技术本身带来的负面效果,已经成为信息产业持续发展的一大障
随着信息和医学技术的发展,CT. MRI等数字化医疗设备在临床工作和辅助诊断中得以日益广泛的应用。这些设备使得医疗机构产生了大量的医学图像数据,在现代临床诊断和医学研究