数据流查询处理关键技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sunx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,许多应用领域均出现了一种称之为数据流的新型数据。与传统数据形式不同,数据流的特点是数据源源不断地产生,数据生成及传输的速度极快,并且数据分布未知。在应用中,人们需要对数据流进行实时地监测、查询和分析,以便及时准确地作出决策。传统的数据管理技术无法有效支持数据流上的查询处理,需要研究新的适合于数据流的查询处理技术。  本文研究数据流查询处理问题。针对各种常用的数据流查询类型,提出了相应的查询处理方法。研究内容包括数据流滑动窗口查询处理、数据流频繁项查询处理、多维数据流相似性查询处理、数据流隐私保护处理以及数据流查询处理原型系统。  本文的主要研究成果有以下几个方面。  (1)在滑动窗口查询处理方面,提出了更具一般性的γ粒度更新滑动窗口的概念,针对γ粒度更新滑动窗口查询,提出了三种连接查询实现算法和一种聚集查询实现算法,理论分析和实验结果表明这些算法具有很高的性能和效率。针对滑动窗口连接聚集查询,在分析了两种操作相关性的基础上,提出了IC和TC算法,使得查询处理的空间复杂度和时间复杂度均由O(N2)降为O(N),这里N为滑动窗口的势。IC和TC算法具有很强的可扩展性,能够处理各种复杂的滑动窗口连接聚集查询。提出了滑动窗口查询的并行处理框架,给出了滑动窗口查询操作的并行实现算法、查询处理算法以及在线的查询优化方法。滑动窗口查询的并行处理方法使得查询能够在数据流流速极快以及滑动窗口规模宏大的情况下,仍能正确地进行处理。  (2)在数据流频繁项查询处理方面,提出了EC算法来计算数据流∈近似频繁项。EC算法的空间复杂度为O(1/∈),平均每个数据项的处理时间为O(1),输出结果频率的最大误差为∈(1-s+∈)N,其中s为用户给定的支持度,N为数据流目前为止到来的元组个数。与目前已有的同类算法相比,EC算法最优。  (3)在多维数据流相似性查询处理方面,提出一种基于压缩结构CV的查询处理算法CVNN,与基于随机抽样的处理方法相比,CVNN算法返回结果的准确率更高并且速度更快。  (4)针对数据流个体隐私保护问题,提出了一种新的隐私保护性质(k+,l)?anonymity,其隐私保护的能力要强于目前的k?anonymity和l?diversity等性质。给出了KLAST算法来实现数据流上的δ?constraint(k+,l)?anonymity。理论分析和实验结果表明,KLAST有效地实现了数据流的隐私保护。  基于上述基础研究结果,本文作者设计实现了数据流查询处理原型系统HIT-PDS。HIT-PDS是一个并行查询处理系统,拥有很强的数据流查询处理能力和良好的可扩展性。HIT-PDS验证了本文所提算法的正确性和有效性。
其他文献
本文针对DNA数据库发展中出现的数据安全性问题(主要包括篡改提示问题和隐私保护问题)进行研究。针对DNA数据篡改提示问题,即:如何检验出对于DNA序列的人为恶意篡改,从而保证
在各种多媒体服务以及网络服务蓬勃发展的今天,仅仅开发传统的指令级并行性已经远远不能满足这些服务对微处理器的性能要求。线程级并行性的开发大大提高了处理器的性能和处
近年来,基本养老保险安全运行问题是研究基本养老保险可持续性的核心课题之一,而基本养老保险安全指标的研究成为基本养老保险可持续性的关键。目前,安全指标的研究主要集中在哪些安全指标对基本养老保险可持续性影响程度大,以及安全指标在实际中如何准确计算的问题,但由于缺乏权威数据及计算复杂度高等原因,目前这两方面的研究都处于初级阶段。本文针对上述情况,首先,在安全指标设计初期,以权威的基本养老保险安全指标体系
农业是国民经济的基础,但由于我国农业信息化、自动化水平不高、生产方式相对落后,所以农业并没有形成规模效应,从而难以开展有效的农业合作化生产,导致农业生产总体规模小、经济
计算机技术和无线通讯技术的发展与结合使得一种全新的计算模式—移动计算模式成为现实。在移动计算环境下,用户使用便携式移动终端通过无线通讯接口实现对网络的访问,而不受实
车间作业调度问题是制造系统的一个研究热点,在理论研究方面也是最为困难的问题之一,此问题具有约束性,非线性,不确定性和大规模性,已被证明调度问题是NP-hard问题,很难求得最优解
网格计算提供了一个底层的计算平台,该平台可支持各个体和组织间动态的、松散的、安全的和相互协作的资源共享。随着网格技术的不断完善和网格标准的不断统一,网格在集成分布
维修服务涉及到两类企业:制造企业和维修服务企业。在两者组成的维修备件供应链中,存在着供应链面临的共性问题:各企业如何协调、如何提高信息传递效率、如何消除需求变异等
随着微处理器、无线通信技术和微机电系统的发展,产生了无线传感器网络这一新的信息获取和处理模式。多个传感器节点通过无线通信、自组织方式构成网络,协同工作实时感知、获取
工作流是针对工作中具有固定程序的常规活动而提出的一个概念。通过将工作活动分解成定义良好的任务、角色、规则和过程来进行执行和监控,达到提高生产组织水平和工作效率的目