连续数据流上的聚集查询研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:SanMaker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络,电信和传感器技术的发展,数据采取的是多维的、连续的、随时间快速变化的流式数据的形式,数据流理论与技术成为数据库研究的一个新领域。如何在连续快速的数据流上进行聚集查询成为数据流理论中一个重要的研究方向。本文围绕连续数据流上的聚集查询展开讨论,首先针对数据流上的精确聚集查询问题,提出3种改进的基于滑动窗口的精确聚集查询算法,这三种算法可以在消耗很少内存的情况下提供高效准确的查询结果;其次讨论了连续数据流上的近似聚集查询问题,给出了基于数据流滑动窗口的直方图大纲理论,并提出了适用于滑动窗口的自适应直方图大纲生成算法和大纲同步策略;最后讨论了连续数据流上的预测聚集查询问题,提出了一种基于基本窗口及预测方程方法的预测聚集查询算法。根据上述理论,开发了一个名为Jasper的数据流管理原型系统,对SQL语言进行了扩充形成了可以支持连续查询、近似查询以及预测聚集查询语义的流式查询语言JasperCQ。实验结果表明提出的理论及算法均是正确的。
其他文献
文本数据挖掘技术是自然语言处理研究的重点问题之一,而工程图文档是工业技术中的重要数据媒体之一。在信息时代,同其他多媒体数据一样,工程图文档作为一种在网上共享传输的
随着现代企业的发展和扩展,对企业数据、信息进行整合和共享,实现企业信息一体化,从而增加产出,提高效率,满足客户不断变化的需求,已成为迫切需求。而如何实现异构数据源的集成和互
一个大型的软件系统,特别是在工程应用中,往往具有复杂的层次结构,因此大型软件系统都十分重视子系统间的集成问题。对于系统的集成化有不同的理解,就会开发出不同的集成系统
电网母线负荷预测可用于分析和预测电网各节点功率,预测结果是制定电力系统负荷调度方案的重要依据。它可用于详细分析电力系统的用电需求,预测未来系统中负荷的分布,从而帮助相关人员提前了解电力系统未来的运行状态,提早发现并消除系统中的安全隐患。同时,在电网母线负荷预测的基础上,提高调度精细化水平,加强调度规范化管理,促进电网安全、优质和经济运行。因此,母线负荷预测的研究至关重要。本文对母线负荷预测的研究分
蒙古语作为多数蒙古族同胞的日常交流语言,传承了其特有的历史文化。近年来,各语言文字都在加快信息化处理进程,而蒙古语却由于重视程度及资金投入不足等原因,导致其信息化发展较
信息时代的来临已经使Internet已成为一个重要的和无处不在的基础设施,与此同时,随着分布式多媒体应用需求的不断增长,以及Internet上商业化应用的飞速发展,对网络性能和服务
入侵诱骗系统是一种用来观测黑客入侵行为的系统,它是网络安全研究中的一个新兴领域,对提高网络的可生存性起着重要的作用。现有的诱骗技术在如何实现对真实网络的保护方面,在如
目前,基于网格技术的分布式计算已经在高性能科学计算和Internet商业应用中获得了很大的发展。伴随着对分布式计算需求的增长,国内外网格技术的研究重点从传统的集群计算转向
我们现在使用的互联网协议为版本4,即IPv4,地址采用了 32 位结构,意味着有大约40亿个地址。尽管我们利用CIDR (Classless Inter-Domain.Routing)允许以可变长分界的方式分配网络
对于异构数据集成的应用研究,随着计算机应用的迅速发展和企业应用需求的不断提升,已逐步成为当前计算机应用研究的一个热点。 本文在分析、比较若干原型系统优缺点的基础上