数据流自适应查询处理技术

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liaotianeryi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,越来越多数据正以数据流的形式存在于各种各样的网络系统中,同时以数据流处理为中心的应用也越来越多。因此,针对数据流的查询处理技术在近年来得到了学术界的广泛关注。由于数据流的处理与传统的静态数据的处理有着巨大的差异,传统的数据库管理系统(DBMS)已经不能适应对高速、时变的数据流处理的需求。因此,专门针对数据流处理的数据流管理系统(DSMS)也就应运而生了。 DSMS面临的重大挑战之一是长时间连续查询和多变的系统环境和数据所带来的对系统在适应性上的特殊需求。学术界在这方面还主要处在研究探索阶段。目前对数据流的自适应查询处理最为成熟和最有发展前景的成果是Eddy系统。本文以DSMS的适应性为研究重点,在继承Eddy系统在自适应方面的优越性的基础上,作出了两方面的新贡献。一是对用于在Eddy中自适应地处理多路Join操作的SteM机制作出了重大的改进,提出按需探测的中间结果算法,实现了在保持原有的SteM算法的适应性的基础上,对中间结果进行适当的保留,从而在Join的匹配率较高的情况下,减少了重复计算,提高了系统吞吐率,同时也对原有的路由策略也进行了针对SteM机制的有益的改进。另一方面,针对原有的Eddy系统的适应粒度过细的缺陷,本文实现了对Eddy系统的适应粒度进行自适应地控制,使得Eddy系统在数据和环境相对稳定的情况下,减少了路由决策的开销,提高了系统性能,同时并没有削弱在数据和环境变化频繁的情况下系统的适应性。本文详细地描述了上述两方面改进的具体算法和实现机制,对算法的性能进行了分析,给出了有说服力的实验结果,并指出了未来的研究方向。
其他文献
目前互联网络的发展方向是基于资源全面共享的下一代网络即网格。网格是一个集成的计算资源共享环境,而实现网格资源共享的一个首要解决的问题是对网格服务资源的定义、注册
随着数据库技术和网络技术的发展,人们对数据资源共享的要求越来越高。多数据库系统为有效地集成多个分布、异构和自治的数据库提供了很好的解决办法,从而满足人们对数据资源
论文以并行计算模型为核心展开研究.并行计算模型为并行算法和并行计算机系统结构的分析与设计提供了具有指导意义的理论界面和模型框架,它是并行计算研究的重要领域.目前在
电子巡更系统是智能小区、楼宇安全防范产品中的一种,主要功能是监督巡更人员按计划认真地完成巡更任务,从而加强辖区的安全防范能力.实时电子巡更系统是电子巡更系统的一种
随着信息化建设在企业内部不断的发展与深入,越来越多的信息系统投入运行。但是这些在企业中成功实施的信息系统通常注重于解决某一个具体问题,在独自领域内运行,形成了众多的信
作为生物信息数据库的重要组成部分,生物信息分析系统的构建是当前生物信息学中的一个重要研究课题.随着生物信息学的发展,生物信息工具软件越来越多,很多可以免费获取,有的
随着Internet的飞速发展和移动计算日益广泛的应用,推动了对移动计算机无线接入的研究。像台式机用户一样,移动计算用户希望接入同样的网络,共享资源和服务,而不局限于某一固
随着Internet和电子商务的迅猛发展,越来越多的企业希望能够将自己的应用快速,有效地部署到Internet上去,从而达到提高工作效率,降低生产成本和为企业客户提供个性化优质服务的目
形式化验证已经成为对系统设计和协议设计进行确认的重要手段,其方法分为两类,一类是以逻辑推理为基础,另一类则以穷尽搜索为基础,穷尽搜索方法统称为模型检验.逻辑推理的不
本文介绍了“公安消防部队管理信息系统(网络版)”的整体设计,详细设计和其中权限管理模块、网络报表模块、网络统计模块的实现。 本系统是根据软件工程的开发标准,分析公安