不确定数据流查询处理算法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:zhengjjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展及人们对查询处理方法认知的加深,不确定数据受到普遍重视,不确定数据的查询处理方法也在很多领域普遍运用。对不确定数据流的查询研究逐步成为数据库领域的热门研究问题之一。本文研究了三种不确定数据流的查询处理算法,分别是分布式不确定数据流的top-k聚集查询算法、不确定数据流的概率skyline查询算法和不确定数据流的聚类算法。Top-k查询技术常用于传感器网络。如今的查询技术大多采取集中式的查询处理形式,时间开销与通信开销较大。针对这一问题,本文研究在分布式环境下不确定数据流的top-k聚集查询算法。首先根据元组数量提出三种聚集算法,然后根据这三个算法提出了一个混合的解决方案,基于混合的解决方案给出top-k聚集算法DAT的框架。实验结果表明DAT算法既能在满足精确度需要的同时降低时间开销,又能在通信开销上好于集中式查询。作为多标准决策等问题的解决方式,skyline查询处理常用于市场分析、目标决策等实际应用。根据现有skyline查询算法的优势和局限性,对于枚举计算方法的低效问题提出一个高效的概率skyline查询算法PSUDS。该方法用自底向上算法得出初步的结果集,然后用插入算法和删除算法对结果集进行更新和维护。不同参数值对p-skyline大小和运行时间的影响结果显示,PSUDS具有良好的扩展性。与Baseline算法进行比较可以看出PSUDS具有较高的效率。聚类方法在数据流上广泛应用,但大部分针对确定数据流。虽然有一些是在不确定数据流上的算法,但算法中大多没有考虑数据的分布。针对这一问题,本文引入KL距离(相对熵)的概念,提出高效的不确定数据流聚类算法KL-Micro。实验结果表明KL-Micro算法充分考虑了不确定数据分布情况,提高了聚类结果质量,具有较高的准确性及效率。通过实验及分析可以得出,以上不确定数据流的查询处理算法精确度较高且具有高效性,具有实际应用价值。
其他文献
随着医疗信息化的不断发展,很多医院建立了各种医疗信息系统,保存着大量的医学临床数据。有效的利用这些数据,能够为急性传染病、慢性病和地方性疾病的预警、预报和跟踪提供
随着互联网的飞速发展,大规模社会网站变得非常流行,受到了广大学者的研究与关注。社会网中蕴含着大量的信息,在多个领域都有重要的应用。本文研究了社会网上的影响传播问题,
火电厂实时监控信息系统是近年来电力企业信息化发展的重要举措,为该系统提供数据支持的数据预处理技术则是该系统可靠、科学运行的关键技术之一。目前,对稳态过程的数据预处理技术研究已较为完善,而针对火电厂等实际测量过程为动态过程的动态数据校正技术仍未能够形成一套合理可行的解决方案。因此,对动态数据预处理技术的研究,不仅具有理论创新的意义,同时还有利于众多实际生产过程中监控技术和优化技术的进一步发展。动态数
P2P技术是一种对等计算技术,以P2P技术为基础的网络系统在运行时形成P2P网络。在P2P网络中,每个节点同时具有服务器和客户机的双重功能,可同时作为服务的提供者和使用者,是一
随着现代科学技术以及网络技术的快速发展,基于互联网的各种信息系统日益受到人们青睐,发挥出了重要作用。XML因其具有自描述性、可扩展性以及开放性等优点已经成为网络上信
未来网络的发展趋势必然是多种无线接入网络共存,因此,异构接入技术之间的互联互通成为未来网络中的研究热点之一。而UMTS网络与WLAN网络是部署最为广泛的两种无线接入网络,许多
随着无线通信技术和移动终端在人们日常生活中的高度普及,基于位置信息的各种应用也逐渐成为了室内定位领域的研究热点之一。然而在室外定位中表现突出的GPS却受墙体遮挡影响
随着网络技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、最广泛使用的信息库,如何有效检索这些海量信息成为当前重要的研究课题,因而信息检索(InformationRe
计算机网络的应用不仅为人们的生活和工作带来了方便,也为计算机病毒的发展和不健康信息的传播提供了一个更广大的空间。虽然杀毒软件和防火墙方面的技术已进行了深入的研究
现代农业的发展使农业种植的区域更加集中,规模更大,品种更多,一部分野生农作物的培育还必须在野外。这给农业技术人员的种植培育增加了难度和管理成本。在深入研究无线传感器网