基于四叉树的Skyline查询算法

来源 :兰州大学 | 被引量 : 0次 | 上传用户:adiwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline查询作为数据挖掘的重要分支,广泛应用于多标准决策、可视化和用户参考查询等领域。近年来,在数据库和信息检索研究领域,有效计算Skyline的问题已经引起国内外研究者的广泛关注。现有的技术主要是对数据实行批处理和在线处理,采用的划分方法主要为物理划分或根据分段的维值进行划分,并没有对被划分的各部分间所固有的特性进行深入分析。在本文中,我们首先分析了四叉树索引机制的结构特点,然后根据其特点系统地提出了一种基于四叉树的新的Skyline查询方法——QBSQ算法。QBSQ算法利用四叉树的结构特性,动态的对数据集进行划分,并且在构造树的过程中删除被树中结点支配的数据点,同时还深入研究了划分后各区域间以及数据点之间的支配关系,通过分析可知某些区域之间不存在支配关系,由此可减少区域间及数据点之间不必要的支配检查。该算法由于实现了有效的过滤和减少了不具有支配关系的区域内数据点之间的支配检查,提高了执行效率。此外,还针对QBSQ算法在高维数据空间上存在的不足提出了一个改进算法QBSQ~*,该改进算法利用低维空间划分高维空间的方法来解决高维空间Skyline查询问题,节省了内存空间的占用,增加了高维空间Skyline查询的可行性。最后,在多个测试数据集上进行了实验验证,实验结果表明了QBSQ算法及其改进算法QBSQ~*的正确性和有效性。
其他文献
信息技术和网络的迅猛发展已经使当今社会进入了多媒体时代。数字图像以其直观、容易理解的特点,为人类构建了一个形象具体的思维模式,帮助人们学习和思考问题,这对图像的管
粗糙集理论由波兰科学家Z.Pawlak于1982年提出的一种处理模糊和不确定知识的数学工具。粗糙集理论建立在论域中的不可分辨关系之上,用上、下近似来描述概念,不依赖于所需处理
随着XML在移动计算中应用的迅速普及,对于XML访问和传输的效率要求越来越高。因此,在移动计算环境中高效地访问和传输XML文档成为当前研究的热点。在移动计算环境中,数据广播
P2P网络中的资源定位问题是一个开放性的问题,应该针对具体的应用设计性能更优的定位方法来实现系统。当然,关于各种定位方法性能上的优劣分析为P2P网络设计更优的定位方法具
随着互联网和多媒体技术的发展,网络服务器提供了大量的图像,给后续的图像处理和分析带来极大地挑战。人类视觉系统可以很容易地判断图像中的显著性区域,并注意到图像的重要
随着工作流的不断发展,出现了多种工作流语言和服务编排语言,而每一种服务编排引擎只执行一种语言,缺乏可移植性。因此,在实现科学研究的流程化和自动化的同时,如何高效地利用分布
在我们实际的嵌入式的开发之中,真实的嵌入式硬件开发环境跟嵌入式的仿真开发的环境还是很有差别的情况的,我们在开发的最后不能够完全依靠仿真开发平台,实际的情况还是要在最后
本文主要对无线传感器网络的路由协议进行研究,并针对无线传感器网络的能量受限特性,着重研究路由协议中的层次路由协议——LEACH及在其之上发展的诸多协议。本文提出的基于
随着计算机网络的不断发展,互联网已经成为了人类社会主流的一个重要组成部分。人们希望互联网能够不断地提供应用所需的各种网络服务。特别是,以视频会议、视频点播、远程教
推荐系统作为一个高效的信息过滤工具,已广泛应用于电子商务和社交网络等诸多领域。然而,当前一些称为“水军”的恶意用户为获取不正当利益,往往通过伪造用户行为影响推荐结