基于索引的高效K支配Skyline查询算法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wafh000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的到来,数据库技术不断发展,数据库中存储的数据量急剧增加,如何从海量数据中找出人们最感兴趣的信息,为人们做出有效的决策服务,成为了一项重要的研究课题。Skyline计算就是从一个数据库中抽取不被其它任何数据对象支配的数据对象集合。因为在多目标决策、数据挖掘、数据库可视化等方面的潜在应用,近年来Skyline计算引起了越来越多研究者的关注。   随着空间维度的增长,不仅导致了Skyline点计算的难度增加,同时,当得到的Skyline点数量不断增长时,Skyline查询带来的价值也逐渐减少,对于用户作出决策无法提供准确、直观的依据。K-支配Skyline的出现目的就在于从高维数据空间中如何找出更具有意义的Skyline。本文在研究了Skyline查询的国内外研究现状的基础上,针对现有K-支配Skyline查询算法存在的不足,提出了基于排序索引的K-支配Skyline查询算法,并通过实验验证了该算法的高效性。   本文主要从以下方面作出贡献:   1.集中研究了国内外Skyline查询算法及其扩展应用的研究现状,分析了高维环境下K-支配Skyline查询能得到更有意义的结果集,针对现有K-支配Skyline查询算法的不足,提出了相关的取点排序优化策略和剪枝策略。   2.基于排序索引,本文提出了相关定理,基于这些定理和优化策略,提出了高效K-支配Skyline查询算法,并着重分析了算法的渐进性和正确性,同时对算法在时间和空间上的性能也进行了分析。   3.设置实验对上述算法进行验证,实验中采用了两种数据进行验证:人工合成的数据和真实的NBA球员数据。通过分析实验结果发现,基于索引的K-支配Skyline查询算法能渐进地返回完整的Skyline结果,在各种影响算法性能的因素变化情况下均能保证查询结果准确有效。
其他文献
本文研究时延最小花费在线匹配(MPMD)问题,其中请求以在线的形式到来,算法需要实时地进行决策,使得请求在尽量短的时间内两两匹配。不同类别的请求匹配会产生空间开销,延迟匹配会
随着计算机科学的不断发展,越来越多的人机交互系统开始采用人脸这种新颖的生物特征作为其交互的依据,如人脸识别、人脸确认和人脸表情识别。相比指纹,依靠人脸生物特征的系统由
随着我国经济的高速发展,环境污染问题日益突出,已经对生态系统、食品安全、人类生存构成严重的威胁,环境保护刻不容缓。作为环保工作的数据来源、污染度量、决策管理的依据以及
未知环境中的机器人地图探测问题是机器人领域的关键问题之一。随着机器人应用范围的不断扩大,对机器人在未知环境中自主完成相应的任务需求越来越多,而在未知环境中进行自主地
科技发展日新月异,如今互联网已经延伸到了我们生活的每个角落,它改变了我们的生活方式。但是在互联网带来巨大生产力效应的同时,大量不良黄色淫秽信息充斥着网络空间。其中图像
内存空间始终是计算机系统最重要的资源。有限的内存资源需要小心保存和适时回收。对内存空间最主要的耗费一般就是创建对象。当应用程序不再需要使用创建的对象时,就需要释放
在信息安全越来越难以保证的今天,操作系统易用性和安全性的矛盾日益突出,主流操作系统虽有很好的易用性,但是其安全性不强;而自主设计的安全操作系统因应用软件的不足而表现出较
统计学习理论是基于有限训练样本情况下的机器学习理论,通过控制学习机器的复杂度从而实现对学习机器推广能力的控制。支持向量机是基于统计学习理论的一种新的机器学习方法,它
Fuzzy C-Means(FCM,模糊C均值聚类)属于基于划分的聚类算法类别,自算法提出至今已40余年,众多学者深入研究发展出大量改进型算法,被用以分析处理来自各行各业、种类繁多的数
随着嵌入式技术的发展和无线通信技术的广泛应用,以移动智能终端为载体的移动地理信息系统(Mobile GIS)已成为地理信息系统研究的热点。嵌入式GIS是集导航、定位、地图查询和空