基于索引的k-支配skyline算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:juejiang12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline查询是近年来数据库和数据挖掘领域的一个研究热点。给定两个d维的数据点p和g,如果点p在所有维上的取值都不比点q差,并且在至少一个维上取值比g好,则称点p支配点g。一个数据集的skyline定义为该数据集上不被任意其它点所支配的数据点集合。Skyline查询在多标准决策的应用中具有重要意义。 随着数据集维数的增加,数据点之间形成支配关系的可能性越来越小,导致了skyline数据集变得过大而无法提供任何有效信息。为了在高维数据集中找到更重要和更有意义的skyline点,有学者提出k-支配skyline的概念。由于k-支配skyline的特殊性质,传统的skyline算法不能适用于k-支配skyline查询,而现有的k-支配skyline算法在时间效率、空间复杂度和渐进输出性上都存在不足。 根据传统skyline的预排序过滤算法的思想,本文提出了一种基于索引的高效k-支配skyline算法,在时间效率、渐进输出性和空间复杂度三个方面部比现有算法有提高。通过为数据集建立两个索引表:关于数据点k-支配能力的索引和数据点成为k-支配skyline点可能性的索引,算法在计算过程中不需要保留中间结果数据集,从而可以保持稳定的低空间开销。根据建立的索引,算法能够优先处理并返回部分结果数据点,使得算法具有良好的渐进性。同时在判定数据点是否属于k-支配skyline时根据索引能够尽可能减少比较次数,经过实验证明本文提出的算法在时间效率上比现有的算法具有更优秀的性能。
其他文献
随着软件行业的发展,软件的复杂程度不断提高,人们需要一种方法来总结和重用良好的软件设计。设计模式是针对特定场景下的特定问题的可重复、可表达的解决方案,是对成功设计经验
细胞自动机具有演化规则简单、相互作用局部化和信息处理高度并行的特点。将细胞自动机的动力学系统复杂特性应用于密码技术当中,具有非常重要的研究价值。 本文在前人学者
随着网络化、信息化、全球化的新经济时代的到来,电子商务逐渐渗透到经济生活中的各个领域中,而互联网上的安全问题也日益突出。目前,公钥基础设施(PKI,Public Key Infrastru
互联网的高速发展导致微博、新闻和博客等网络数据呈现爆炸式的增长。管理并利用这些海量级数据成为一大难题,主题模型是解决该难题的有效方法之一。主题模型通过对文档进行
学位
由于电子技术的进步以及实际应用的迫切需要,无线传感器网络在近几年得到较快的发展。TinyOS是其上最流行的操作系统。当前无线传感器网络的软件测试手段主要是模拟测试。无线
软件体系结构的设计是软件生命周期的两个最为关键的活动之一,它代表了系统和公共的高层次抽象。它一般通过建模语言来表示,这一过程称为软件体系结构的形式化描述。如何根据
图像认证技术是确保图像信息真实性的有效手段,它通过主动或者被动的方法,对数字图像的真伪进行识别。传统的主动认证方法,如数字签名或水印,需要预先在图像中嵌入签名或水印,会使
中国移动的市场经过近几年的发展,已具备相当的规模,也蕴藏着巨大的增长潜力;同时,移动行业也面临着前所未有的机遇与挑战,移动公司必然要通过强化内部管理,强化科技进步和技
随着信息的爆炸性增长,中小型企业也需要有存储容量可扩展而价格成本相对低廉的存储解决方案来保证业务系统的正常运行,避免自然灾害和人为灾难给企业造成重大损失。本文结合中