连续K-支配SKYLINE查询算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户：wsptdy

【摘要】

：

近年来，skyline查询在多目标决策、数据挖掘、数据库可视化等方面得到广泛应用。然而在高维空间环境下，skyline查询因为返回的结果集过大而不能提供有用的信息。因此，学术界提出

【作者】

：

黄荣跃

【机构】

：

苏州大学

【出处】

：

苏州大学

【发表日期】

：

2012年期

【关键词】

：

Skyline k-支配skyline 查询多目标决策

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，skyline查询在多目标决策、数据挖掘、数据库可视化等方面得到广泛应用。然而在高维空间环境下，skyline查询因为返回的结果集过大而不能提供有用的信息。因此，学术界提出了k-支配skyline查询的概念。它通过弱化对“支配”的定义，使数据点间更容易产生支配关系，从而使结果集的大小保持在一个合适的范围内。在静态k-支配skyline查询问题上，现有算法要么存在建立索引开销太大问题；要么在高维空间中存在过多重复计算问题。而在连续k-支配skyline查询方面，现有算法中剪枝方式和分治策略都存在删除数据点后维护困难的问题。本文通过分析现有算法存在的缺点，结合k-支配skyline查询的内在特性，分别在静态k-支配skyline查询和连续k-支配skyline查询这两个方面提出了新的算法。本文的主要贡献可以分为以下几点：(1)提出了不支配关系的概念。两个支配能力弱的数据点之间不容易发生支配关系；两个支配能力强的数据点之间也不容易发生支配关系。本文通过计算数据点的支配能力，然后使数据点只和有可能与自己互相支配的数据点进行比较，避免与不可能产生支配关系的数据点进行不必要的比较，从而节省了大量的计算时间。(2)针对建立索引和不建立索引两类算法在进行静态k-支配skyline查询上存在的问题，本文提出了一种基于简化预排序的k-支配skyline查询算法。该算法的核心思想是引入平均数据点，并通过与之比较把各个数据点按支配能力大小进行分块，之后根据支配能力值对各分块进行排序。这样的排序不仅大幅度降低了预排序的时间，而且也很大程度减少了数据点间无意义的比较。(3)提出了准skyline点的概念。在连续k-支配skyline查询问题上，由于维护传统skyline点需要很大的计算量，所以使用传统skyline点来进行剪枝并不是很好的策略。本文提出的准skyline点的概念，准skyline数据集比传统skyline数据集更易于维护，并且其能发挥传统skyline数据集所具有的剪枝效果。因此引入准skyline思想能够很大提高k-支配skyline查询效率。(4)提出了保留支配关系的方法。由于在连续k-支配skyline查询问题上，任何数据点的更新都有可能影响到数据集的k-支配skyline点。如果每次数据点更新都重新计算k-支配skyline点是效率低下的。本文通过保留数据点之间一些重要的支配关系，当数据更新时能够很快的找到需要唤醒的数据点，从而提高了算法的时间效率。最后，通过理论分析和模拟实验使本文提出的新算法和现有算法进行比较，并进一步使本文提出的新算法应用到真实数据环境中，理论论证和实验数据都显示本文提出的新算法都比国内外现有算法更加高效。

其他文献

基于依存树核函数的语义角色标注研究

一直以来,自动语义分析是自然语言理解的主要目标之一,然而由于深层语义分析的复杂性,人们目前更关心浅层语义分析,一种简化的语义分析形式,它只分析与句子中谓词有关成分的

学位

语义角色标注依存句法分析卷积树核自然语言处理

基于tableau的数据记录匹配及一致性研究

数据质量已被公认为是数据管理的首要问题之一。针对数据质量管理领域的数据记录不匹配及不一致问题,本文分别从记录匹配检测及不一致修复两个角度出发,提出了基于CON模型的

学位

数据质量记录匹配不一致数据库tableau分支封闭值

基于扩展边集比较法的XML文档结构及语义相似性计算研究

由于有着标准化、简洁、结构严谨和可高度扩展等优点，可扩展标记语言XML在飞速发展的互联网中逐渐成为网络数据表示和交换的标准格式。现今网络上出现了大量的XML文档，这些文档

学位

扩展边集比较法文档结构语义相似性可扩展标记语言聚类分析

基于CPU-1GPU集群的HMM检索实现与优化

序列数据库搜索是生物信息学中的重要应用，具有计算密集型和可并行性的特点。由于生物技术的发展，序列数据库以指数增加，使得搜索越来越耗时，传统的计算机已经难以满足计算需求。

学位

序列数据库搜索图形处理单元生物计算可能性概率多机分布式处理

建筑物内行人流疏散动态演化博弈研究

随着人民生活水平的不断提高,城市化进程的不断加快,现代城市各类公共场所人口和资源不断集中,各种风险和非常规突发事件的威胁日益凸现。非常规突发事件引起的行人疏散过程

学位

行人疏散元胞自动机演化博弈

中文缺省识别研究

在不影响意思表达的情况下，为了语言的简洁明了通常会省略部分语言成分，这种现象称为缺省。缺省是一种常见的语言现象，在汉语中更加普遍。国内外对于中文缺省的研究起步比较早，但

学位

自然语言处理中文缺省识别机器学习句法分析树最小IP子树系统开发

基于粒子群的关联规则挖掘算法研究

关联规则分析是数据挖掘中最主要的分支,其主要目的就是为了挖掘存在于事务数据库中隐藏的关系或者联系。随着大数据的普及,传统的关联规则挖掘算法暴露出的问题越来越明显,

学位

数据挖掘关联规则粒子群优化算法动态关联规则灰色模型

基于空频域结合的双重图像水印算法研究

数字多媒体数据极易在网络上复制、伪造、传播，数据的版权验证保护问题随之凸显出来。数字水印技术因成为解决这一问题的有效方案而受到广泛关注。但是目前大多数水印算法是嵌

学位

双重数字水印contourlet变换图像融合脉冲耦合神经网络

重复数据并行化研究

当前，数据量的爆炸式增长使得对于存储的需求越来越大，而同时被存储的数据内部存在大量的冗余(例如数据备份系统生成的数据)，造成系统存储空间的浪费。重复数据删除技术的出现缓

学位

重复数据删除流水线协处理器吞吐率并行优化存储空间

唇读技术的研究与实现

随着多模态融合识别技术的飞速发展，唇读技术作为模式识别领域中的热点问题得以关注。唇读技术与指纹识别、虹膜识别、视网膜识别等相比，具有更加直接、便捷、适时的特点。唇读

学位

唇读技术图像识别图像处理卷积神经网络

连续K-支配SKYLINE查询算法研究

与本文相关的学术论文