不完整数据的Skyline偏好查询研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:heqigao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网、物联网的迅速发展,数据产生方式日益多样化的同时数据可用性问题日益突出。数据可用性的一个重要方面是数据完整性,由于机器故障、隐私涉及、人为错误和信息自动化提取整合技术的广泛使用,不完整数据普遍存在。如何从不完整数据中高效的获取用户所需的信息成为我们亟需解决的重要问题。Skyline查询可以为用户提供有效的决策分析以及符合用户偏好的查询结果,可以应用在多目标决策、环境监测、市场分析和数据挖掘等多个领域中。数据清洗、修复等预处理是一种常见的不完整数据处理方法,再在清洗修复后的数据集上进行各种查询操作。这类方法不仅会产生巨额代价而且会引入新的‘噪声’,导致查询效率低、误差大,查询结果不能满足用户需求。目前,从不完整数据中获取个性化信息缺乏高效准确的处理策略。本文提出了一种不完整数据的Skyline偏好查询算法(Skyline preference query based on incomplete dataset,以下简称SPQ-I算法),在不完整数据集上基于用户偏好提取个性化信息的同时提高Skyline查询效率。首先,对划分后的数据集按照不同的重要程度分别进行不同的聚类,聚类过程中把被支配的元组剪枝,缩小Skyline查询空间;然后,对聚类得到的两个查询子空间分别执行查询准确度高的基于数据元组排序的Skyline查询算法和简化高效的基于支配程度计算的Skyline查询算法,得到两个局部Skyline查询结果集;最后,根据两个结果集的交集是否为空进行全局Skyline查询结果的选择,如果交集不为空,交集作为全局最优解返回给用户;如果交集为空,进行基于泛化中心的次优解选择。大量实验结果表明,本文提出的SPQ-I算法可以根据不同的用户偏好分别得到符合用户需求的查询结果,确保了查询准确度,与SIDS算法和CDSkyline算法相比在处理高维不完整数据时查询性能更优。
其他文献
股骨干骨折是指转子下,股骨髁上这一段骨干的骨折,是临床常见的创伤疾病。股骨干是人体最粗、最长、承受应力最大的管状骨,容易出现多种并发症,其影响因素繁多。自2002年以来
以绥滨县傲来灌区试验站为例,介绍了旱育超稀植浅水灌溉试验研究。
针对黑龙江省水土资源特点及节水灌溉现状进行了分析,并提出了黑龙江省节水灌概发展方向。
【摘 要】 原地推铅球是大部分高考体育考生必考的项目之一,也是容易失分项目。大部分考生到高二下学期或是高三上学期才开始接触原地推铅球的训练,也是造成成绩不佳的原因之一。本文粗略阐述影响体育生铅球成绩因素及解决办法,从而为高三师生提供一定借鉴。  【关键词】 体育生;力量;速度;铅球  【中图分类号】G63.23【文献标识码】A【文章编号】2095-3089(2016)13-0-01  原地推铅球是
湿室型泵房是农田灌溉和摔水泵站经常采用的结构型式.墩墙式和排架式是温室型泵房的两种常用的结构型式。本文对墩墙式和捧架式泵房的优缺点及适用条件进行了探讨.
简要介绍了宝泉岭垦区人民历年与洪、涝、旱灾害斗争的实践中.充分认识到水利基础设施和基础产业工作的重要性,通过增强水利基础设施建设.增加水利资金投入和加强田间水利工程配
现代工业生产过程中,可燃气体的爆炸事故频繁发生,造成大量的人员伤亡和严重的财产损失,可燃性气体爆炸灾害己逐渐成为安全工程领域关注的重点。对于管道内可燃气体爆炸,爆燃
心率变异性(Heart Rate Variability,HRV)是指心电信号中RR间期的变异,其中蕴含着丰富的病理信息,是反映心脏活动以及神经调节的重要因素。近几年的研究表明,心率变异性可以
防洪工程经济分析方法简述赵洪田,勾智慧,平达(黑龙江省水利厅哈尔滨市150081)防洪工程的经济效益属于社会公益,工程本身不能直接创造财富。但在大中型水库的规划设计中,根据工程的重要性
介绍了旱田治涝和以稻治涝的区别及可比性.通过投入的对比,产量和经济效益分析,认为以稻治涝更适合三江平原低湿地和低产田治理。