不完整数据的Skyline偏好查询研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户：heqigao

【摘要】

：

近年来,随着互联网、物联网的迅速发展,数据产生方式日益多样化的同时数据可用性问题日益突出。数据可用性的一个重要方面是数据完整性,由于机器故障、隐私涉及、人为错误和

【作者】

：

石展

【出处】

：

辽宁大学

【发表日期】

：

2004年期

【关键词】

：

不完整数据 Skyline查询用户偏好聚类数据集划分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着互联网、物联网的迅速发展,数据产生方式日益多样化的同时数据可用性问题日益突出。数据可用性的一个重要方面是数据完整性,由于机器故障、隐私涉及、人为错误和信息自动化提取整合技术的广泛使用,不完整数据普遍存在。如何从不完整数据中高效的获取用户所需的信息成为我们亟需解决的重要问题。Skyline查询可以为用户提供有效的决策分析以及符合用户偏好的查询结果,可以应用在多目标决策、环境监测、市场分析和数据挖掘等多个领域中。数据清洗、修复等预处理是一种常见的不完整数据处理方法,再在清洗修复后的数据集上进行各种查询操作。这类方法不仅会产生巨额代价而且会引入新的‘噪声’,导致查询效率低、误差大,查询结果不能满足用户需求。目前,从不完整数据中获取个性化信息缺乏高效准确的处理策略。本文提出了一种不完整数据的Skyline偏好查询算法(Skyline preference query based on incomplete dataset,以下简称SPQ-I算法),在不完整数据集上基于用户偏好提取个性化信息的同时提高Skyline查询效率。首先,对划分后的数据集按照不同的重要程度分别进行不同的聚类,聚类过程中把被支配的元组剪枝,缩小Skyline查询空间;然后,对聚类得到的两个查询子空间分别执行查询准确度高的基于数据元组排序的Skyline查询算法和简化高效的基于支配程度计算的Skyline查询算法,得到两个局部Skyline查询结果集;最后,根据两个结果集的交集是否为空进行全局Skyline查询结果的选择,如果交集不为空,交集作为全局最优解返回给用户;如果交集为空,进行基于泛化中心的次优解选择。大量实验结果表明,本文提出的SPQ-I算法可以根据不同的用户偏好分别得到符合用户需求的查询结果,确保了查询准确度,与SIDS算法和CDSkyline算法相比在处理高维不完整数据时查询性能更优。

其他文献

股骨干骨折的康复与护理

股骨干骨折是指转子下,股骨髁上这一段骨干的骨折,是临床常见的创伤疾病。股骨干是人体最粗、最长、承受应力最大的管状骨,容易出现多种并发症,其影响因素繁多。自2002年以来

期刊

股骨干骨折心理护理康复治疗钢板螺钉固定股骨粉碎性骨折平均住院天数护理知识宣教临床资料

旱育超稀植浅水灌溉试验研究介绍

以绥滨县傲来灌区试验站为例，介绍了旱育超稀植浅水灌溉试验研究。

期刊

旱育超稀植灌溉试验研究

浅析黑龙江省节水灌溉发展方向

针对黑龙江省水土资源特点及节水灌溉现状进行了分析，并提出了黑龙江省节水灌概发展方向。

期刊

黑龙江省节水灌溉发展方向坐水点灌

高三体育生铅球训练初探

【摘要】原地推铅球是大部分高考体育考生必考的项目之一，也是容易失分项目。大部分考生到高二下学期或是高三上学期才开始接触原地推铅球的训练，也是造成成绩不佳的原因之一。本文粗略阐述影响体育生铅球成绩因素及解决办法，从而为高三师生提供一定借鉴。　　【关键词】体育生；力量；速度；铅球　　【中图分类号】G63.23【文献标识码】A【文章编号】2095-3089（2016）13-0-01　　原地推铅球是

期刊

体育生力量速度铅球

浅析湿室型泵房的两种结构型式——墩墙式和排架式

湿室型泵房是农田灌溉和摔水泵站经常采用的结构型式．墩墙式和排架式是温室型泵房的两种常用的结构型式。本文对墩墙式和捧架式泵房的优缺点及适用条件进行了探讨．

期刊

架式温室农田灌溉结构型式泵房排架水泵站优缺点适用条件

加快水利建设促进农业发展

简要介绍了宝泉岭垦区人民历年与洪、涝、旱灾害斗争的实践中．充分认识到水利基础设施和基础产业工作的重要性，通过增强水利基础设施建设．增加水利资金投入和加强田间水利工程配

期刊