不确定Skyline查询处理关键技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:JasonCrazy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类社会的进步和计算机网络技术的发展,数据信息与物质和能量并列成为世界三大资源。在现今信息爆炸的时代,为了从大规模数据中提取关键信息,迫切需要高效的查询处理技术。Skyline查询作为一种重要的数据管理操作,它在多目标决策支持、环境监控、数据分析、GPS导航等领域发挥着重要的作用。此外,在众多实际应用如传感器网络、基于位置服务(LBS)、射频识别电子标签(RFID)和Web服务中,由于数据采集设备的局限、隐私保护的需求或网络传输延迟等原因,数据广泛具有不确定性。不确定数据处理技术业已成为数据库研究领域的重要研究热点。为此,本文针对不确定Skyline查询相关技术进行深入研究,主要工作和创新点如下:  (1)研究了分布式环境下的不确定Skyline查询问题。现有的分布式不确定Skyline查询算法中定义的近似全局Skyline概率不适用于局部查询结果间存在支配关系的情况、未考虑最小化总的查询时间、且每次迭代过程中最多只能返回一个最终查询结果。为此,本文从提高算法的通用性、效率和渐进性出发,首先提出了一种新的分布式不确定Skyline查询处理框架;其次设计了一种自适应的分布式不确定Skyline查询算法;最后大量的实验结果表明本文算法的性能显著优于已有算法。  (2)研究了基于不确定数据的静态Skyline查询问题。现今最通用的不确定Skyline查询定义(P-skyline查询)中返回的查询结果取决于选取的概率阈值,且结果集中包含不理想的数据点。此外,处理大规模数据或高维数据时,P-skyline查询常返回大量结果,从而不能为用户提供有效的决策支持。为此,本文首先基于传统的不确定Skyline查询定义,提出了一种新的不确定Skyline(MPS)查询;其次提出了有效的MPS查询算法;接着探讨了基于规模约束的MPS(MMPS)查询,并将MPS查询算法进行扩展用于解决MMPS查询;最后通过大量的实验验证了算法的有效性和可扩展性。  (3)探讨了基于不确定数据的动态Skyline查询问题。动态Skyline查询能够依据用户的个性化偏好,筛选出更加满足用户需求的产品信息。不确定数据的动态Skyline查询的研究还处于起步阶段,且已有的不确定数据的动态Skyline查询返回的结果取决于概率阈值,时常返回不理想的查询结果。为此,本文形式化定义了一种更通用的不确定数据的动态Skyline查询,依据其特性提出一系列有效的剪枝策略和查询算法,并通过理论分析和实验验证了算法的有效性和可扩展性。  (4)探讨了基于规模约束的不确定动态Skyline查询。不确定动态Skyline查询在处理大规模或高纬度数据时,时常返回大量的查询结果,从而不能为用户提供有意义的启发信息。为此,本文研究了基于规模约束的不确定动态Skyline查询。首先形式化定义了一种基于组用户偏好的查询操作,即Top-k用户最满意的产品(TFPP)查询;其次为了有效处理TFPP查询,提出TFPP算法及并行TFPP(ParTFPP)算法;最后从理论分析和实验验证两个方面证明了所提算法的有效性和可扩展性。  本文工作不仅具有一定的理论价值,丰富了数据管理方面的研究内容,而且推动了不确定数据管理的实用化进程,具有巨大的应用价值和实际意义。
其他文献
随着计算机教育的不断发展,程序设计教学作为计算机基础科学教育的核心课程正在受到越来越多的重视。近些年来,国际大学生程序设计竞赛(ACM International Collegiate Progra
目前嵌入式系统已经广泛应用在航天、航空、工业机器人、系统控制等领域,然而,海量数据处理对嵌入式计算系统提出了更高的要求。为了开发更高性能的嵌入式系统,并行计算成为
由于网络技术发展迅速,不管是在什么时间什么地点全部能够接收到所需要的信息时现在人类的基本要求,这就是移动计算技术产生的原因。由于移动计算的环境以及固定计算的环境的
随着地铁监控系统集成和互联专业的多样化,其信息模型也越来越复杂。基于关系模型的实时数据库在描述监控系统复杂对象时显得无能为力,而且对适应不断演化的客观系统缺乏灵活
当今,传统测验越来越不能满足社会的需求,因为它只能提供给被试一个笼统的分数或能力,对于考生具体的知识状态无法获知。与传统测验相比,认知诊断测验的优势就在于它能够揭示每个
随着后信息时代的来临,人们对空间信息服务的获取速度、高清分辨率、海量资源提出了更高的需求,G/S模式(Geo-Information Browser)和空间信息服务器(Spatial Information Ser
指纹具有唯一性、可靠性和稳定性的特征,在身份鉴别认证领域得到了广泛的应用,其商业应用也越来越成熟。从指纹图像中提取高质量的指纹模板,并且实现高识别率和鲁棒性的基于
信息技术的发展,为虚拟水稻的研究提供了新的方法和手段,利用计算机系统、结合水稻的生理生态过程可以模拟出符合水稻生长规律的具有机理性、更真实的虚拟水稻。   本文在研
学位
随着网络技术的不断发展,Web应用系统扮演的角色越来越重要。基于B/S结构的Web应用程序也成为Internet上使用最为广泛的应用开发技术。在Web技术发展的过程中逐渐产生了大量
人类视觉系统能够轻易地辨认各种物体,然而对计算机来说这并非一件容易的事。作为计算机视觉领域中一个研究的热点和难点,图像分类和识别问题长期以来受到了众多学者关注,具