分布式数据库下数据水平分布的skyline计算研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ccll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline计算就是从一个数据集中找到不被其他数据点支配的所有点的集合。如果一个数据a支配另一个数据b,那么a的每一维属性值都不比b对应属性值“差”,而且必须至少有一个属性值比b的“好”。“差”和“好”无统一定义,可以根据用户的选择和喜好定义。近年来,skyline计算逐渐成为数据库领域的一个研究热点,主要是因为它在多标准决策、数据挖掘和数据库可视化等领域有潜在的应用前景。对于集中式数据库下的skyline计算的研究已经比较成熟,分布式数据库下的skyline计算由于起步较晚,现有的研究成果仍不够成熟。本论文主要研究的是分布式数据库下数据呈水平分布时的skyline计算的问题。数据的水平分布指的是数据集合分散的存放在不同的服务器上。论文的主要工作包括以下几个方面:(1)研究各个服务器上的局部skyline集合与全局skyline集合之间的关系,提出通过汇总局部结果再次计算得到全局skyline集合的思想。(2)为了提高计算效率,提出了一种“区域划分和多窗口收集”的优化策略。论文深入讨论了区域划分的思想及不同服务器上划分区域之间的支配关系,给出了三维数据空间下的基于“区域划分和多窗口收集”的skyline计算算法。(3)进一步讨论了对高维数据空间下进行区域划分可能出现的一些问题,提出只对数据的前三维进行区域划分的不完全划分思想和skyline计算的解决方案。(4)进行了大量的实验,通过实验结果分析得出论文提出的“区域划分和多窗口收集”策略对提高分布式数据库上的skyline计算效率有一定的效果。
其他文献
随着科学技术的发展和进步,人类航天活动也越来越频繁,深空探测越来越受到各个国家的重视,近年来我国对深空探测也加大了投入。开展深空探测对于科技进步和人类文明的发展有着促
学位
数据库入侵检测技术是数据库安全的重要组成部分。目前的入侵检测系统采用模式匹配方法,虽然对已经存在的攻击具有很高的检测效率和正确率,但对很多未知的入侵攻击行为和方法
当今,Web应用已经成为人们获取信息、交流情感、开展工作、处理日常事务等的重要工具。它们改变了、并正在改变着人们的生活方式。为确保Web应用拥有者和使用者的利益必须开发
随着计算机与信息技术的发展,数据挖掘技术已经广泛应用到人工智能、模式识别、生物信息等许多领域。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理
复杂网络可以用来描述社会关系网络、生物网络、通信网络、网页链接关系等真实网络。从20世纪90年代,复杂网络概念提出之后,很多不同领域的研究者都开始关注复杂网络的研究,但是
工业生物技术知识环境建设及其e-Science应用是中国科学院信息化专项项目,本文即是以工业生物技术知识环境建设为项目背景展开。   工业生物技术(Industrial Biotechnology
概念知识是根据面向对象原理定义词汇涵义。本文提出此方法,以属性名及属性值定义一个词,将某一领域内的词汇构成层次或继承关系图,并按照表的形式将此图存储于数据库中,由此
本文以提高回归测试成本效益为目标,对黑盒测试集优先化技术展开研究。成功软件在整个生命周期中会经历持续变更,造成回归测试频繁发生且开销巨大。提高回归测试成本效益一直是
随着数据库的广泛应用和发展,人们不再仅仅满足于一般的数据存储和业务处理,而对系统提出了更高的要求:提供决策支持。目前,数据库已经广泛投入到了各行各业的应用当中,作为数据库
学位
随着信息技术的发展,计算机网络已经成为人们日常学习和工作中必不可少的一部分,其安全性得到了越来越多的重视。然而由于计算机系统的复杂性以及利益的驱使,攻击始终没有间断过