非完整数据库中的Skyline查询研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:LUEYONGS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据不完整是web异构数据库、多关系数据库和时空数据库中普遍存在的问题。Skyline查询作为一种能够满足用户多目标决策需求的数据库操作,在多目标实时决策系统、数据挖掘、电子商务和推荐系统等领域中有着巨大的应用价值。目前非完整数据库中的Skyline查询存在着支配性丢失和结果集过小或不具参考性等问题,概率Skyline可以有效解决上述问题,因而研究非完整数据库中的概率Skyline查询具有重要的意义。
  针对当前非完整数据库概率Skyline查询研究在多关系、动态数据库和离散型数据上的不足,本文主要做了如下工作:
  (1)目前非完整数据库中的概率Skyline查询仅关注于单关系的研究,并未考虑查询涉及到多关系的情况。本文对于非完整数据库中的概率Skyline查询定义进行了扩充,并提出能有效处理多关系 Skyline 查询的算法,该算法通过多层次分组、全局 Skyline 概率下界及局部Skyline上界对Skyline概率计算进行了高效的剪枝。通过多个维度与现有算法的对比,验证了算法的可用性。
  (2)针对当前算法不能有效处理动态非完整数据库中的概率Skyline查询问题,本文给出了在数据集状态发生变化时更新Skyline概率的方法,并提出了一种在数据库状态发生变化时高效更新Skyline结果集的算法。该算法利用支配链与被支配链高效维护数据项的Skyline概率上界及Skyline概率。此外,利用预排序快速定位受影响数据集合,进一步提升算法效率。
  (3)在解决连续型数据集中概率Skyline查询的基础上,进一步研究了离散型数据集中的Skyline查询问题。为非完整数据集中的离散型数据建立概率支配模型,基于该模型提出能有效处理离散型数据集Skyline查询的算法。该算法利用桶划分及Skyline概率上下界大幅减少了支配计算。此外,给出了一种缺失数据填充方法,并验证利用该填充方法可以预判数据项间的Skyline概率大小关系并减少支配计算,从而提高算法效率。
其他文献
随着图像领域的飞速发展,导航系统中也渐渐开始使用计算机视觉技术。在GNSS(全球卫星导航系统)拒止条件下,面向无人机安全自主着降的任务需求,设计了一种新型合作标志,研究了目标的特征提取与跟踪方法,研究了无人机视觉导航位姿解算方法,研究了固定翼无人机着降视觉导航技术和固定翼无人机的回收技术等视觉导航应用,提出了一种使用视觉导航来修正无人机基于惯导推算的位姿累积误差的方法,最终实现了无人机的安全自主着
学位
近年来,卷积神经网络在计算机视觉领域取得了巨大成功,其在不断提高图像分类、目标检测和图像语义分割等任务精度上限的同时,模型尺寸与运行时间也在急剧增加。由于移动端设备存在存储空间和计算能力的约束,使得现有卷积神经网络无法在这些资源受限设备上进行很好的部署和应用。在这种情况下,研究人员通过设计高效的卷积结构来代替传统网络中的标准卷积层,以达到减小模型参数量和运算量的目的,但是此类方法仍然存在模型泛化能
深度学习已经得到飞速发展,在图像识别领域,卷积神经网络的鲁棒性保证显得尤其重要。由于卷积神经网络的分布式表示特点,会对输入图像产生众多特征表示,这些特征表示中存在大量噪声信息,会严重影响网络的性能,此外由于训练数据的局限性,会影响神经网络区分非正常输入的能力。为了提高卷积神经网络的鲁棒性,我们在噪声通道选择、噪声特征过滤和防御对抗攻击三个方面分别提出了三个方法。针对噪声通道的存在而影响神经网络鲁棒
学位
随着RNA-seq产生的读段数量日益增加,读段比对成为了一个非常耗时的任务和环节。在RNA-seq分析中,准确而又有效的读段比对一直是一个难点和挑战。许多比对算法在可容忍的时间范围内采用不同的策略来为读段寻找可能的比对位置,并且为下游分析提供大量的比对信息。但是一些转录本分析任务(如转录本定量分析)只需要得知读段在转录本上的位置即可。由于转录本不含有内含子,读段可以被连续地比对到参考转录本,而不需
学位
传统的图像去模糊算法是通过估计模糊核的方式进行图像的盲去模糊,运行速度较慢,实际应用价值不大。受到近年来提出的图像到图像风格转换任务的启发,我们注意到图像的盲去模糊可以视为图像到图像的风格转换问题。所以本文着重于研究如何将生成对抗网络应用于图像的盲去模糊,同时还有研究如何在保证神经网络的去模糊质量的情况下,压缩模型大小和减少参数量。本文提出的减少生成对抗网络模型参数量的方法有两种思路,一种是设计用
监督学习通常需要大量标记样本训练模型。然而,在许多真实场景下,我们只有少量的已标记样本,以及大量的未标记样本,且标记的获取往往需要耗费大量的人力物力。主动学习通过有选择性地向专家查询对模型提升最有帮助的样本以减轻数据标注的代价,目的在于以尽可能少的代价获得性能尽可能高的模型。目前大多数现有的主动学习研究主要集中在样本选择策略上,尽管它们能够显著降低数据标注量,但数据采集的整体成本仍然较高,这其中有
学位
推荐系统通过对互联网应用中的用户、物品、上下文信息等对象进行建模,自动为用户推荐其可能感兴趣的物品,可缓解互联网时代的信息过载问题。由于推荐算法的输入特征是由多个对象的one-hot或multi-hot编码组成的,特征稀疏且维度高,因而进行特征交叉对于捕捉有用信息十分有效。同时,这些对象亦可用异构图进行表示,例如用户和物品之间的二分图、物品之间的关系图等,图结构可直观地体现对象之间的联系。本文围绕
学位
传统监督学习技术在很多领域任务取得了很好的应用效果,但监督学习假定模型具有足够充分的有标记数据来训练,并且数据标记准确可靠,该条件在很多现实任务中难以满足。在实际应用中,数据的收集和标注需要消耗高昂的成本,且人工标注的监督信息往往较为粗糙且包含噪声。弱监督学习是处理这类信息的一种主流学习方法。本文主要针对弱监督学习中标记数据缺失的问题,基于主动学习和半监督学习技术提升开集分类、深度学习和图网络学习
学位
随着数据库技术在交通、娱乐等领域的普及应用,国内外学者们开始探究如何从多维数据中筛选出满足查询需求的关键数据。而Skyline查询作为当今信息技术领域中高效的检索方案之一,能够有效地筛选出符合用户所给出的多偏好查询需求的对象点集。由于移动设备及其配套服务与设施的快速普及,各类移动应用中产生了海量的空间文本数据。针对空间文本数据中复杂的属性构成,传统Skyline查询方法在有效性、通用性等方面存在着
智能电网作为对传统电网的重大改进,通过双向的电力流和信息流连接了系统的各个组成部分,在可靠性、可用性、效率、经济收益等多方面都优于传统电网。需求响应作为智能电网管理技术中重要的组成部分,可以降低峰值需求、平滑电力供需曲线、降低系统整体开销和提高系统稳定性。现有文献中的需求响应方案设计主要着眼于优化用户的负荷分布,对用户电器的能耗模式、用户满意度、公平性和用户的用电习惯等重要因素缺乏足够的重视。针对
学位