不确定数据流上的并行Skyline查询算法

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:zhaomohans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  不确定数据流上的Skyline查询技术逐步引起研究者的关注,传统的集中式流处理算法难以满足海量数据的查询需求,并且云计算所提供的海量计算资源和有效的存储管理模式,为研究并行Skyline查询技术提供了充足的条件。基于上述事实,提出了一种不确定数据流上的并行Skyline查询算法(PSUDS)。该算法通过交叉划分滑动窗口的方式,将集中式流查询转化为并行处理,以并行执行的方式来解决集中式算法处理性能不足的问题。大量实验结果表明,该算法具有较好的并行可扩展性。
其他文献
数据空间是一个异构的环境,并且数据及模式具有随时间演化的特性.已有的实体识别技术很少考虑时间信息在识别中所起的作用,并且没有考虑实体随时间演化的特性.针对数据空间中具有时间信息的实体识别,提出了一个四阶段的时间为中心的集合实体识别策略(T-CER).T-CER在实体识别过程的不同阶段都考虑了时间信息所起的作用,在识别阶段提出了基于时间的聚类算法(T-Clustering),并使用基于时间的约束对识
从数据整体和宏观特点给出了离群点的新的定义,并基于数据宏观模式定义了一种新的离群因子,该因子考虑了数据点偏离数据模式的程度和数据点本身归类的不确定性;提出了一种新的Shadowed Sets优化目标,使得在模糊集阴影化过程中更加关注核的准确性;同时基于Shadowed Sets聚类,提出了一种结合聚类的离群点检测算法,该算法可以同时进行聚类和离群点检测;通过模拟数据和Iris数据测试,显示算法具有
利用人眼视觉感知特性评价图像的质量一直是图像处理领域的研究热点,但是目前很多客观评价方法未能充分考虑视觉感知特性。针对当前工作的不足,提出了基于边缘梯度信息的图像质量评价方法。采用基于小波变换模极大值的方法提取图像的边缘梯度信息,并利用高斯函数对图像区域进行区域加权,提出基于边缘梯度信息的评价方法。实验结果表明,该方法能够准确和有效地度量不同失真类型图像的质量,与主观评价值的一致性较好,并且该算法
高维数据集合的最近邻查询性能会受到“维数灾难”现象的影响。提出了一种基于联合聚类的HC2高维索引结构。首先通过联合聚类算法同时降低数据尺寸和维数,将高维数据集合聚成若干较低维数的类,然后采用超立方体结构对每个类进行空间区域描述。在基于“过滤-精炼”的查询过程中,计算查询点与各个类之间的距离下界,实现对聚类的有效过滤。为了提高距离下界对真实距离的逼近能力,采用了一种基于统计优化的超立方体区域描述方法
由于概率维的存在,使得准确高效地处理不确定数据的Top-k查询成为一个急需解决的难题。提出了一种利用控制关系分析(DRA)的不确定数据Top-k查询算法。该算法通过分析元组之间的控制关系,将那些最有可能成为Top-k查询结果的元组选择出来,这样大大减少了参加运算的元组数量,显著提升了查询效率。并且在数据库更新时,能够判断出此更新是否影响到之前得到的查询结果,从而决定是否需要重查,减少了重查的计算量
分析了李群流形空间的几何结构、核函数和KFDA的原理,推导了矩阵李群内积空间的度量形式,进一步推导出5个李群核函数,并以此设计实现了KLieDA算法。李群核函数是适应性更广的核函数形式,由于欧氏空间的几何结构是李群的子集,李群函数不仅适用于矩阵李群的样本集,同时也适用于常规的向量形式的样本集。实验表明,基于李群函数和李群均值理论的KLieDA算法是一种快速高效的李群样本分类器。实验部分除了KLie
网络结构分析是人工智能领域基本问题。应用粒计算方法讨论了网络结构信息计算,从粒计算基本问题角度,采用商空间理论研究了网络结构粒化和粒化后不同粒度空间中的问题,特别是基于粒化如何计算不同粒层的粒间距离问题。应用方面,讨论了大规模网络结构最短路径搜索问题。作为大规模网络路径分析的预处理方法,选择社团作为基本粒,将大规模网络粒化到不同的粒度空间,形成不同粒度商空间的分层递阶粒度链。提出了基于分层递阶粒度
多Agent系统中,Agent间通过形成联盟达到提高任务求解能力,获取更多收益的目的。主要关注联盟模型的改进和联盟形成阶段的改进,基于ARG(agent,role,group)元模型和学习机制提出了一种采用角色和学习机制的新联盟模型CLAR;在采用合同网协议的CLAR联盟模型中提出了两阶段联盟形成机制;通过捕食者问题实验验证了角色和学习机制的作用,以及两阶段联盟形成机制在减少通讯代价上的作用。
提出了一种自适应三维美工树木骨架提取算法。该算法主要由前处理、骨架提取和后处理三个步骤组成。前处理阶段依次完成预计算操作,包括对具有几何相似性的子枝进行聚类,自适应生成每个子枝点云的聚类长度阈值,确定子枝之间的父子关系等;骨架提取阶段实现对每个子枝点云的聚类,及其对应骨架点、骨架曲线的生成等操作;后处理阶段完成孤立骨架节点去除,整棵树所有骨架曲线光滑化等处理。该树木骨架提取过程完全由计算机自动完成
微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(EDM)。还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感