【摘 要】
:
随着信息技术的不断发展和应用,数据收集手段越来越丰富,海量存储也越来越普遍。由此,一种新的操作算子Skyline查询被引入了数据库领域,目的是要查找数据集中不被其它点支配
论文部分内容阅读
随着信息技术的不断发展和应用,数据收集手段越来越丰富,海量存储也越来越普遍。由此,一种新的操作算子Skyline查询被引入了数据库领域,目的是要查找数据集中不被其它点支配的所有点。Skyline查询能够反映目标数据集的整体轮廓且有利于用户查询数据集中感兴趣的目标,从而在多目标决策、数据挖掘、数据库可视化等方面有很大的应用。CCS算法是一种有效的数据流上的Skyline计算方法。它通过构造支配关系树对整个SP集合进行实时的维护,从而大大降低了Skyline计算的复杂度。但该算法同样也存在一些弊端:其一,大量计算时对数据的利用不合理,造成时间和空间的浪费;其二,进行查询计算的时候部分操作重复计算;其三,没用充分利用算法执行期间已经产生的SP集合。针对上述问题,本文给出了一种新的数据流上的Skyline查询模型,同时,引入了最近邻算法,结合最近邻算法在Skyline查询计算时的先天优势,对数据元组提前进行预处理,通过去除不必要的对象来有效地减少资源的消耗。同时采用了加权欧式距离的方法,在满足用户的偏好性也进行了一定程度上的改进。最后对改进后的算法进行了验证实验,实验标明基于Skyline的改进的数据流查询算法的研究在一定程度上降低了时空复杂度并且满足了用户一定的偏好性。对改进后的算法进行仿真实验,验证算法的可行性,并通过在相同环境下与原来算法的查询效率做对比,验证改进算法的优越性,同时针对算法的特性,对不同数据类型进行验证,检验算法对各种数据类型的执行效果。
其他文献
本体最初是一个哲学概念,用来描述事物的本质。在本世纪80年代,科研人员把本体引入人工智能领域,并赋予其新的含义。在计算机科学领域,本体被定义为共享概念模型的形式化规范
科学与工程应用对计算性能要求的不断增加使得机群系统得到了迅速发展,但由于功耗和散热等因素,基于CPU的同构机群系统可拓展性已成为发展瓶颈。而图形处理单元(GPU)、众核协
随着信息技术在新药创制中的不断成功应用,以多样性分析为基础的计算机药物虚拟筛选成为当前新药研究中克服化合物数目不足对新药创制的制约的重要技术手段,基于结构的分子对
随着布料模拟技术在计算机动画、纺织服装CAD和虚拟试衣系统中的广泛应用,模拟效率的要求日益提高。而布料模拟系统中的碰撞检测部分的检测速度正是模拟效率的重大瓶颈。因此,
近年来,随着计算机网络技术的发展,网络数据库的应用日益广泛,网络数据库系统的安全问题也由此引起人们的普遍关注,如何保证网络数据库中数据的安全性,己成为一个迫切需要解
字符识别是模式识别领域的重要研究方向。目前,其主要的研究方法大都是基于统计学的,研究者需要搜集大量的标记样本进行训练,然后生成分类器进行分类,这样耗费大量的时间与人
随着经济的快速发展,公路车辆数目不断增多,道路交通安全成为社会关注的普遍问题。在这种情况下,我国陆续投入各种智能交通系统的研究,而交通标志作为向行人指示交通的交通设施对
语义Web的目标是使得Web上的信息具有计算机可以理解的语义,随着语义Web中本体数量的不断增加,本体的重用和共享逐渐成为亟待解决的重要问题。在不同本体间进行映射是解决本
在以数字化信息为资源、互联网交互为动脉的21世纪,快速、有效地获取有用信息变得越来越困难,其根本原因在于现有数据缺乏语义信息。针对这种情况,在语义和知识层面上描述领
跨入新时代,计算机融入到人们生活的方方面面,随之也产生了数量巨大的数据需要处理。云计算、物联网、物理学、生物学、环境生态学等领域更需要对海量数据进行挖掘和处理,这