空间数据的聚集最远邻居查询研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hubingguixuejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这篇文章中,我们研究一种新型的空间查询,叫做聚集k最远邻居查询(Aggregate k Farthest Neighbor Query,简称AkFN Query).给定一个数据点集P和一个查询点集Q,AkFN查询返回P里面离Q中所有点的聚集距离最大的k个点。例如,要在一个城市里新开一间旅馆,希望选一个地点到所有现有的旅馆聚集距离最大,以此最大限度的降低竞争。我们主要讨论三种聚集函数,和(Sum)、最大值(Max)和最小值(Min)。假设数据集是R树索引的,针对查询集为内存存储时,我们提出了两个高效解决所有三种AkFN查询的算法,最小界定(Minimum Bounding,简称MB)算法和最好优先(Best First,简称BF)算法。其中BF算法是增量式的,而且可以证明是1O开销最优的算法。另外,我们提出一种基于凸包(Convex Hull Based,简称CHB)的算法来解决聚集函数为Sum和Max的情况,它利用到了数据集的凸包。另外,对于查询集很大为磁盘存储时,我们对以上三种算法进行扩展分别提出了磁盘最小界定(Disk Minimum Bounding,简称DMB)算法、磁盘最好优先(Disk Best First,简称DBF)算法和磁盘基于凸包(Disk Convex Hull Based,简称DCHB)的算法。在合成数据集和真实数据集上的大量实验表明,这些算法不仅高效而且有效。其中BF算法在几乎所有情形下都是最优的。
其他文献
随着各组织间数据交换的与日俱增,作为Web上数据存储和交换格式事实标准的XML变得越来越重要,但是不正确数据、不一致数据、不精确数据等XML中的劣质数据给XML上的有效查询处
随着多媒体技术的发展,数码拍摄设备走进了千家万户,高质量数码图片呈指数型增长的趋势。人们总是希望能够按照图像的内容(语义)进行管理,因此按照语义进行图像分类对于图片数据
面对激烈的市场竞争,企业需要不断的自我完善才能快速响应不断变化的市场需求。企业管理软件作为业务系统内重要的支撑手段,也同样面临着不断变化的软件需求。如何使得企业管理
随着国际贸易的日趋频繁,我国物流行业得到迅速发展。海运货代作为物流业的重要组成部分逐渐发展壮大,已经成为一个比较有竞争力的服务行业。伴随我国海运货代的迅速发展,该
21世纪以来,现代社会的发展与进步,特别是信息技术的广泛应用,推动了我国医疗水平快速提高和医疗信息化建设迅猛发展。但与发达国家相比,仍然存在不小的差距,还远远不能满足
人脸是人们区分不同对象的重要特征之一。人脸识别技术的研究对计算机视觉与模式识别的发展和应用有着重要的意义。特征提取与模式分类是人脸识别系统的两个重要步骤,稳定的
虚拟战场地形环境仿真中,地形模型具有广泛而重要的作用。由于计算机硬件水平有限,制约了大范围三维地形建模的速度和精度。目前解决该问题的方法是基于软件的方法,从建模的角度
自然场景图像中的文本字符是描述和认知场景内容的关键线索,对场景视觉信息的表达和理解具有重要价值。由于场景图像中的文本字符存在于复杂的背景之中,拍摄视角的不同使得文
本文针对双伸位堆垛机立体库的库位编码问题提出了归一化处理思想和单点双向扩展方法,打破了传统的最低能耗思想,建立了两级库位编码,根据入出库货物统计质量的排列和优化后的库位号来指导入出库货物货位的选择,并通过实例模拟验证,结果表明该库位分配优化方法大大节省了双伸位堆垛机的能量消耗,提高了堆垛机的周转频率及效率,有效地解决了新型立体库的库位配置问题。针对双伸位堆垛机拣选作业的路径行走特点,把拣选作业归结
问题扩展,即根据用户查询意图,在原始查询基础上通过添加更有利于改善检索结果的词、词组或者短语,或通过改写重构,使得检索结果更满足于用户查询意图。问题扩展的原因在于查