论文部分内容阅读
随着空间数据库的广泛应用和计算资源的不断开发,人们对基于位置服务LBS(location-based Services)的期望也越来越高,这意味着LBS必须能处理更复杂的查询。最近邻NN(nearest neighbor)查询和反向最近邻RNN(reverse nearest neighbor)查询是LBS中两个非常重要的查询。其中NN查询是查找离查询点距离最近的点集,而RNN查询依托于NN查询,其查询结果集中的每一个点都将查询点作为最近邻,即查询点是结果集中所有点的最近邻。RNN查询通常用于一些市场分析和商业决策系统。反向最近邻查询技术能提供决策支持,因此具有很大的商业价值。传统的RNN查询没有考虑多个特征类型影响的情况,因此在一些商业决策系统中的运用受到的限制,有时甚至不能满足用户的个性化需求。而现有的多类型反向最近邻MTRNN(multiple types reverse nearest neighbor)查询虽然考虑多个特征类型但却忽略了它们之间的影响因素,也不能真实地反映实际情况。因此,对MTRNN查询做进一步的扩展和完善将是十分有意义的。本文在分析总结MTRNN查询算法优缺点基础上,进一步做了以下的研究工作:1.针对现有的MTRNN查询算法没有高效的过滤策略,并且没考虑各特征类型之间的影响因素的问题,提出了一个基于特征类型影响因子的带权多类型反向最近邻WMTRNN(weighting multiple types reverse nearestneighbor)查询方法。它采用R-tree索引结构并结合了闭区域和开区域剪枝策略,更能适应LBS的特征要求。仿真实验结果表明,WMTRNN查询算法在合理的时间内能得到准确的查询结果,新的过滤策略在大数据环境下的过滤效果比较显著。2.针对确定对象的MTRNN查询难以满足当今计算环境下的个性化要求和复杂的应用场景的问题,研究了关于不确定对象的概率多特征类型反向最近邻PMTRNN(Probability multiple types reverse nearest neighbor)查询方法。它基于离散型随机变量概率模型,采用空间剪枝和概率剪相结合的剪枝策策。仿真实验表明,查询算法能在合理的时间内完成不确定数据库(不确定对象生成的数据库)上的MTRNN查询,查询效率与不确定对象的区域大小、每个不确定对象的实例个数、概率阀值和概率剪枝深度有较大关系。