道路网中分布式关键词查询算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:shoolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
道路网是现实生活中地图的抽象,其结构为一个带边权重的图。其中,图顶点代表在道路网中的一个路段交界位置或是一个重要地理位置(如景区,重要医院,著名大学等),而两点之间的连边代表一个路段。连边的权值代表该路段的长度(或者需要行驶的时间)。有了这样的道路网数据库,可以提供基于位置的服务(Location-based Service)。代表性的应用像Google Local和、’ahoo Maps已经得到越来越广泛的应用。一种更为广义的道路网图结构则是每个图顶点都附有相应的描述信息,如“复旦大学正校门”可以描述复旦大学正校门地理位置对应的顶点。有了带文本的道路网数据库,我们可以进行基于关键词的位置信息查询,如“找到距离复旦大学正校门500米以内的邮局”。这类基于关键词的道路网查询丰富了基于位置的服务。我们将这类空间关键词查询严格定义为关键词组合查询。本文首先研究了道路网中关键词组合查询如何利用分布式环境加速查询。我们提出分布式索引技术来加快查询计算,并从理论上证明了索引空间的最优意义。其次,我们指出,提出的分布式索引技术适用于一个更广义的查询类,我们称其为Q类,并证明提出的方法对于整个Q类查询的可行性。Q类查询能够处理诸如“找到距离超市和医院都比较近的位置”,“找到距离当前位置500米以内的所有中餐馆”等查询。我们考虑了两种实验设置:Hadoop MapReduce集群以及一个基于协调器的集群,并分别提出了分布式算法。在基于协调器的分布式环境中,我们通过实验比较了NPD索引算法相比于集中式算法的效率和可扩展性优势。在Hadoop集群环境中,我们针对Hadoop环境的特性提出了朴素的查询算法,基于简单索引的查询算法和基于NPD索引的查询算法,并通过详尽的实验比较说明基于索引的查询算法的效率优势和强可扩展性。
其他文献
测试用例自动生成是软件测试自动化领域的难题之一,目前仍处于研究探索阶段。作者围绕这一难题展开研究,在分析研究已有测试用例生成算法和实现技术的基础上,提出了面向单元
本文就此问题展开研究,结合下一代网络的特点,研究下一代互联网计费系统的关键问题:数据记录的表示方法和生成方法;计费系统如何在计费方案中使用这些源数据实现SLA和QoS与服务使
电子印章是应用层的数字签名,是电子签章的一种,由于文档签名与其他类型数据如程序,数据库数据等相比有其特殊性,本文针对文档签名的特殊性,如签名的可见与可证实性,文档的归档特性
本文就布尔关联规则的分布式挖掘与更新、最优数量关联规则的分布式挖掘、约束性关联规则的分布式挖掘与更新、基于关联规则的分类规则分布式挖掘等方面作了较深入的研究。取
  本文分析了目前移动Agent技术及多Agent系统面临的挑战,然后基于科层制思想研究MAS模型,并将可重构功能引入到MAS中,提出可重构MAS,最后分析了可重构MAS在入侵检测中的应用,并
长期以来,数据库服务器的性能评测研究基本上由服务器厂商进行,提供的性能指标往往是用来与竞争对手进行性能攀比,而不是为用户的实际应用提供指导。本文从用户需求的角度出
随着技术的进步,嵌入式设备得到了迅速的发展。以智能手机为代表的智能设备带来了嵌入式应用和系统的快速更新和换代,并推动着与之相关的软件、硬件产业的发展与革新。智能电
网络管理系统是通信网络的重要组成部分,是保证通信网正常、经济、可靠、安全运行的重要支撑手段。在网管系统研发或者升级的过程中引入高质量的软件测试技术,可以大幅度地提高
随着CDMA 网络应用的不断扩大,各个运营点使用的交换设备不断增多,给运营商和设备制造商维护这些设备带来了很大困难,往往只能等到出现了重大故障时才能发觉,并已经造成很大
软件测试是为确保软件的正确性而进行的一项重要活动,回归测试是软件修改后以确认修改的正确性而进行的测试工作,因而其执行测试用例的过程与前面的开发过程中的软件测试过程相