基于Map-Reduce框架云环境时空查询技术研究与实现

来源 :东北大学 | 被引量 : 4次 | 上传用户:ljc2696
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时空数据管理是时态数据管理和空间数据管理的统一体,包括时间与空间两个要素,主要用于管理和储存位置或形状随时间变化的空间对象。时空数据管理可以应用于环境变迁研究、行政区域管理、地籍管理等诸多领域中。与此同时,基于Map-Reduce的云计算以其廉价、容错等优良特性,成为商业中逐渐普及的计算模式。在进行时空数据管理时,经常用到Top-k、k最近邻和skyline查询问题。这些问题都是具有可分解性的。但在应用这些算法到Map-Reduce框架时,中间结果不能被很好的过滤掉,影响了这些算法在云计算领域的应用范围。针对这一问题,本文基于Map-Reduce框架提出了Map-Filter-Reduce计算框架。首先,通过分析在Map-Reduce框架上处理Top-k、k最近邻和skyline查询等可分解时空查询问题的特殊性,提出了Map-Filter-Reduce计算框架及其编程接口,并对其可扩展性和容错性进行了分析。其次,本文在Map-Filter-Reduce框架的基础上,提出了Lazy、Eager、Hybrid和Prepositive的调度策略,并对这些调度策略进行了比较与分析。再次,本文详细介绍了如何利用Map-Reduce-Filter计算框架,选择合适的过滤器来处理Top-k, k最近邻和skyline时空数据查询问题,并对算法的正确性进行了分析。最后,本文以丰富的合成数据集评估了Map-Filter-Reduce框架,实验结果显示本文提出的Map-Filter-Reduce框架在查询时间和中间结果数量等方面都优于原有的Map-Reduce框架,具有良好的可扩展性。
其他文献
本文以建立在统计理论基础上的Bayse分类算法在短信过滤中的应用策略为依据,把投诉平台中针对不良短信的投诉信息作为研究对象,对它们进行智能化的分析与研究,用类别明确的投
随着信息技术的发展,企业的数据资源呈爆炸式的增长,传统的企业竞争情报系统在数据分析处理中的不足日渐突出。数据挖掘技术的兴起为竞争情报系统的发展提供了新的动力。模糊聚
TCP/IP网络的成熟性、可扩展性和廉价性使得存储系统和TCP/IP网络的融合成为对中小型存储系统最有吸引力的方案之一。iSCSI(internet Small Computer System Interface)是由I
随着互联网与信息化技术的迅速发展,社会网络已逐渐引起人们的高度注意。通过对社会网络的研究,人们可以理解社会现象,预测人类行为,为社会结构的分析提供了极大地便利。但随
在网络舆情管理、互联网智能信息处理中,人们急需获取论坛中帖子内容,为进一步研究话题情感分析以及论坛话题传播服务。面对着海量的论坛信息,快速提取论坛中帖子内容可以及
缓存是计算机系统的关键部件,利用存取局域性提升I/O性能。目前通用的缓存替换算法仅以缺失率作为评判标准,忽略下层存储设备的特性。然而在固态硬盘和磁盘组成的磁电混合存
由于当今印刷技术的不断进步,利用伪造的印刷品进行的非法活动也变得更为容易和难以抑制。为了实现对印刷品图文的防伪、鉴别与跟踪,针对印刷品的数字水印成为了信息隐藏领域中
固态盘(Solid State Disk,SSD)相比传统机械硬盘在读写延迟、带宽、功耗、可靠性等方面都有很大提升,在目前的存储系统中应用越来越广泛。为了获得更大的容量,降低成本,提高
学位
随着计算机科学的不断发展,信息数据量呈爆炸性增长,给数据处理工作带来了一定的挑战,用户的查询也变的越来越复杂。由于需要处理的数据规模越来越大,进行的搜索也越来越困难