云环境下轨迹数据查询处理技术的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:ycbydd21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动终端和基于位置服务技术的快速发展和广泛应用,使得轨迹数据无处不在,数据规模急剧增加,已成为当前一类重要的大数据。针对这些时空特性显著的大规模轨迹数据,如何对其进行高效索引、查询处理及深度挖掘分析,受到学术界和工业界的广泛研究,并已成为该领域的一个重要研究课题。传统的轨迹数据查询处理技术由于其集中式的处理方式而导致扩展性较差,无法处理这种轨迹大数据,而Hadoop云计算平台由于其高效的并行处理架构已成为当前大数据处理的主流平台。为此本文基于Hadoop平台,针对大规模轨迹数据的查询处理问题进行深入研究,主要做了以下几方面的工作:首先,在深入分析了轨迹数据时空序列特性的基础上,提出了一种轨迹数据压缩算法,该算法运用空间向量思想,将平面数据压缩算法与轨迹数据特征相结合,能够大大降低轨迹数据的存储开销、减轻索引构建代价。在此基础之上,基于MV3R-tree时空索引结构,提出了一种叶子结点分裂处理优化算法,该算法能够保证分裂后的叶子结点内的数据具有较高的相似度,同时降低叶子结点间数据对象的相似度,使索引结构更加紧凑,能有效提高查询处理效率。其次,基于Map-Reduce并行处理框架,设计并实现了两种轨迹数据查询处理算法,主要包括时空范围查询和时空点查询处理算法,在此基础之上提出了一种基于Dijkstra最短路径的路径推荐算法,该算法能够充分利用历史轨迹信息找到两点之间可达且距离短的推荐路径,为进一步扩展轨迹数据分析处理和应用提供了有益的尝试。最后,通过大量实验对本文所提出的轨迹数据压缩、索引优化、查询处理及路径推荐等算法的性能和正确性进行了验证。结果表明,轨迹数据压缩算法能有效地降低索引创建和查询处理代价:优化后的索引结构具有更好的并行查询处理性能,其性能明显优于集中式索引;路径推荐算法在处理小范围查询时响应速度快捷、具有较好的可达性。
其他文献
Web服务组合重配置是当前服务组合及应用研究的热点问题之一。越来越多的企业开始在网络业务中使用Web服务组合,企业现有的服务组合很难满足应用环境以及业务过程等变化要求,阻
Internet的发展和应用的日益增多使现在的IPv4地址面临很快被耗尽的问题,因此IETF提出IPv6作为下一代网络的主要协议。IPv6的地址空间扩展为128位,对安全性和移动节点的自动配
近年来随着社会日新月异的进步和发展,信息传播与交流的范围也发生了翻天覆地的变化。形色各异的信息充斥在Internet上,人们在应用Internet的时候,很容易被海量信息冲昏头脑。这
在我国高等教育走向大众化的今天,建立教学质量评价体系,是保证教学质量的重要措施之一,本文根据目前高校教学的需求,并结合了教学评价发展的趋势,提出了多元化的评价模式、发展性
实时播放系统是数字电视系统的核心组成部分。本文在现有数字电视中间件平台上,设计并实现了一套完整的面向数字电视的实时播放系统,完成了数字电视节目实时播放与控制的功能,为
我国通信事业正在蓬勃发展,随着我国信息化进程的加快,通信保障已成为越来越迫切需要解决的问题。当电缆外皮损伤,老化有裂洞时,气体便会泄露,水分潮气经外皮进入电缆,使绝缘破坏,电
结构域是蛋白质的结构和功能区域,在蛋白质相互作用过程中发挥重要作用。近年来,已出现多种从结构域水平预测蛋白质间相互作用的方法,这些方法大多基于结构域对之间发生相互作用
随着计算机技术、网络技术和数据库技术的迅速发展,校园内部建立了比较完善的信息管理系统,如:办公自动化、邮件系统、财务系统、图书馆管理系统等,在学校运作中发挥了重要的作用
社区挖掘作为数据挖掘研究领域的一个热点,多年来研究内容主要基于同质网络进行分析。随着网络地不断发展,数据量不断增多,单一类型的对象已经不足以应对解决现实中的问题。
计算机与互联网技术突飞猛进的发展使得全球的数据和资源紧密地联系在一起,信息化技术的及时采纳与信息资源的充分利用,已成为企业在激烈的市场竞争中克敌制胜的必备法宝。电力