基于HBase的车辆轨迹数据管理与分析

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:whg_2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时空数据的有效管理是时空数据建模、时空数据分析和时空数据挖掘的基础。车辆轨迹数据是一种重要的时空数据。车辆轨迹数据不仅是对车辆行驶路径的完整记录,而且可以直观反映交通状况,同时也能直接反映道路网络几何特征。随着各种定位技术和物联网技术的发展,以及车载定位设备广泛应用于各种车辆上,使得车辆轨迹数据的获取难度大大降低,同时也意味着有越来越多的甚至海量的车辆轨迹数据需要管理和分析。这就对车辆轨迹数据的管理方式,以及在此基础上的分析方法提出了更高的要求。传统的单机数据库具有维护、升级成本高等缺点,并且在海量的数据面前已经略显吃力。在这样的背景之下分布式存储悄然而生。本文先介绍了 Hadoop开源分布式生态系统和Hadoop分布式文件系统(HDFS),以及在此基础上的HBase分布式列式数据库。本文使用HBase分布式数据库对车辆轨迹数据进行管理。数据的管理组织形式必然需要考虑应用分析的需求。出行时间预测是智能交通系统的一个重要研究内容。出行时间的预测结果作为一种有效的交通信息,不仅可以帮助交通管理部门控制、调整交通流,而且能帮助出行者更加合理地安排出行计划。本文提出了一种基于Geohash空间编码的可以快速查询拥有相邻近起点和终点的车辆行程集合的行程起讫点数据编码方式,并对这种编码方式的有效性做了实验验证。然后研究了以该编码为HBase行键索引的车辆轨迹数据分布式存储方案,并对海量数据的入库进行了优化,最后对比测试了 HBase分布式存储方案与单机MySQL数据库的数据查询效率,得出在多用户并发环境下,HBase分布式的车辆轨迹存储方案,查询效率更高。为验证本文所提的车辆轨迹数据起讫点编码方法和车辆轨迹数据分布式存储方案的有效性,本文以成都的出租车轨迹数据为例,建立了车辆轨迹HBase分布式数据库,应用上述编码方法对轨迹数据起讫点进行了编码。然后在此基础上,对出行时间进行预测。实验结果表明,本文提出的编码方法易用可行,分布式存储方案检索高效,预测效果良好。
其他文献
甘南藏族乡村聚落有深厚的历史文化沉淀,蕴含着丰富的民族文化内涵。随着甘南州城镇化建设的发展,藏族乡村人居环境发生着重大的改变。在受到这种文化趋同现象影响的下,失去其原
针对盘锦市水稻生产存在水田灌溉用水量较高、水田埝梗利用率低、稻菜复种面积少、稻田养殖面积有待扩大、水田化肥利用率较低、水田污染时有发生等问题,提出大力推广节水、节
特高压工程的建设对覆冰、风载严重地区输电线路的舞动抑制效果提出了更为严峻的挑战,因此研究了一种应用于河南尖山实验基地特高压试验线路的基于相间间隔棒的新型防舞措施
农民工是我国城镇化、工业化和城乡二元社会结构下,政治、经济、社会体制等多种因素的综合产物,农民工问题也正成为我国不断凸显的社会问题。新生代农民工是在改革开放下成长起
《论习俗》是理解滕尼斯"共同体"学说的关键文本。在滕尼斯看来,"习俗"是融合了传统的人心机制、社群关系、道德规范以及法权状态的整体文化结构。它源于共同体自然的长幼秩
体绘制技术是三维数据可视化研究领域的一种非常重要的方法,已经在许多领域得到了广泛的应用,是科学可视化的研究热点之一。直接体绘制技术虽然能够较好的显示三维数据场的内
在科技进步以及世界各国联系越来越紧密的同时,航运业也开始发展起来,并且在经济活动中占据越来越重要的地位。与此同时,集装箱运输行业与传统的船舶运输输相比,优势更大,也
目的探讨老年高血压患者血压变异性与心律失常的关系,为诊治心律失常提供参考。方法2016年1月至2017年12月该院收治的老年高血压患者60例,按24小时收缩压变异性的总变异系数
猪场母猪群繁殖性能的高低是决定经济效益好坏的重要因素,要使母猪群发挥稳定且具有较高的繁殖性能,后备母猪的饲养极其关键。但是,许多猪场的管理者不了解后备母猪生理与饲养的
各方向交通流不均衡是导致城市道路信号交叉口拥挤的原因之一,特别是对于交通量较大的拓宽交叉口,当某一时段左转交通量较大时随着停车排队车辆的增加左转车辆会占用直行车道