论文部分内容阅读
随着无线通信和移动计算技术的发展,移动设备在我们日常生活的各种应用中逐渐扮演着越来越重要的角色。如今,我们身边所经常使用的移动设备往往都会具有定位和无线通信能力,因此,使用移动设备进行定位服务和上传位置数据到服务器成为可能,尤其是对于基于位置的服务(Location-Based Services)追踪并记录轨迹数据尤为重要。轨迹数据中蕴含着移动物体的移动规律,随着移动物体轨迹数据量的快速增加,对于大批量轨迹数据分析的需求也在不断增长,包含了军事、交通、科学、物流和社会服务等领域。本文旨在降低轨迹数据中存在的定位误差和采样误差,实现对轨迹数据的分析与挖掘。本文主要工作包括以下几个方面:·轨迹数据预处理针对轨迹数据中的定位误差,采用均值过滤去除轨迹数据中的异常点,并利用隐马尔可夫路网匹配模型将轨迹数据映射到城市路网上,以此来提升轨迹数据的精确度。·窗口函数优化建模PostgreSQL中窗口函数在顺序调用阶段执行的消耗模型,分析出执行瓶颈所在。提出了基于临时窗口的面向聚集函数和面向MAX/MIN[函数的两种窗口函数优化方法。通过理论与实践证明了两种优化方法的有效性。·轨迹数据查询的构建通过对轨迹数据进行预处理,形成了轨迹数据路网查询模式数据,利用窗口函数构建城市路网的分析和查询。综上所述,本文基于轨迹过滤、路网匹配等技术对轨迹数据进行预处理,降低轨迹数据中定位误差的影响,利用关系数据库存储轨迹数据,并利用数据库中的窗口函数降低轨迹数据中的采样误差对数据分析和挖掘的影响。在当前轨迹数据量急剧增加的背景下,关系数据库中窗口函数的传统执行框架出现了性能瓶颈,本文提出了基于临时窗口的面向聚集函数和面向MAX/MIN函数的两种窗口函数优化方法,并以此构建了轨迹数据查询。