论文部分内容阅读
近年来,移动通信、定位技术和物联网迅猛发展,在给我们生活带来便利的同时,也产生了规模庞大的时空轨迹数据。这为时空轨迹数据的研究和应用创造了有利条件。但时空轨迹数据在急剧膨胀的同时,也正朝着多元化和多样性的方向发展,表现形式的多样性、轨迹构成的复杂性,也为这类数据的深入研究和实际应用带来了巨大困难。如何从这些复杂多样的时空数据中发掘出有价值的信息,已成为当今时空数据挖掘领域所要面对的核心和关键。 本研究主要内容包括:⑴针对现阶段的时空轨迹模式挖掘方法较少涉及轨迹数据中采样频率不稳定和轨迹点稀疏的问题,本文从轨迹数据的时空特性出发,深入研究轨迹的时空构成,设计了两种面向采样频率不稳定和采样点稀疏的时空轨迹处理方法。第一种方法通过判断各轨迹点之间的时空距离来发现隐含的重复数据,并寻找特征点来代替重复的轨迹点,实现了对重复数据的消除;第二种方法要先对去重后的轨迹分段,再发现各段轨迹中点的频繁序列,以此来填补采样点缺失的轨迹。通过这两种方法,达到了对时空轨迹数据预处理的基本目标,提升了采样频率不稳定和采样点稀疏的轨迹数据的标准化,为后期分析奠定基础。⑵从移动对象运动过程中时空变化的角度出发,以前期研究为依托,提出了可在采样频率不稳定和采样点稀疏的轨迹数据中检测移动对象周期模式的方法。该方法将移动对象的时间和空间特性相分离,并单独处理。对于轨迹数据的空间特性:本文利用基于密度的聚类算法发现移动对象活动的热门区域;对于轨迹数据的时间特性:以热点区域的研究为基础,对各区域内的轨迹点提取其时间属性,构造时间序列,改进现有研究方法,在适合的时间粒度下探索时间序列的潜在周期。通过这种方式,实现了对热点区域访问周期的挖掘。⑶以有效的数据分析和挖掘为主要任务,从实际应用的角度入手,设计实现了一款挖掘时空轨迹数据的软件系统。该系统以中国鸟类观测数据为数据源,实现了本文所提出的三种算法,即特征点选择算法、基于频繁模式的缺失轨迹补全算法和基于热点区域的移动对象周期检测算法;并以百度地图作为展示平台,将研究结果直观的呈现出来。实验结果显示本文所提出的所有方法对采样频率不稳定和轨迹点稀疏的轨迹数据均具有良好的效果。