论文部分内容阅读
随着定位技术及通信技术的发展,各类应用设备能够采集到大量移动对象的轨迹数据,从轨迹数据中挖掘移动对象活动规律及模式已经引起越来越多的关注。针对单一时间粒度下时空频繁轨迹中蕴含群体活动规律语义信息挖掘不充分的问题,本文提出一种多维时间粒度下时空频繁轨迹模式挖掘的方法。本文主要研究内容如下:1.识别多维时间粒度下时空停留区域是实现多维时间粒度下时空频繁区域及频繁轨迹模式挖掘的前提。因此,本文提出一种多维时间粒度下时空停留区域挖掘方法MTG_SR。首先,划分时间粒度层次;其次,进行数据预处理,去除不相关及冗余的轨迹数据;最后,采用滑动时间窗与自适应停留区域识别方法相结合的策略挖掘多维时间粒度下的时空停留区域。2.针对基于网格方法识别时空频繁区域产生硬边界的问题,结合滑动时间窗策略挖掘频繁区域时难以识别包含频繁区域较多的时间区间问题,以及单一时间粒度下时空频繁区域中蕴含移动对象活动规律语义信息挖掘不充分的问题,本文提出一种多维时间粒度下时空频繁区域挖掘方法MTG_FR。首先,为避免采用基于网格方法识别时空频繁区域产生硬边界的问题,提出基于集合论思想识别多维时间粒度下时空频繁区域的方法;其次,提出基于高斯混合模型的自适应时间区间选择方法,确定包含频繁区域较多的时间区间,解决采用滑动时间窗策略由于滑动起点及窗口大小设置不合适导致真正包含频繁区域数目较多的时间区间被分割的问题;最后,对多维时间粒度下自适应时间内的频繁区域进行可视化分析,挖掘出移动对象活动规律。实验表明,相比单一时间粒度下时空频繁区域挖掘,本方法能够自适应更加充分地挖掘出随时间变化移动对象活动规律的变化情况。3.针对单一时间粒度下难以充分挖掘出时空频繁轨迹中蕴含群体移动模式语义信息的问题,本文提出一种多维时间粒度下时空频繁轨迹模式挖掘方法MTG_FTP。首先,基于经典的序列模式挖掘方法GSP和Prefix Span,本文提出多维时间粒度下频繁轨迹模式挖掘方法MTG_GSP和MTG_Prefix Span,识别多维时间粒度下频繁轨迹模式;其次,采用本文所提自适应时间区间确定方法,基于高斯混合模型的置信区间选取包含频繁轨迹模式较多的时间区间;最后,将识别出的频繁轨迹模式可视化分析,挖掘出蕴含的群体移动模式语义信息。实验表明,相比单一时间粒度下频繁轨迹模式挖掘,本方法能够自适应更加全面地挖掘出随时间变化群体移动模式的变化情况。