论文部分内容阅读
随着移动网络的快速发展,移动数据的获取更加容易。相比于GPS数据,移动数据具有覆盖用户量大,时间跨度较长,数据集易于扩展等优点,因此本文基于运营商提供的移动网络数据结合地理信息对游客行为模式进行挖掘。本文在游客分类及团体游客识别方面做了大量工作,设计了区分游客群体的方法并对游客特征进行了提取和可视化。本文的创新点和主要工作体现在以下几个方面:1.设计与实现游客层次分类框架。该框架包括数据处理与数据分析模块,数据处理部分借鉴了决策树的分类方法,设计了一种无监督学习的层次分类树,通过层次分类的思想使用轨迹时空特征逐层对游客进行分类;2.提出基于相似度的团体识别算法。该算法引入了游客相似向量的概念,其主要适用于低精度数据集上的团体识别。在轨迹相似度计算的过程中设计了基于质心距离的相似度计算方法来解决低精度数据下,轨迹相似度计算误差较大的问题;3.设计城际交通模式识别的方法,通过轨迹特征提取和轨迹聚类的方法将游客轨迹与地图匹配得到识别结果,并分析了团体游客交通方式偏好,从侧面验证了团体识别算法的准确度。本文使用的方法在已有的轨迹数据挖掘方法上,通过游客层次分类、游客团体识别等方法对游客群体进行区分,得到的不同游客群体行为分析结果对于旅游行业有着参考价值。