论文部分内容阅读
随着GPS设备、传感网络以及RFID等技术日臻成熟以及定位设备的广泛的使用产生了大量的轨迹数据,轨迹数据表现为定位设备所产生的大规模数据流。有效地对数据流形式出现的轨迹进行分析处理,可以发掘出轨迹数据中潜藏的异常现象,从而服务城市规划、交通管理、气象监测等应用。本文研究的对象是移动对象的轨迹数据,在全面分析了国内外对轨迹数据的相关研究后,针对轨迹数据的聚类分析和轨迹的异常检测进行了研究,在此基础上提出了基于加权多特征轨迹聚类方法和基于轨迹信息熵分布的异常轨迹检测方法,并对其进行了理论和实验两个方面的论证和分析。研究的工作主要包括以下两个方面: (1)针对轨迹聚类分析过分追求提高效率而忽略了轨迹的运动特征信息的问题。提出了基于加权多特征轨迹聚类方法,该方法提取了轨迹运动特征信息,在传统的轨迹间距离度量方式基础上加以改进,引入加权多特征距离作为轨迹间相似度的度量,能够从更全面的多角度分析轨迹的运动特点,从而得到更好的聚类效果,进而得到更佳的代表性轨迹为异常检测中信息熵计算提供依据。 (2)针对异常轨迹检测多特征检测效率低以及异常阈值参数选择敏感的问题。提出了基于轨迹信息熵分布的异常轨迹检测方法,该方法利用信息熵度量不确定数据方面的特点,在异常检测中引入轨迹信息熵的概念,以基于加权多特征轨迹聚类方法后得到的代表性轨迹计算轨迹信息熵,通过比较轨迹信息大小以及分布特点,并结合异常数据检测的“kσ”准则确定异常轨迹阈值,进而提高了异常轨迹检测的效果。 验证试验表明:通过在大西洋飓风样本数据中验证,本文提出的基于加权多特征聚类算法具有更好的聚类效果,进而得到每个类簇更佳的代表性轨迹。基于轨迹信息熵分布的异常轨迹检测方法不仅仅能检测出除了形状异常的轨迹,还能够发掘出轨迹其他特征存在异常的隐藏的异常轨迹,有效解决了多特征检测效率低的问题,提高了异常检测效果。