论文部分内容阅读
为了解决AIS(Automatic Identification System)轨迹数据在海事监管应用领域中的工程适用性问题,本文以“基于AIS数据和循环神经网络的船舶轨迹异常检测”为选题,探索以AIS轨迹数据驱动的异常检测新方法,期望能够提升海事监管能力,保障船舶航行安全,为数据科学在海事领域的工程应用提供研究支持。本文分别针对AIS轨迹数据质量管理、船舶轨迹相似性度量、船舶轨迹密度聚类和船舶轨迹异常检测4个方面进行了深入研究,采用“数据预处理”+“正常模型提取”+“基于正常模型的异常检测”的技术路线。即从原始AIS轨迹数据清洗入手,基于船舶轨迹数据密度聚类提取水域内的正常船舶轨迹模型,再根据经正常模型训练的神经网络实现异常检测。目的是提出一套考虑AIS轨迹数据在水上交通情景中的特点和工程应用需求的船舶轨迹异常检测方法,力求将水域内历史轨迹数据蕴藏的价值信息挖掘出来,并用以提升海事监管实践。本文首先针对原始AIS轨迹数据中存在异常现象的问题,以及缺乏对AIS轨迹质量系统性考虑的问题,通过对大量实船AIS轨迹数据的观察、处理及分析,总结了一套包括物理整体性、空间逻辑整体性及时间准确性在内的AIS轨迹数据质量维度体系,并且针对空间轨迹数据错误提出了一种通用性的轨迹数据清洗方法,针对记录时间准确性提出了利用生成时间来修正记录时间的处理方法。轨迹相似性度量和密度聚类算法参数确定是船舶轨迹正常模型提取的重要步骤。轨迹相似性度量方面,本文考虑AIS船舶轨迹的时序不对称性,针对DTW(Dynamic Time Warping)距离在度量时缺乏对水上交通情景因素的考虑,提出了考虑船舶轨迹局部趋势特征以及船舶运动位移信息的改进方法。DBSCAN密度聚类算法(Density-Based Spatial Clustering of Applicationswith Noise)的参数确定方面,本文考虑船舶轨迹数据量大、分布复杂和维度高的特点,提出了一种基于统计学的参数确定方法。该方法具有简便高效、人为干预少、易于工程应用的优点。在轨迹异常识别的实现中,本文考虑正常模型里低质量轨迹数据对准确性的影响、过多的人工参数设置对实现效率的影响,提出一种结合密度聚类和循环神经网络的船舶轨迹异常检测方法,将异常识别转化为简捷的地理距离判断,避免了复杂的参数设置。同时该应用方法具有检测精度高,对正常模型内不良船舶轨迹不敏感的优点。同时,本文基于宁波舟山港区水域2015年1月份的AIS实船轨迹数据,进行了上述方法的验证实验,实验结果显示该研究能够提升AIS船舶轨迹数据的质量,获得清晰有效的船舶轨迹正常模型,并准确及时地识别出异常船舶轨迹。该研究对提高海事监管能力、保障船舶海上航行安全具有现实意义,为数据科学在海事领域中的工程应用提供了重要理论基础。