论文部分内容阅读
海洋船舶在生产活动中产生了大量的时空轨迹数据,海量的船载AIS系统时空轨迹数据集合中蕴含着大量的船舶交通行为特征,在进行轨迹信息挖掘时存在诸如海量数据、数据缺失、数据稀疏、数据碎片化以及潜在关联关系难以挖掘等问题,异常轨迹湮没在大量的正常航行轨迹以及噪声数据中,并且由于船舶的位置状态等实时更新,蕴含的丰富的关联关系隐藏在海量行为的碎片化数据中。如何有效检测海量AIS系统异常轨迹,构建准确高效的轨迹异常监测系统,对港口安全规划、海洋交通安全机制等的发展都具有重要的实际指导意义和理论研究价值。针对上述存在的问题,本文取得了以下创新性成果: 一、针对AIS系统时空轨迹数据中存在的如缺乏语义描述,数据缺失、数据冗余等数据质量问题,对AIS数据进行数据预处理,提出了基于时间信息和空间信息的、改进现有的基于相似度的数据预测方法对缺失信息进行预测。通过基于时间感知的历史轨迹和参考轨迹相结合,对缺失数据进行动态性建模,并利用同类型船舶历史轨迹及其他类型船舶的历史轨迹数据进行修正,从而获得更精确的缺失轨迹数据预测结果。 二、针对海量AIS系统时空数据在进行轨迹数据异常检测时存在计算复杂度高,计算开销太大,结果难以确定等问题,提出了一种基于密度偏倚抽样的异常检测算法,该方法在不改变原始轨迹数据信息的情况下同时实现了对海量时空轨迹数据的异常检测。利用变换函数对时空轨迹数据进行降维处理,并通过基于哈希的密度近似估计进一步降低了相似性计算的难度;同时针对不同的应用场景,利用基于密度的异常轨迹检测算法和基于局部距离的异常轨迹检测算法,增强了算法的可扩展性。 三、针对海量AIS系统时空轨迹数据存在的轨迹数据异频采样、数据冗余等数据质量问题以及异常检测时的数据稀疏性、时间周期性和算法冷启动等问题,考虑到船舶航行规律性,提出了改进的轨迹分段压缩算法以解决数据质量问题,已有算法存在缺乏时间信息和空间信息以及易受噪声、数据异质性影响等问题,提出了改进的基于协同过滤的时空轨迹异常检测算法,设置指数衰减函数建模轨迹相似度计算的时间动态性,同时融入不同类型船舶的历史数据以及船舶航行行为进行相似度计算,以解决可能存在的时间周期性和算法冷启动等问题。 四、针对上述处理海量轨迹压缩算法中存在缺少船舶航行状态和航行行为的考虑,以及异常轨迹检测时经验性指数衰减函数失效的情况,提出了一种基于船舶航行特征的轨迹压缩算法,同时和参考轨迹数据相结合,提出了一种改进的基于随机游走模型的时空轨迹异常检测机制来缓解轨迹数据稀疏性对异常检测的影响,在已有稀疏轨迹数据的基础上,为被检测轨迹寻找更多的直接的和潜在的相似轨迹,利用潜在相似轨迹信息获取更为准确的相似度值,从而得到更为精确的异常轨迹检测结果。 五、针对已有的实时轨迹异常检测算法存在时间滞后性的问题,本文提出了一种基于隐马尔可夫模型的实时轨迹异常检测方法,通过对船舶航行状态的基于概率的实时预估,并对超过给定阈值的船舶航行状态进行预警,建立船舶实时监测系统。利用计算得到的历史轨迹数据集中船舶航行状态特征之间的转移概率,通过数据转移概率即船舶航行状态特征之间的相关关系和隐马尔可夫模型得到全局最优,最后通过利用贝叶斯推论完成船舶航行特征预估。