论文部分内容阅读
随着5G时代的来临与物联网行业的兴起,海量数据蜂拥而至,船舶自动识别系统(Automatic Identification System,AIS)的数据量也与日俱增。同时伴随一带一路发展战略,繁杂的数据为海洋监管提出了更多的挑战。加之海上环境复杂,存在各种风险与隐患,船舶航行安全成为亟待解决的问题。因此,船舶在第一时间发现行为异常时,并及时报警,就能大大降低异常行为的危害性,保证航行安全。在当前大型船舶数量快速增长的情况下,异常识别,不仅对于船舶驾驶人员,船舶航运监管人员,甚至整个航运业来说,都是非常现实的问题。如何解决这些问题,AIS数据应运而生。本文针对北部湾海域的特点,以现有AIS数据为基础,应用数据挖掘技术来识别异常船舶。研究内容及创新点如下:1)研究了多状态参数的机器学习方法,从船舶轨迹点的经纬度位置、对地航向、对地航速考虑,通过对船舶多特征提取,建立约束模型。将改进带噪声的基于密度的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN),结合孤立森林(Isolation Forest,i Forest)算法得到船舶正常分布规律下的异常点(离群点)。2)提出了一种多船舶环境下,船舶异常行为识别分析的方法。已经提出并实施的大多数识别检测算法采取的是单一船舶轨迹点的连线识别,即单船的运动行为建模,没有充分考虑多船及船舶间相互作用下的状态分布。实际航行中,为了避免碰撞、横越等行为,船舶间位置及分布状态存在一定规律。本文核心是将船舶视为一个质点,然后对船舶集体状态分布及行为进行异常点检测,不需构建复杂的模型,结合孤立森林算法,优先将异常点筛出。将实验引入北部湾海域,分析多船状态分布,完成异常检测。3)研究改进DBSCAN算法。针对DBSCASN对于密度不均匀、聚类间距大时,聚类效果差,参数Eps选取困难的情况,将AIS数据内部经纬度关系,使用其平均距离构造可调阈值对参数选取进行改进,通过数据驱动获取该参数。改进后,对船舶位置(经纬度)和速度航向等特征分别聚类,借此发现位置异常及航速异常的船舶。在北部湾AIS数据集中,验证了改进型DBSCAN算法的效果。4)结合地理领域知识,分析实验中的异常点。并从港口及周边锚地分布考虑北部湾区域的特点,重点对沿岸的高航速区域及陆地船舶点识别,在机器学习的可解释性下验证了实验在北部湾海域的可行性及有效性。5)依托广西重大项目“北部湾智能船联网关键技术研究和应用示范”对异常定义的标签,验证检测效果。对于大部分异常点的检测,精确率达到91.73%,与其他主流异常点检测算法相比指标较好,对于船舶异常点(离群点)及船速异常的检测效果显著。本文目的是通过AIS数据的分析,感知海上交通态势以及识别异常船舶,使得海事部门及船舶公司尽早发现异常,及时预警,快速排查问题船舶。将改进DBSCAN和i Forest算法相结合,在北部湾海域,通过船舶航运状态分布就能快速识别异常。该方法化繁为简,参数调节少,各项评价指标高,鲁棒性较好。