论文部分内容阅读
二十一世纪,在世界经济全球化的大趋势下,海洋形势在各方面都发生着巨大的变化,海洋航运在国际贸易中扮演着重要的角色。航迹数据作为海洋大数据的重要组成部分,主要记录了海上移动对象的活动轨迹、状态、规律等重要信息,而航迹数据本身所具有的体积大、冗余度高、价值密度低且分布不均等特点,加强了航迹的优化处理在航迹信息挖掘与应用过程中的必要性。而航迹分类是在航迹优化的基础上对航迹信息挖掘的进一步应用,相关研究在科学考察、海上交通安全等领域均有重要的研究价值,成为近几年的热点研究对象。航迹数据本身带有的特点,会降低航迹分类准确率,增加计算成本,为了得到标准、连续、有效的航迹数据,需要对原始航迹数据进行清洗及优化,本文中提出一种基于语义分析的航迹优化,首先利用均值滤波结合船舶航行过程中的速度及时间等信息进行噪点检测,并应用语义信息所在的空间位置代替噪声数据的空间位置信息,实现语义校正,减少因剔除噪声数据导致的数据缺失。航迹数据周期较长,数据量大,为了节约计算成本,需要对航迹进行分段,本文提出一种基于停留区检测的分段方法,主要通过设置端点距离阈值与实际端点间距离进行比较得到数据密集区的起点与终点,并对起点与终点的时间间隔与最小密集区的时间间隔进行对比,得到停留区集合。为了验证此分段方法的正确性,本文提出一种基于最短端点距的空间语义验证航迹分段算法正确性,主要通过测量端点经过某一区域时端点距是否在可接受阈值内为最小。最后为了验证此优化算法的效果,通过实际数据进行航迹优化实验,经过去噪、分段、压缩处理,最终实现航迹的优化。数据分类是数据挖掘的一个常用且有效的分析工具,而航迹分类可以对未知航迹进行标识,为航迹的实际应用提供有效的数据基础。现有的航迹分类主要利用航迹的空间或时间等信息来实现分类,但未考虑航迹的其他信息,如航速、航向等,或忽略了特征之间的关联,导致分类准确性不高、时间效率低等问题。本文针对以上问题,提出了一种基于主成分分析的支持向量机算法(Support Vector Machine,SVM)来实现航迹分类。首先,在航迹优化的基础上,提取航迹的重要航迹点,提高航迹信息密度,对航迹数据的五个要素:速度、加速度、曲率、转角、方向分别进行统计信息提取,得到65个航迹特征,为了提高分类准确率和运算效率,对65个特征进行主成分分析(Principal Component Analysis,PCA),提取出39个主特征,降低了多余分类特征对于分类准确率的影响,提高了模型运算的时间效率。最后,通过SVM分类算法实现航迹分类,得到较好的分类结果,证明本文方法的有效性。为了验证增加主成分分析后的算法优势,将其与无主成分分析的SVM算法进行比较,最终验证在分类准确度与时间效率两个方面均高于无主成分分析的SVM算法。最后通过与基于密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法在航迹几何特征、动态时间归整(Dynamic Time Warping,DTW)形态对比、统计特征三个方面总结出本文采用算法的有效性。