基于AIS数据的轨迹段聚类方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:hong2007quan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着世界各国间的贸易量增长以及水路运输行业的迅速发展,各类船舶的数量日益增长。有关船舶自动识别系统(Automatic Identification System,AIS)数据挖掘领域的各类研究也呈现出活跃的趋势,对AIS数据进行数据挖掘分析,可以得出大量水路运输的数据特征。同时,数据挖掘分析的准确性与数据源的数据质量关系密切,合理设计数据质量评价方法获取高质量的数据,才能挖掘出更加准确的数据特征。本文在数据质量评价理论与数据挖掘理论的基础上,使用Python语言搭建相应的算法模型。采取了理论研究与实验分析结合的方法,重点研究了基于AIS数据的数据质量评价方法与轨迹聚类方法,主要工作如下:1)为了给后续的数据挖掘研究提供更优质的数据,并且弥补AIS数据缺少一项针对AIS数据应用特性的数据质量评价方法的不足。设计并提出了基于数据处理的船舶数据质量评价方法。通过研究AIS数据应用的场景,确立完整性、连续性、时效性三项数据质量评价指标;通过对AIS数据进行数据处理与数据分析,构建数据质量评价模型,大量分析数据发现数据问题,为后续的轨迹聚类研究提供优质数据。2)为了验证所提基于数据处理的船舶数据质量评价方法的准确性,使用数据质量评价模型分别处理卫星AIS数据与岸基AIS数据,通过分析对比这两类数据的综合质量评分以及数据可视化结果来验证本文所提出的数据质量评价方法的准确性。3)为了解决传统轨迹聚类模型的轨迹相似度度量算法以及典型提取轨迹算法中存在的弊端。设计并提出了基于曲线长度(Curve Length,CL)距离的船舶轨迹段聚类模型。通过寻找航向变化率和航速变化率特征点,压缩与划分轨迹段;研究了当前常用轨迹相似度度量的缺陷并改进了传统轨迹间相似度度量算法,不仅体现了轨迹相似度度量的内部连通性,还提高了运算效率;搭建了轨迹段聚类模型并完成聚类分析;改进了传统典型轨迹提取算法,使得典型轨迹包含更完善的簇内特征。4)为了验证所提基于曲线长度距离的船舶轨迹段聚类方法的准确性与优越性,以长江入海口的一处分叉航线作为实验区域。通过对比电子海图规定航道与该算法的聚类结果以验证其准确性,通过对比该算法与当前常用算法的聚类效果和执行效率以验证其优越性。
其他文献
得益于互联网和大数据等技术的快速发展,蕴含在社交网络中的海量数据可以给社会的生产生活带来巨大的价值,但在社交网络的数据发布和数据挖掘过程中可能会引发隐私泄露的问题。因此,如何做到在不泄露社交网络隐私信息前提下,进行安全有效且有价值的数据发布和数据挖掘是当前一个研究热点。差分隐私作为一种重要且有效的隐私保护方法,目前已被应用在社交网络隐私保护。本文针对社交网络隐私保护和差分隐私方法的结合展开相应研究
忆阻器是具有记忆功能的非线性元件,利用忆阻器能构造高复杂度和多稳态特性的混沌系统,从而产生更加复杂的动力学行为,相应的也提升混沌信号在图像加密以及保密通信领域中的应用价值。近年来,越来越多的隐藏混沌吸引子被发现,与一般的混沌系统相比,隐藏混沌振荡更具有隐蔽性,更适合于图像加密。因此设计基于忆阻的隐藏混沌系统是一个很有意义的研究课题。本文在对隐藏混沌系统、忆阻隐藏混沌系统和条件对称混沌系统的研究基础
随着物联网技术的广泛应用,物联网的数据量爆发式地增长,随之而来的物联网数据管理问题也愈发明显。现有的物联网数据异构程度高,数据互用性差,数据隐私安全难以保证,这些都导致了物联网的数据价值难以被挖掘。区块链去中心化,零信任的架构颠覆了传统的中心化系统架构,已广泛运用到各个领域。区块链对物联网是一个完美的补充,可以提高物联网的隐私安全、通用性和可靠性。本文结合区块链对物联网数据管理与应用展开研究,并提
建筑能耗的准确预测对于建筑设计之初或建筑改造过程中的节能设计具有重要的意义,建筑室内微气象环境监测对于人们健康生活和工作至关重要,同时对于后期对建筑能耗进一步预测意义非凡。本文从对建筑能耗影响较大的温度参数入手,通过仿真和算法建立整栋建筑的能耗预测模型,最后搭建实物测试平台验证预测模型的准确性。为了对建筑能耗进行较为准确的预测,本文设计了一种基于计算流体动力学(Computational Flui
风是一种由空气流动引起的自然现象,它与人类的日常生活息息相关,并时刻影响着人类的生活质量。随着我国城市化进程的加快,为了适应快速增长的人口,城市内建筑群不断涌现,建筑群风环境已成为影响人类生活质量与安全的重要因素。如果建筑群内的风速过小,就会面临导致通风不良、污染物难以扩散等问题;但如果风速过大,则很有可能危及行人安全或导致建筑结构受到破坏,遭受巨大损失。因此充分了解不同类型的建筑群在大风条件下的
本文就国内外长江冲淡水研究的历史和现状进行回顾,发现长江冲淡水的扩展受到许多因素的影响,主导因素尚不明确,而长江口常年遭受台风灾害,关于连续的台风过境对长江冲淡水扩展和转向的影响研究较少。针对以上问题,本文基于FVCOM(An Unstructured Grid,Finite-Volume Coastal Ocean Model)模型建立了较高分辨率的长江口水动力模型,在验证结果较好的基础上,建立
因国家政策提倡和医疗水平的进步,全民健康信息化应用被大力发展与推广,医疗数据呈现蓬勃增长态势。然而,现有医疗设备的存储空间有限,不利于数据的长久保存。为充分发挥医疗数据的使用价值,将医疗数据上载到云端已经成为一种必然趋势,由此催生了“互联网+医疗”的新业态发展,更推动了云辅助远程医疗新模式。然而这种新的数据存储模式也存在众多安全隐患。其中,数据完整性问题作为云存储的核心安全问题一直备受关注,尤其是
为提高对地闪连接过程中多上行先导现象的认识,实现对其三维高精度模拟,本文在已有随机参数化方案基础上,植入多先导始发与发展模块以建立高建筑群多上行先导模型,利用电场并行计算技术提高模拟效率。本文将该模型应用于广州实际高建筑物群的地闪模拟并合理对比统计参数与个例形态,验证了该模型具有一定合理性。为加深对多先导触发机制的研究,基于新模型,本文设置了两组实验探讨地面建筑与下行先导各参数对多先导触发的影响。
随着人工智能和物联网技术的崛起,人们对保护隐私信息的愿景越来越强烈,信息安全已经成为大家越来越关注的问题。作为保证信息安全的重要手段之一,信息隐藏是指在多媒体通信载体中嵌入秘密信息并在公共信道上传输的一种安全通信方式。而图像隐写是信息隐藏的一个重要分支,它把秘密信息隐藏在公开的图像中,实现了秘密信息的隐蔽传输,有效保证了重要数据的机密性和安全性。因此,研究图像隐写技术具有深远的实际意义。然而,目前
针对雷云电场环境下金属尖端电晕放电以及电晕粒子对闪击过程的影响相关问题,本文采取理论与实验室试验相结合的方式,利用雷云电场发生器,在实验室建立类雷云电场环境模型,分析了在背景电场环境下,金属尖端处电晕放电的电场强度阈值以及电晕放电特性;再在前面试验的基础上利用冲击电压发生器,建立实验室模型模拟金属尖端在雷云电场环境下的闪击,分析了金属尖端电晕放电形成的离子背景对雷电冲击电压波的影响。试验表明:(1