面向船舶状态数据的数据清洗与修复方法研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:LeoPark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
船舶状态数据中包含了大量有重要价值的信息,针对船舶状态数据的数据挖掘工作可以为智慧水运的发展做出有力支持。然而这些数据中存在大量的问题数据,在挖掘之前对这些问题数据进行清洗和修复是必不可少的步骤。现有的数据清洗和修复方法如果直接应用到船舶状态数据中,效果并不理想。为保证数据清洗和修复工作的精确性,每一种问题数据都需要制定特定的方法来进行清洗或修复。基于此,本文将重点研究目前船舶状态数据中对数据挖掘工作影响最为严重的两类问题,即重复问题以及轨迹数据的缺失问题。本文的主要研究工作如下:(1)针对现有的相似重复数据检测算法-SNM算法(Sorted-Neighborhood Method,SNM)检测效率低的问题,提出一种改进的滑动窗口策略,然后结合基于Top-K的过滤策略来提高检测效率。改进的滑动窗口策略即滑动窗口大小动态可变策略,窗口大小可以根据检测的情况随时改变,既减少不必要的比较,又减少漏配现象;基于Top-K的过滤策略使不满足条件的数据提前结束比较,大大缩短检测时间。通过对比实验验证了本文的改进算法在检测效率上要优于其他算法。(2)针对由于字段权重设置主观性过强导致SNM算法检测精确度低的问题,提出一种改进的字段权重计算方法。改进方法综合主观经验较强的等级法和客观性的统计法来计算字段的权重,使字段权重的设置更加科学合理,进而有助于提高数据相似度计算的精确度。同时,改进的滑动窗口策略也有助于算法检测精确度的提升。通过对比实验验证了本文的改进算法在查全率,查准率等评价指标上均优于其他算法。(3)针对现有的船舶轨迹缺失数据修复算法修复精确度低的问题,首先解决了由轨迹数据中的错误数据引起的伪连续问题,然后提出一种针对船舶轨迹缺失数据的修复算法。首先构建船舶运动状态矢量模型,将船舶的空间位置与时间联系起来,然后基于多项式插值的思想,构建船舶空间位置的插值函数,充分结合已有的船舶信息来优化参数,以实现对轨迹缺失数据的精确修复。通过对比实验验证了本文的修复算法在修复精确度上要优于其他算法。
其他文献
随着二十一世纪以来,中国经济进入高速发展阶段,我国第二、三产业结构调整加速,服务业占经济总量的比重日益增高,其中以金融业、信息传输、计算机服务和软件业、科研技术服务和租赁商务服务为代表的高端生产性服务业发展尤为突出。广佛大都市生产性服务业体现出特大都市群结合工业环境的城市群产业集群圈层结构,小规模的城市区域圈层配套发展聚集、整合和集群。广佛大都市基本实现从生产要素约束型向产业布局优化的产业转移过渡
执行难的司法痼疾让为数不少的判决成为沉睡的“法律白条”,极大损害了司法权威与社会诚信。党的十八届四中全会提出,要切实解决执行难。2016年3月,最高人民法院提出“用两到三
报纸
配电网网络重构作为一种主动配电网管理策略,实现了配电网的安全、可靠、经济运行。以光伏发电、风力发电等为代表的分布式电源技术,因其经济性、灵活性、高效性和环境友好性
企业文化是一个企业在成长和发展过程中逐渐形成的精神、理念、氛围、制度规范、习惯等,职业学校文化的建设突出创新精神、人文素养和实践精神的观念正与此相符。将优秀的企业
日常英语写作是一种能够正确 运用语言知识,掌握书面表达能力的技能.在小学高年级阶段,要根据学生的实际情况,引导学生进行广泛的积累巧用.通过有趣的指导,提高学生的写作兴
以超临界CO2作为染色介质,用分散蓝79对聚乳酸纤维染色,研究了染色温度、压力和时间对聚乳酸纤维染色性能和强力的影响。试验结果表明,随着温度的升高,织物上的染料得色量明显增
利用双轴精密离心机能产生不同加速度的特点,研究了在不同加速度半径的球面上选取测试点,应用D-最优准则辨识加速度计数学模型参数的方法,能辨识出加速度计数学模型的全部参
实施制造资源计划系统,对企业的各种资源进行统一的计划和控制,使企业的物流、信息流和资金流成为畅通的动态反馈系统.利用实施制造资源计划系统先进管理方法,提高对用户的服
随着科学研究的加大投入,自动控制技术不断应用于工业生产制造领域,对经济发展起到了积极的促进作用。传统配料过程存在配料时间长、精度低、管理混乱复杂、信息交互不通畅等问题。对于有些企业其配方具有很高的商业价值,如果配方无法做到很好的保密,对企业可能造成经济损失。本文以哈尔滨某酒厂委托的自动配料系统项目作为研究对象,根据酿造生产过程与配料指标要求,提供一整套生产解决方案。依据酿造配料生产过程实际情况出发
2016年高考已落下帷幕,全国1卷理科试题21题设计立意鲜明,角度宽,视点多,深入考查了数学理性思维.深化能力立意是数学命题一直以来的追寻目标,本试题真正地体现了"以能力立意